Dans
un marché qui se concentre inexorablement, les ETL se fondent au sein d'offres
plus globales d'intégration de données. Nature et nombre de connecteurs
demeurent des critères essentiels. Tour d'horizon des principales offres.
Afin
de les aider à traiter efficacement leurs milliers de données et
à leur conférer le statut d'information, les entreprises
peuvent faire appel à des outils d'ETL (Extract Transform and Load).
Leurs missions ? Extraire les données métiers présentes dans
les multiples sources et bases de données de l'entreprise, les rendre
cohérentes et exploitables, puis les charger dans un entrepôt de
données (datawarehouse).
"Les ETL se répartissent
en trois catégories, qui, selon leur mode de fonctionnement, auront un
impact plus ou moins fort sur l'architecture du SI : celle à base de moteur,
où les traitements sont pris en charge par un exécutable unique appelé moteur
(IBM, Informatica, Microsoft
). Une autre catégorie construite sur un
générateur, où les traitements peuvent nécessiter une étape de compilation
(Talend
), et une dernière d'outils, intégrée aux Systèmes
de Gestion de Bases de Données (Oracle
)", précise Marc
Parmentier, consultant business intelligence chez SQLI.
Les
critères de choix | 1 | Principales
briques fonctionnelles | 2 | Extraction
des données et type d'architecture |
3 |
Connecteurs
PGI natifs
|
"En s'ouvrant à l'intégration de données,
les offres d'ETL se voient rajouter des fonctionnalités complémentaires
comme la gestion de la qualité, d'audit, voire des couches de Web Services",
fait savoir Bertrand Garnier, responsable de la coordination des outils d'intégration
de données au sein de Micropole Univers. Parmi les autres briques se devant
d'être présentes, citons notamment la gestion centralisée
des metadonnées et l'administration des scénarios d'alimentation.
"Plusieurs autres critères de pondération de choix d'outils doivent également
être pris en compte comme la maintenabilité de la solution, la robustesse
de son moteur, ou encore sa capacité d'interfaçage avec les données externes",
poursuit Bertrand Garnier. L'un des aspects à ne pas sous-estimer dans
le choix de sa solution d'ETL est son mode de fonctionnement : orientée
services (traitement synchrone des données), évènements
(EOA) ou bien - et de plus en plus souvent - en mode batch, temps réel.
Dernier
critère de choix utile à considérer : la variété
des connecteurs présents en natif avec l'offre d'ETL, et notamment ceux
qui sont dédiés aux PGI (Progiciels de Gestion Intégrée).
Dans un contexte où le parc d'applicatifs métiers est hétérogène,
faire appel à un ETL disposant nativement d'un grand nombre de connecteurs
peut être gage de simplicité et éviter de possibles
- mais toujours coûteux - développements complémentaires. |