|
June 27, 2010 - Advice and Strategy > Information Technology
Traitement et consolidation de données sans se ruiner: Open Source ETL! La masse d'information disponible au sein d'une entreprise peut souvent devenir un cauchemar à gérer lorsque différents systèmes sont en place. Plateforme ERP, panoplie de fichiers Excel créés par des employés, base de données Access, entrepôt de données ou autres, il est fréquent de nos jours de devoir accéder à de l'information provenant de multiples sources différentes. Depuis quelques années, plusieurs produits ETL (Extraction/Transformation & Load) ont été créés afin de répondre aux besoins grandissant des entreprises. Ces solutions ont énormément évolué au fil des ans et répondent très bien aux besoins, chaque suite ayant ses forces et ses faiblesses. Petit bijou du milieu ETL, le logiciel libre Pentaho Data Integration n'a pas à se cacher derrière les grands de ce monde (Datastage, Oracle, Microsoft, Cognos/IBM etc..). La version disponible pour la communauté sous licence GNU permet d'effectuer des extractions et du traitement à tout type de niveau, sans aucune limitation. Le logiciel contient une palette impressionnante d'outils avec lesquels travailler et advenant le besoin d'une fonctionnalité bien précise non disponible dans les outils actuels, il est alors possible d'effectuer le tout via du simple code java script, ce qui rend donc les possibilités pratiquement illimitées. Avec plus de 50 sources de données possible (Fichier texte, Microsoft Excel, presque tous les types de base de données, OLAP, XML, LDAP, Salesforce etc…), il est possible d'extraire des données à partir de pratiquement n'importe quelle source. Une nouveauté dans la version 4.0 disponible depuis mai/juin 2010 est la possibilité d'exécuter des fonctions SAP (BAPI). Malheureusement, la complexité parfois de ces dernières n'est pas encore supportée par l'outil. Personnellement, je persiste donc pour l'instant à extraire des données directement à partir des tables d'un environnement SAP par le biais d'une source de données de type Oracle (ou autre type de base de données selon l'environnement) en attendant que Pentaho peaufine cette nouvelle fonctionnalité. Un des avantages par rapport aux solutions commerciales telles qu'Integration Services (SSIS) de Microsoft (sans vouloir dénigrer le produit qui est soit dit en passant très bon) réside dans le fait de pouvoir mettre à jour la version facilement sans impacter l'environnement dans son intégralité. En conclusion, à l'aide d'un outil comme Pentaho Data Integration, une base de données MySQL ou autre du milieu logiciel libre, il n'y a plus raison de croire qu'il est impératif de débourser une petite fortune afin de mettre en place un entrepôt de données, sans compter le nombre de générateur de rapports et portails web du monde libre également (autre aspect couvert d'ailleurs par Pentaho). Alors si l'aventure vous intéresse, n'hésitez pas à me contacter et il me fera plaisir de vous guider dans l'utilisation de ce produit! |
|
|