Intgration de donnes ETL Talend Open Studio Sminaire

  • Slides: 10
Download presentation
Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

Plan • Intégration de données – Définition – Pourquoi ? – Les outils. •

Plan • Intégration de données – Définition – Pourquoi ? – Les outils. • L’ETL TOS : – Qu’est-ce ? – Pourquoi ? • Travaux dirigés – Découverte 9 Octobre 2009

Intégration de données • Définition – Ensemble des processus par lesquels les données provenant

Intégration de données • Définition – Ensemble des processus par lesquels les données provenant de différentes parties du système d'information sont déplacées, combinées et consolidées. – Ces processus consistent habituellement à extraire des données de différentes sources (bases de données, fichiers, applications, Services Web, emails, etc. ), à leur appliquer des transformations (jointures, lookups, déduplication, calculs, etc. ), et à envoyer les données résultantes vers les systèmes cibles 9 Octobre 2009

Intégration de données • Pourquoi ? – Synchronisation de différents SI : • Alimentation

Intégration de données • Pourquoi ? – Synchronisation de différents SI : • Alimentation de bases par des fichiers à plat • Alimentation d’entrepôts de données. • Systèmes répliqués. – Migration de S. I 9 Octobre 2009

Intégration de données • Outils – Développement spécifiques (moulinettes) • Difficulté de maintenance. •

Intégration de données • Outils – Développement spécifiques (moulinettes) • Difficulté de maintenance. • Manque de cohérence. • Peu de documentation. – Outils dédiés (ETL : Extract – Transform – Load) • Facilité de maintenance. • Meilleure productivité. 9 Octobre 2009

ETL TOS Qu’est-ce que c’est ? – Atelier de développement : • Une interface

ETL TOS Qu’est-ce que c’est ? – Atelier de développement : • Une interface graphique • Des composants spécialisés (plusieurs centaines) prêt à l’emploi. • Facilité de documentation – Générateur de programme (Java et Perl) – Basé sur Eclipse : • Multiplateforme 9 Octobre 2009

ETL TOS Pourquoi ? – Solution libre dans la version de base : –

ETL TOS Pourquoi ? – Solution libre dans la version de base : – Communauté grandissante. – Une démarche non isolée (URGI – ISIE – DSI …) – Un outil accessible même aux non informaticiens 9 Octobre 2009

Travaux dirigés TD 1 : Alimentation fichier CSV – Création d’un Job – Création

Travaux dirigés TD 1 : Alimentation fichier CSV – Création d’un Job – Création d’un schéma (métadonnées) – Création / Liaison / Configuration de composants – Exécution du job – Génération du programme indépendant – Génération de la documentation 9 Octobre 2009

Travaux dirigés TD 1 : Scénario Tableau enrichi 9 Octobre 2009

Travaux dirigés TD 1 : Scénario Tableau enrichi 9 Octobre 2009

Fin • Intégration de données – – – Définition Pourquoi ? Les outils. •

Fin • Intégration de données – – – Définition Pourquoi ? Les outils. • L’ETL TOS : – Qu’est-ce ? – Pourquoi ? • Travaux dirigés – Découverte 9 Octobre 2009 Merci de votre attention