Aller au contenu
Data Analytics, Data Visualization et BI

Talend Open Studio

Talend Open Studio (TOS) est une application libre de type ETL permettant d’effectuer des synchronisations massives d’informations d’une base de données vers une autre. Cette formation vous apprendra à concevoir,…

Avancé
Blended

Description de la formation

Introduction à l’intégration de données

  • Rôle de l’ETL dans les architectures Data
  • Installation, configuration et prise en main de Talend Open Studio (TOS)
  • Création d’un premier job : lecture, transformation et écriture de données
  • Atelier : ingestion de fichiers CSV, nettoyage, écriture dans un entrepôt local

Structuration et paramétrage des jobs

  • Connexions et composants fondamentaux (CSV, XML, Excel, DB, tLogRow)
  • Utilisation des métadonnées partagées (schemas, connexions, tables)
  • Contextes et paramètres externes (variables, fichiers .properties)
  • Atelier : création d’un job multi-étapes avec paramétrage dynamique

Traitement de données relationnelles

  • Connexion aux bases : PostgreSQL, MySQL, SQL Server
  • Opérations : lecture, écriture, mise à jour, suppression
  • Requêtes SQL avec SQLBuilder, gestion des transactions
  • Atelier : chargement automatique de tables, création de règles de filtrage métier

Enrichissement multisource et transformation avancée

  • tMap : jointures, lookups, filtres, splits, conditions complexes
  • Détection de doublons, normalisation, formatage
  • Gestion des flux d’erreur, rejets, qualité de données
  • Atelier : consolidation de fichiers + base pour alimenter un data mart

Orchestration, suivi et supervision

  • Organisation de jobs en sous-jobs (tRunJob)
  • Planification via ligne de commande ou batch
  • Débogage, logs, statistiques, reporting
  • Introduction à tJasperOutput
  • Atelier final : mini-projet de traitement complet (ingestion + transformation + reporting)

Objectifs pédagogiques

  • Concevoir des flux ETL robustes et réutilisables avec Talend Open Studio
  • Intégrer, transformer et qualifier des données provenant de sources variées
  • Automatiser l’enchaînement des traitements avec des jobs paramétrables
  • Optimiser, exécuter et tracer l’activité des processus d’intégration

Programme détaillé

Module 1 Introduction à l’intégration de données
  • Rôle de l’ETL dans les architectures Data
  • Installation, configuration et prise en main de Talend Open Studio (TOS)
  • Création d’un premier job : lecture, transformation et écriture de données
  • Atelier : ingestion de fichiers CSV, nettoyage, écriture dans un entrepôt local
Module 2 Structuration et paramétrage des jobs
  • Connexions et composants fondamentaux (CSV, XML, Excel, DB, tLogRow)
  • Utilisation des métadonnées partagées (schemas, connexions, tables)
  • Contextes et paramètres externes (variables, fichiers .properties)
  • Atelier : création d’un job multi-étapes avec paramétrage dynamique
Module 3 Traitement de données relationnelles
  • Connexion aux bases : PostgreSQL, MySQL, SQL Server
  • Opérations : lecture, écriture, mise à jour, suppression
  • Requêtes SQL avec SQLBuilder, gestion des transactions
  • Atelier : chargement automatique de tables, création de règles de filtrage métier
Module 4 Enrichissement multisource et transformation avancée
  • tMap : jointures, lookups, filtres, splits, conditions complexes
  • Détection de doublons, normalisation, formatage
  • Gestion des flux d’erreur, rejets, qualité de données
  • Atelier : consolidation de fichiers + base pour alimenter un data mart
Module 5 Orchestration, suivi et supervision
  • Organisation de jobs en sous-jobs (tRunJob)
  • Planification via ligne de commande ou batch
  • Débogage, logs, statistiques, reporting
  • Introduction à tJasperOutput
  • Atelier final : mini-projet de traitement complet (ingestion + transformation + reporting)

Prérequis

  • Bonne connaissance des bases de données relationnelles (SQL)
  • Connaissances basiques en programmation (Java est un plus)

Public visé

  • Développeurs, data analysts, consultants BI, intégrateurs de données

Modalités de la formation

  • 📍 Format : Mixte (présentiel + distanciel)
  • 📊 Niveau d'entrée : Avancé
  • 👥 Effectif : 4 à 12 stagiaires (groupe restreint)
  • 🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
  • ♿ Accessibilité : Formations accessibles aux personnes en situation de handicap. Contactez notre référent handicap.