Aller au contenu
Data : bases de données, SGBD

Créer des pipelines de données avec Talend / dbt / Airflow

Cette formation permet de comprendre les enjeux du data engineering moderne à travers la création et l’orchestration de pipelines de données. En s’appuyant sur des outils comme Talend, dbt et…

Intermédiaire
Blended

Description de la formation

Jour 1 – Fondamentaux des pipelines de données

  • Concepts ETL vs ELT, data lineage, data mesh
  • Talend Open Studio : interface, connecteurs, jobs simples
  • Atelier : pipeline d’ingestion avec Talend (fichier → base)

Jour 2 – Transformation avec dbt (data build tool)

  • Architecture dbt, modèles, documentation et tests
  • Versionnage de modèles, modularisation, gestion des dépendances
  • Atelier : création de transformations SQL versionnées avec dbt

Jour 3 – Orchestration avec Apache Airflow

  • DAGs, opérateurs, planification et exécution
  • Monitoring des tâches, alertes, logs
  • Atelier final : orchestrer un pipeline complet Talend + dbt via Airflow

Objectifs pédagogiques

  • Créer des flux ETL avec Talend et dbt
  • Automatiser l’orchestration de pipelines avec Apache Airflow
  • Comprendre les bonnes pratiques du data engineering moderne
  • Mettre en œuvre des transformations de données fiables, testables et versionnées

Programme détaillé

Module 1 Jour 1 – Fondamentaux des pipelines de données
  • Concepts ETL vs ELT, data lineage, data mesh
  • Talend Open Studio : interface, connecteurs, jobs simples
  • Atelier : pipeline d’ingestion avec Talend (fichier → base)
Module 2 Jour 2 – Transformation avec dbt (data build tool)
  • Architecture dbt, modèles, documentation et tests
  • Versionnage de modèles, modularisation, gestion des dépendances
  • Atelier : création de transformations SQL versionnées avec dbt
Module 3 Jour 3 – Orchestration avec Apache Airflow
  • DAGs, opérateurs, planification et exécution
  • Monitoring des tâches, alertes, logs
  • Atelier final : orchestrer un pipeline complet Talend + dbt via Airflow

Prérequis

  • Connaissances en bases de données, SQL, et principes fondamentaux de l’ETL/ELT. Aisance avec un environnement technique (ligne de commande, scripts).

Public visé

  • Data engineers, développeurs, analystes ou architectes impliqués dans la transformation, l’intégration et l’automatisation des flux de données.

Modalités de la formation

  • 📍 Format : Mixte (présentiel + distanciel)
  • 📊 Niveau d'entrée : Intermédiaire
  • 👥 Effectif : 4 à 12 stagiaires (groupe restreint)
  • 🎯 Pédagogie : Apports théoriques, exercices pratiques, études de cas, projet fil rouge
  • ♿ Accessibilité : Formations accessibles aux personnes en situation de handicap. Contactez notre référent handicap.