DBT (Data Build Tool) – Transformer vos données avec du SQL versionné
Formation créée le 14/04/2026.
Version du programme : 1
Version du programme : 1
Type de formation
PrésentielDurée de formation
14 heures (2 jours)
Cette formation est gratuite.
S'inscrire
Cette formation est gratuite.
S'inscrire
Cette formation est gratuite.
S'inscrire
DBT (Data Build Tool) – Transformer vos données avec du SQL versionné
Maîtriser DBT pour concevoir, tester et documenter des pipelines de transformation de données robustes, versionnés et industrialisables dans un environnement moderne de type ELT.
Objectifs de la formation
- Comprendre la philosophie DBT et l’approche Analytics Engineering
- Installer et configurer un projet DBT (Core / Cloud)
- Créer et organiser des modèles SQL (models, sources, seeds, snapshots)
- Mettre en place des tests et de la documentation automatisée
- Utiliser Jinja et les macros pour industrialiser les transformations
- Intégrer DBT dans une chaîne CI/CD
- Construire un projet DBT complet sur un entrepôt de données
Profil des bénéficiaires
Pour qui
- Data engineers
- Data analysts
- Analytics engineers
Prérequis
- Bonne maîtrise du SQL
- Connaissance des bases d’un Data Warehouse (Snowflake, BigQuery, Redshift…)
- Notions de Git recommandées
Contenu de la formation
JOUR 1- Module 1 – Introduction à DBT et Analytics Engineering (2h)
- Concepts ELT vs ETL
- Positionnement de DBT dans la Modern Data Stack
- Rôle de l’Analytics Engineer
- Architecture d’un projet DBT
- Activité pratique : Étude de cas Analyse d’un pipeline data existant (ETL classique) Identification des améliorations possibles avec DBT
JOUR 1- Module 2 – Installation et configuration DBT (2h)
- DBT Core vs DBT Cloud
- Installation et setup environnement
- Connexion à un Data Warehouse (Snowflake / BigQuery)
- Initialisation d’un projet DBT
- Activité pratique : Exercice guidé Installation de DBT et création d’un projet Connexion à une base de données et exécution d’un premier modèle
JOUR 1- Module 3 – Models, sources et seeds (3h)
- Création de modèles SQL (models)
- Référencement avec ref() et source()
- Gestion des sources
- Utilisation des seeds (CSV)
- Bonnes pratiques de structuration
- Activité pratique : Cas pratique Création de modèles staging et marts Intégration de données via seeds et construction d’un premier pipeline
JOUR 2- Module 4 – Tests et documentation (2h)
- Tests natifs (not null, unique, relationships)
- Tests personnalisés
- Documentation automatisée
- Génération du site de documentation
- Activité pratique : Exercice Ajout de tests sur un modèle existant Génération et analyse de la documentation DBT
JOUR 2- Module 5 – Jinja, macros et snapshots (2h30)
- Introduction à Jinja
- Création de macros réutilisables
- Paramétrisation des modèles
- Gestion de l’historisation avec snapshots
- Activité pratique : Cas pratique Création d’une macro personnalisée Mise en place d’un snapshot pour historiser les données
JOUR 2- Module 6 – Packages DBT et intégration CI/CD (1h30)
- Utilisation des packages DBT (dbt-utils…)
- Gestion des dépendances
- Intégration avec Git
- Introduction à la CI/CD (GitHub Actions / dbt Cloud)
- Activité pratique : Exercice Installation d’un package DBT Simulation d’un pipeline CI simple (test + run)
JOUR 2- Module 7 – TP final : projet DBT complet (1h)
- Construction d’un pipeline complet
- Mise en place des tests, documentation et macros
- Structuration du projet selon les bonnes pratiques
- Création d’un pipeline de transformation de bout en bout
- Validation avec tests et documentation
Équipe pédagogique
Professionnel expert technique et pédagogique.