RAG (Retrieval-Augmented Generation) — Concevoir un assistant IA fiable connecté à vos données internes
Version du programme : 1
Type de formation
PrésentielDurée de formation
21 heures (3 jours)RAG (Retrieval-Augmented Generation) — Concevoir un assistant IA fiable connecté à vos données internes
Cette formation permet à des professionnels techniques de concevoir un système RAG capable d’interroger un corpus documentaire interne et de produire des réponses contextualisées, traçables et plus fiables qu’un LLM utilisé seul. Elle combine compréhension architecturale, choix technologiques, mise en œuvre pratique et évaluation, avec une logique directement exploitable dans des contextes d’entreprise : documentation technique, support interne, procédures qualité, base RH ou référentiels métier. Les approches retenues sont cohérentes avec les bonnes pratiques actuelles du marché, où la qualité des données, le chunking, le retrieval et l’évaluation conditionnent la performance réelle d’un projet RAG
Objectifs de la formation
- Comprendre les principes, bénéfices et limites d’une architecture RAG dans un contexte d’entreprise.
- Concevoir une chaîne complète d’ingestion, de vectorisation, d’indexation, de retrieval et de génération.
- Comparer plusieurs stratégies de choix de modèles selon les contraintes de coût, de confidentialité, de performance et d’architecture.
- Mettre en œuvre une base vectorielle adaptée au besoin métier et au système d’information existant.
- Optimiser le chunking, l’indexation et les stratégies de recherche pour améliorer la pertinence des réponses.
- Évaluer la qualité d’un système RAG avec des indicateurs dédiés, notamment la faithfulness et la relevancy.
- Définir les conditions de déploiement d’un RAG exploitable, maintenable et gouverné en environnement professionnel.
Profil des bénéficiaires
- Data engineers
- Développeurs backend ou full stack
- Architectes SI
- AI engineers / ML engineers
- Lead developers et responsables techniques impliqués dans des projets d’IA générative
- Responsables innovation ou data disposant d’une base technique solide
- Maîtriser les bases du développement en Python
- Comprendre les principes des API, du traitement de données et des architectures applicatives
- Disposer de notions de NLP, de machine learning ou d’IA générative
- Être à l’aise avec l’utilisation d’un environnement de développement et de notebooks
Contenu de la formation
Partie 1 — Positionner le RAG dans une architecture d’IA générative d’entreprise (Jour 1- 3h00)
- Situer le RAG dans l’écosystème de l’IA générative
- Comprendre les composants d’une architecture RAG
- Identifier les enjeux de cadrage en entreprise
- Activité pratique : étude de cadrage d’un cas métier (Analyser un besoin type grand compte : assistant interne sur procédures qualité, documentation technique ou support IT. Définir le périmètre fonctionnel, les sources documentaires, les utilisateurs visés et les critères d’acceptation du futur système)
Partie 2 — Choisir les modèles, embeddings et briques techniques (Jour 1- 4h00)
- Comparer les familles de modèles mobilisables dans un projet RAG
- Comprendre le rôle des embeddings
- Étudier les principales options de stockage vectoriel
- Définir des critères de choix techniques réalistes
- Activité pratique : atelier d’aide à la décision technique (Comparer plusieurs combinaisons modèle + embeddings + base vectorielle à partir d’un cahier des charges type. Produire une recommandation argumentée d’architecture adaptée à un contexte entreprise.)
Partie 3 — Préparer les données : chunking, enrichissement et indexation (Jour 2- 3h00)
- Préparer un corpus documentaire pour le RAG
- Concevoir une stratégie de chunking pertinente
- Indexer un corpus de manière exploitable
- Activité pratique : atelier d’optimisation du corpus (Tester plusieurs stratégies de chunking sur un même corpus documentaire métier. Mesurer les écarts de qualité de récupération selon la structure retenue et ajuster les métadonnées)
Partie 4 — Construire la chaîne complète : ingestion, retrieval et génération (Jour 2- 4h00)
- Assembler un pipeline RAG de bout en bout
- Mettre en œuvre des stratégies de retrieval plus robustes
- Orchestrer le pipeline avec des frameworks adaptés
- Préparer une réponse de qualité côté utilisateur
- Activité pratique : TP de construction d’un RAG fonctionnel (Développer un pipeline complet sur un corpus documentaire métier fourni en formation. Interroger le système, analyser les réponses obtenues et améliorer la qualité du retrieval avant génération.)
Partie 5 — Évaluer la qualité réelle d’un système RAG (Jour 3- 3h00)
- Comprendre ce qu’il faut évaluer dans un projet RAG
- Découvrir les approches d’évaluation adaptées
- Identifier les causes fréquentes d’échec
- Activité pratique : atelier d’évaluation et d’amélioration (Évaluer le pipeline construit sur un lot de questions métier et repérer les erreurs de retrieval ou de génération. Corriger les paramètres clés du système pour améliorer la qualité mesurée des réponses.)
Partie 6 — Industrialiser un RAG en entreprise (Jour 3- 4h00)
- Définir une architecture RAG exploitable en production
- Sécuriser l’accès aux données et gouverner le système
- Mettre en place de bonnes pratiques d’exploitation
- Préparer une feuille de route de déploiement
- Activité pratique : projet fil rouge de synthèse (Finaliser un assistant documentaire RAG répondant à un cas d’usage métier réaliste, avec sources, retrieval optimisé et réponses fiabilisées. Présenter l’architecture retenue, les choix techniques, les résultats d’évaluation et les recommandations de déploiement.)