Machine Learning - Fondamentaux avec Python et Scikit-Learn

Formation créée le 17/04/2025.
Version du programme : 1

Type de formation

Formation à distance

Durée de formation

21 heures (3 jours)

Accessibilité

Oui

Machine Learning - Fondamentaux avec Python et Scikit-Learn


Objectif de formation : Cette formation vous permettra d’appréhender et d’appliquer les algorithmes de machine learning (apprentissage automatique) avec la librairie scikit-learn.

Objectifs de la formation

  • Identifier les problèmes pouvant faire appel à l’apprentissage automatique
  • Découvrir les modèles classiques d’apprentissage supervisé
  • Évaluer les performances des modèles d’apprentissage
  • Utiliser la librairie scikit-learn pour comprendre et mettre en oeuvre les différentes étapes d’un traitement de données par apprentissage supervisé

Profil des bénéficiaires

Pour qui
  • Développeurs
  • Ingénieurs
  • Chercheurs
  • Chefs de projets techniques
Prérequis
  • Connaissances solides en Python
  • Facultatif : Connaissances de base en algèbre linéaire
  • Facultatif : Avoir suivi la formation « Python - Programmation scientifique »

Contenu de la formation

Introduction à l’apprentissage automatique
  • Historique et motivations
  • Panorama des différents types d’apprentissage
  • L’apprentissage supervisé : classification vs. régression
  • Exemples concrets
Les modèles classiques
  • Modèles linéaires
  • Arbres de décision et modèles sous-jacents
  • Support vecteur machines (SVMs) et leurs kernels
  • Quelques modèles très utilisés dans l’industrie
La réduction de dimensions
  • La malédiction de la dimension
  • Variables corrélées / décorrélées du problème
  • L’apprentissage non-supervisé : PCA & Manifold projection
Pré-traitement des données
  • Normalisation
  • Encodage des variables qualitatives
  • Augmentation de données
  • Traiter les données manquantes
Pipelines scikit-learn
  • Découverte du Pipeline scikit-learn
  • Enchainement de pré-traitement et d’entrainement de modèle
  • Visualisation du Pipeline
  • Introduction du ColumnTransformer
Sélection des modèles
  • Théorème du “No-free lunch”
  • Comparer des modèles
  • Scores / métriques de performance
Optimisation des modèles
  • Les hyper-paramètres
  • Recherche en grille (grid search) vs. aléatoire (random search)
  • Recherche d’hyperparamètres et cross-validation grâce au Pipeline
  • Visualisation des résultats avec parallel plots (ex : plotly ou hiplots)

Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats

  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Ressources techniques et pédagogiques

  • Espace numérique de travail
  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation.

Accessibilité

Du 08 au 10 juin 2025