Logo de l'organisme de formation

La formation au coeur de l'avenir technologique

Représentation de la formation : Machine Learning - Fondamentaux avec Python et Scikit-Learn

Machine Learning - Fondamentaux avec Python et Scikit-Learn

Formation à distance
Durée : 21 heures (3 jours)
Durée :21 heures (3 jours)
HT
Se préinscrire
Durée :21 heures (3 jours)
HT
Se préinscrire
Durée :21 heures (3 jours)
HT
Se préinscrire

Formation créée le 03/05/2022. Dernière mise à jour le 10/10/2022.

Version du programme : 1

Programme de la formation

Objectif de formation : Cette formation vous permettra d’appréhender et d’appliquer les algorithmes de machine learning (apprentissage automatique) avec la librairie scikit-learn.

Objectifs de la formation

  • Identifier les problèmes pouvant faire appel à l’apprentissage automatique
  • Découvrir les modèles classiques d’apprentissage supervisé
  • Évaluer les performances des modèles d’apprentissage
  • Utiliser la librairie scikit-learn pour comprendre et mettre en oeuvre les différentes étapes d’un traitement de données par apprentissage supervisé

Profil des bénéficiaires

Pour qui
  • Développeurs
  • Ingénieurs
  • Chercheurs
  • Chefs de projets techniques
Prérequis
  • Connaissances solides en Python
  • Facultatif : Connaissances de base en algèbre linéaire
  • Facultatif : Avoir suivi la formation « Python - Programmation scientifique »

Contenu de la formation

  • Introduction à l’apprentissage automatique
    • Historique et motivations
    • Panorama des différents types d’apprentissage
    • L’apprentissage supervisé : classification vs. régression
    • Exemples concrets
  • Les modèles classiques
    • Modèles linéaires
    • Arbres de décision et modèles sous-jacents
    • Support vecteur machines (SVMs) et leurs kernels
    • Quelques modèles très utilisés dans l’industrie
  • La réduction de dimensions
    • La malédiction de la dimension
    • Variables corrélées / décorrélées du problème
    • L’apprentissage non-supervisé : PCA & Manifold projection
  • Pré-traitement des données
    • Normalisation
    • Encodage des variables qualitatives
    • Augmentation de données
    • Traiter les données manquantes
  • Pipelines scikit-learn
    • Découverte du Pipeline scikit-learn
    • Enchainement de pré-traitement et d’entrainement de modèle
    • Visualisation du Pipeline
    • Introduction du ColumnTransformer
  • Sélection des modèles
    • Théorème du “No-free lunch”
    • Comparer des modèles
    • Scores / métriques de performance
  • Optimisation des modèles
    • Les hyper-paramètres
    • Recherche en grille (grid search) vs. aléatoire (random search)
    • Recherche d’hyperparamètres et cross-validation grâce au Pipeline
    • Visualisation des résultats avec parallel plots (ex : plotly ou hiplots)
Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
  • Espace numérique de travail
  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation.