Logo de l'organisme de formation

La formation au coeur de l'avenir technologique

Représentation de la formation : Python - Big Data Analytics

Python - Big Data Analytics

Formation à distance
Durée : 28 heures (4 jours)
Durée :28 heures (4 jours)
HT
Se préinscrire
Durée :28 heures (4 jours)
HT
Se préinscrire
Durée :28 heures (4 jours)
HT
Se préinscrire

Formation créée le 20/05/2022.

Version du programme : 1

Programme de la formation

Objectif de formation : Cette formation vous apprendra à utiliser Python dans le cadre de Data Analytics et d'aides décisionnelles

Objectifs de la formation

  • Maîtriser le principe de la modélisation statistique
  • Comparer la régression et la classification et faire un choix en fonction du type de données
  • Mesurer les performances prédictives d'un algorithme
  • Concevoir des sélections et des classements dans de grands volumes de données pour dégager des tendances

Profil des bénéficiaires

Pour qui
  • Responsables Infocentre
  • Utilisateurs et gestionnaires métiers de bases de données
Prérequis
  • Connaissances de base en Python
  • Connaissances de base en statistiques

Contenu de la formation

  • Introduction à la modélisation
    • Présentation du langage Python
    • Présentation du logiciel Jupiter Notebook
    • Définition des jalons de construction d'un modèle
    • Comparatif algorithmes supervisés & non supervisés
    • Différences entre régression et classification
  • Procédures d'évaluation de modèles
    • Ré-échantillonnage en jeu d'apprentissage
    • Techniques de validation et de test
    • Test de représentativité des données d'apprentissage
    • Évaluation de performance des modèles prédictifs
    • Matrice de confusion, de coût et la courbe ROC et AUC
  • Algorithmes supervisés
    • Principe de régression linéaire univariée
    • Régression multivariée
    • Régression polynomiale
    • Régression régularisée
    • Naive Bayes
    • Régression logistique
  • Algorithmes non supervisés
    • Clustering hiérarchique
    • Clustering non hiérarchique
    • Approches mixtes
  • Analyse en composantes
    • Analyse en composantes principales
    • Analyse factorielle des correspondances
    • Analyse des correspondances multiples
    • Analyse factorielle pour données mixtes
    • Classification hiérarchique sur composantes principales
  • Analyse de données textuelles
    • Collecte et prétraitement des données textuelles
    • Extraction d'entités primaires, d'entités nommées et résolution référentielle
    • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
    • Lemmatisation
    • Représentation vectorielle des textes
    • Pondération TF-IDF
    • Word2Vec
Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
  • Espace numérique de travail
  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...