Python - Big Data Analytics

Formation créée le 20/05/2022.
Version du programme : 1

Type de formation

Formation à distance

Durée de formation

28 heures (4 jours)

Python - Big Data Analytics


Objectif de formation : Cette formation vous apprendra à utiliser Python dans le cadre de Data Analytics et d'aides décisionnelles

Objectifs de la formation

  • Maîtriser le principe de la modélisation statistique
  • Comparer la régression et la classification et faire un choix en fonction du type de données
  • Mesurer les performances prédictives d'un algorithme
  • Concevoir des sélections et des classements dans de grands volumes de données pour dégager des tendances

Profil des bénéficiaires

Pour qui
  • Responsables Infocentre
  • Utilisateurs et gestionnaires métiers de bases de données
Prérequis
  • Connaissances de base en Python
  • Connaissances de base en statistiques

Contenu de la formation

Introduction à la modélisation
  • Présentation du langage Python
  • Présentation du logiciel Jupiter Notebook
  • Définition des jalons de construction d'un modèle
  • Comparatif algorithmes supervisés & non supervisés
  • Différences entre régression et classification
Procédures d'évaluation de modèles
  • Ré-échantillonnage en jeu d'apprentissage
  • Techniques de validation et de test
  • Test de représentativité des données d'apprentissage
  • Évaluation de performance des modèles prédictifs
  • Matrice de confusion, de coût et la courbe ROC et AUC
Algorithmes supervisés
  • Principe de régression linéaire univariée
  • Régression multivariée
  • Régression polynomiale
  • Régression régularisée
  • Naive Bayes
  • Régression logistique
Algorithmes non supervisés
  • Clustering hiérarchique
  • Clustering non hiérarchique
  • Approches mixtes
Analyse en composantes
  • Analyse en composantes principales
  • Analyse factorielle des correspondances
  • Analyse des correspondances multiples
  • Analyse factorielle pour données mixtes
  • Classification hiérarchique sur composantes principales
Analyse de données textuelles
  • Collecte et prétraitement des données textuelles
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
  • Lemmatisation
  • Représentation vectorielle des textes
  • Pondération TF-IDF
  • Word2Vec

Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats

  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Ressources techniques et pédagogiques

  • Espace numérique de travail
  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...