Python - Big Data Analytics
0/10
(0 avis)
Formation créée le 20/05/2022.
Version du programme : 1
Programme de la formation
Objectif de formation : Cette formation vous apprendra à utiliser Python dans le cadre de Data Analytics et d'aides décisionnelles
Objectifs de la formation
- Maîtriser le principe de la modélisation statistique
- Comparer la régression et la classification et faire un choix en fonction du type de données
- Mesurer les performances prédictives d'un algorithme
- Concevoir des sélections et des classements dans de grands volumes de données pour dégager des tendances
Profil des bénéficiaires
Pour qui
- Responsables Infocentre
- Utilisateurs et gestionnaires métiers de bases de données
Prérequis
- Connaissances de base en Python
- Connaissances de base en statistiques
Contenu de la formation
-
Introduction à la modélisation
- Présentation du langage Python
- Présentation du logiciel Jupiter Notebook
- Définition des jalons de construction d'un modèle
- Comparatif algorithmes supervisés & non supervisés
- Différences entre régression et classification
-
Procédures d'évaluation de modèles
- Ré-échantillonnage en jeu d'apprentissage
- Techniques de validation et de test
- Test de représentativité des données d'apprentissage
- Évaluation de performance des modèles prédictifs
- Matrice de confusion, de coût et la courbe ROC et AUC
-
Algorithmes supervisés
- Principe de régression linéaire univariée
- Régression multivariée
- Régression polynomiale
- Régression régularisée
- Naive Bayes
- Régression logistique
-
Algorithmes non supervisés
- Clustering hiérarchique
- Clustering non hiérarchique
- Approches mixtes
-
Analyse en composantes
- Analyse en composantes principales
- Analyse factorielle des correspondances
- Analyse des correspondances multiples
- Analyse factorielle pour données mixtes
- Classification hiérarchique sur composantes principales
-
Analyse de données textuelles
- Collecte et prétraitement des données textuelles
- Extraction d'entités primaires, d'entités nommées et résolution référentielle
- Étiquetage grammatical, analyse syntaxique, analyse sémantique.
- Lemmatisation
- Représentation vectorielle des textes
- Pondération TF-IDF
- Word2Vec
Équipe pédagogique
Professionnel expert technique et pédagogique.
Suivi de l'exécution et évaluation des résultats
- Feuilles de présence.
- Questions orales ou écrites (QCM).
- Mises en situation.
- Formulaires d'évaluation de la formation.
- Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
- Espace numérique de travail
- Documents supports de formation projetés
- Exposés théoriques
- Etude de cas concrets
- Quiz en salle
- Mise à disposition en ligne de documents supports à la suite de la formation
Qualité et satisfaction
Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...
0/10
(0 avis)