Logo de l'organisme de formation

La formation au coeur de l'avenir technologique

Représentation de la formation : Data Clustering - Organisation des données

Data Clustering - Organisation des données

Formation à distance
Durée : 14 heures (2 jours)
Durée :14 heures (2 jours)
HT
Se préinscrire
Durée :14 heures (2 jours)
HT
Se préinscrire
Durée :14 heures (2 jours)
HT
Se préinscrire

Formation créée le 17/01/2023. Dernière mise à jour le 16/03/2023.

Version du programme : 1

Programme de la formation

Objectif de formation : Appréhender et maîtriser les notions clés du Data Clustering

Objectifs de la formation

  • Appréhender les différents aspects du clustering de données
  • Connaître les méthodes, les outils et les techniques de clustering de données
  • Implémenter les outils et algorithmes pour le clustering de données
  • Pouvoir mesurer les performances et la qualité d'un jeu de données

Profil des bénéficiaires

Pour qui
  • Data analyst
  • Développeurs
  • Chefs de projets
Prérequis
  • Solides bases en programmation

Contenu de la formation

  • Premiers pas en clustering de données
    • Présentation de la dichotomie approches supervisées & approches non supervisées
    • Méthodes floues & strictes
    • Théorie des graphes
    • Présentation des différents types de structures de données
    • Calcul de similarité
    • Propriétés des jeux de données
  • Clustering simple & clustering hiérarchique
    • Clustering simple
    • Clusterings hiérarchiques et composés
    • Utilité du clustering hiérarchique
    • Présentation du résultat
    • Travaux pratiques : Etude de cas d'utilisations de techniques de clustering
  • Méthodes de clustering
    • Approches orientées K-means
    • Approches par agglomération
    • Approches basées sur un modèle physique (modèle énergie, ressort...)
    • Approches "divisives"
    • Approches par marche aléatoire
    • Algorithmes incrémentaux
    • Travaux pratiques : Avantages/inconvénients des approches étudiées
  • Outils pratiques et algorithmes pour le clustering de données
    • K-means simple, Graclus, Cluto
    • Algorithme hiérarchique : Louvain
    • InfoMap, Fast Modularity
    • NCut, approche Girvan Newman...
    • Extraction d'arbres couvrants et composition
    • Travaux pratiques : déploiement de K-means sur un jeu de données puis implémentation de l'algorithme hiérarchique CAH.
  • Mesures Qualité et Performance
    • Introduction à la performance et à la complexité
    • Mesures de qualité
    • Critères qualité
    • Technique des diagrammes d'Inselberg
    • Travaux pratiques Mesure de la qualité sur un jeu de données.
  • Clustering de données à partir d'un réseau lexical
    • Présentation du jeu de données
    • Analyse des propriétés du réseau
    • Exécution d'algorithmes de clustering
    • Affichage du résultat
    • Calcul de la qualité des partitionnements effectués
    • Travaux pratiques : Mise en œuvre d'algorithmes de clustering sur un réseau lexical et sur des documents Web, pdf...
  • Clustering de documents
    • Présentation du jeu de données
    • Analyse des propriétés du réseau
    • Calcul de mesures de similarité
    • Exécution d'algorithmes de clustering
    • Affichage du résultat
    • Calcul de la qualité
    • Travaux pratiques : Mise en œuvre d'algorithmes de clustering sur une base documentaire, calcul de mesures de similarité, clustering, analyse de la qualité
Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats
  • Émargement numérique
  • Mises en situation
  • Formulaires d’évaluation de la formation
  • Certificat de réalisation de l’action de formation
Ressources techniques et pédagogiques
  • Espace intranet de formation
  • Documents supports de formation projetés
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Qualité et satisfaction

Taux de satisfaction des apprenants, nombre d'apprenants, taux et causes des abandons, taux de retour des enquêtes, taux d'interruption en cours de prestation...