Data Science - Programmation R
0/10
(0 avis)
Formation créée le 05/01/2022.
Version du programme : 1
Programme de la formation
Objectif de formation : Au terme de la formation l'apprenant aura pris en main le langage de programmation R et détiendra des compétences de base en Data Science grâce à lui.
Objectifs de la formation
- Savoir utiliser la bibliothèque H2O
- Manipuler les modèles de Machine Learning et de Deep Learning sous H2O
- Reconnaître les cas d'utilisation avec Spark
Profil des bénéficiaires
Pour qui
- Statisticiens
- Consultants Big Data
- Data analysts
- Data scientists
Prérequis
- Avoir des connaissances en Machine Learning
- Avoir des bases en programmation R
Contenu de la formation
-
Introduction au Machine Learning
- Présentation des notions de bases
- Modèles & Machine Learning
- Deep Learning
- AutoML
-
Présentation d'H2O
- Notions et cas d'usages
- Installation
- Introduction à R
- Travaux pratiques : installation et première utilisation d'H2O
-
Arbres et forêts
- Définitions
- Arbres de décisions
- Random Forest & H2O
- Gradient Boosting Machine & H2O
- Overfitting & train / validation / test
- Validation croisée & H2O
- Travaux pratiques : création d'arbres de décisions et études des résultats
-
Modèles linéaires
- Définitions
- Régression linéaire
- Régression logistique
- Naïve bayésien
- Hyperparamètre
- Travaux pratiques : création d'une régression et études des résultats
-
Data Manipulation
- Chargement et exportation de la donnée sous H2O
- Exploration de la donnée
- Manipulation de la donnée
-
Deep learning H2O
- Réseaux neuronaux
- Deep learning & le Grid Search
- Régression en Deep Learning
-
Architecture et sécurité sous H2O
- H2O Stack logiciel
- API REST
- Interaction avec R
- Sécurisation des modèles
- SSL Sécurité
-
Présentation du Sparkling Water
- Cas d'utilisation nominale
- Construction de modèles
- Le munging de données
- Les processus en stream
- Présentation des fonctionnalités
- Les sources de données supportées
- Formats de données supportées
- Environnements d'exécutions Spark supportés
-
API H2O
- Démarrage des services H2O
- L'allocation mémoire
- Conversion d'H2OFrame : RDD & DataFrame
- Convertion du RDD et DataFrame au H2OFrame
- Création d'un H2OFrame à partir d'une clé existante
- Le mapping des types entre H2OFrame et Spark DataFrame
- Appeler les algorithmes H2O
- Utilisation de Spark Data Sources avec H2OFrame
- H2OFrame : lecture & enregistrement
- Chargement et sauvegarde des options
- Spécification du mode d'enregistrement à appliquer
-
H2O en production
- POJO & MOJO
- MOJO Quick Start
- POJO Quick Start
- Illustrations de design patterns
- Ressources supplémentaires
Équipe pédagogique
Professionnel expert technique et pédagogique.
Suivi de l'exécution et évaluation des résultats
- Feuilles de présence.
- Questions orales ou écrites (QCM).
- Mises en situation.
- Formulaires d'évaluation de la formation.
- Certificat de réalisation de l’action de formation.
Ressources techniques et pédagogiques
- Espace numérique de travail
- Documents supports de formation projetés
- Exposés théoriques
- Etude de cas concrets
- Quiz en salle
- Mise à disposition en ligne de documents supports à la suite de la formation