Data Science - Programmation R

Formation créée le 05/01/2022.
Version du programme : 1

Type de formation

Formation à distance

Durée de formation

21 heures (3 jours)

Data Science - Programmation R


Objectif de formation : Au terme de la formation l'apprenant aura pris en main le langage de programmation R et détiendra des compétences de base en Data Science grâce à lui.

Objectifs de la formation

  • Savoir utiliser la bibliothèque H2O
  • Manipuler les modèles de Machine Learning et de Deep Learning sous H2O
  • Reconnaître les cas d'utilisation avec Spark

Profil des bénéficiaires

Pour qui
  • Statisticiens
  • Consultants Big Data
  • Data analysts
  • Data scientists
Prérequis
  • Avoir des connaissances en Machine Learning
  • Avoir des bases en programmation R

Contenu de la formation

Introduction au Machine Learning
  • Présentation des notions de bases
  • Modèles & Machine Learning
  • Deep Learning
  • AutoML
Présentation d'H2O
  • Notions et cas d'usages
  • Installation
  • Introduction à R
  • Travaux pratiques : installation et première utilisation d'H2O
Arbres et forêts
  • Définitions
  • Arbres de décisions
  • Random Forest & H2O
  • Gradient Boosting Machine & H2O
  • Overfitting & train / validation / test
  • Validation croisée & H2O
  • Travaux pratiques : création d'arbres de décisions et études des résultats
Modèles linéaires
  • Définitions
  • Régression linéaire
  • Régression logistique
  • Naïve bayésien
  • Hyperparamètre
  • Travaux pratiques : création d'une régression et études des résultats
Data Manipulation
  • Chargement et exportation de la donnée sous H2O
  • Exploration de la donnée
  • Manipulation de la donnée
Deep learning H2O
  • Réseaux neuronaux
  • Deep learning & le Grid Search
  • Régression en Deep Learning
Architecture et sécurité sous H2O
  • H2O Stack logiciel
  • API REST
  • Interaction avec R
  • Sécurisation des modèles
  • SSL Sécurité
Présentation du Sparkling Water
  • Cas d'utilisation nominale
  • Construction de modèles
  • Le munging de données
  • Les processus en stream
  • Présentation des fonctionnalités
  • Les sources de données supportées
  • Formats de données supportées
  • Environnements d'exécutions Spark supportés
API H2O
  • Démarrage des services H2O
  • L'allocation mémoire
  • Conversion d'H2OFrame : RDD & DataFrame
  • Convertion du RDD et DataFrame au H2OFrame
  • Création d'un H2OFrame à partir d'une clé existante
  • Le mapping des types entre H2OFrame et Spark DataFrame
  • Appeler les algorithmes H2O
  • Utilisation de Spark Data Sources avec H2OFrame
  • H2OFrame : lecture & enregistrement
  • Chargement et sauvegarde des options
  • Spécification du mode d'enregistrement à appliquer
H2O en production
  • POJO & MOJO
  • MOJO Quick Start
  • POJO Quick Start
  • Illustrations de design patterns
  • Ressources supplémentaires

Équipe pédagogique

Professionnel expert technique et pédagogique.

Suivi de l'exécution et évaluation des résultats

  • Feuilles de présence.
  • Questions orales ou écrites (QCM).
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Ressources techniques et pédagogiques

  • Espace numérique de travail
  • Documents supports de formation projetés
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation