Vous permet d'acquérir les bases de l'utilisation des services AWS pour les solutions Big Data

La formation Concepts de base de la technologie Big Data vous apporte des connaissances générales quant aux technologies utilisées dans le cadre de solutions Big Data. Elle présente le développement des solutions Big Data reposant sur l'écosystème Hadoop, notamment MapReduce, HDFS et les frameworks de programmation Pig et Hive. Cette formation en ligne vous permet d'acquérir les bases nécessaires pour exploiter les services AWS dans le cadre de solutions Big Data. Elle est accessible gratuitement et peut être suivie indépendamment ou en tant que préparation à la formation Big Data sur AWS, assurée par un instructeur.

Niveau

Bases

Modalité

Numérique, à son propre rythme

Durée

90 minutes

À la fin de ce cours, vous aurez acquis les compétences suivantes :

  • Identifier les technologies et outils communs qui permettent de créer des solutions Big Data.
  • Comprendre le fonctionnement du modèle de programmation MapReduce, y compris les composants de mappage (« Map »), de répartition et de tri (« Shuffle and Sort ») et d'agrégation (« Reduce »).
  • Identifier les options disponibles pour la création d'une solution Big Data utilisant le framework de programmation Hive.

Ce cours s'adresse aux personnes suivantes :

  • Personnes ne connaissant pas encore les concepts de la technologie Big Data, notamment les architectes de solutions d'entreprise, les architectes de solutions Big Data, les « data scientists » (experts en science des données) et les analystes de données

Pour assister à ce cours, il est recommandé :

  • de connaître les bases de la programmation dans un langage tel que Java ou C#.

Ce cours se présente sous la forme suivante :

  • Formation en ligne via un navigateur Web

Remarque : le déroulement du cours peut varier légèrement selon l'emplacement et/ou la langue régionale dans laquelle le cours est donné.

Module 1 : Présentation de la technologie Big Data

  • Importance des technologies Big Data pour les entreprises
  • Ecosystème Hadoop
  • Caractéristiques des technologies Big Data
  • Traitement de Big Data
  • Outils et techniques d'analyse de Big Data
  • Mise en place de solutions Big Data
  • Etude de cas : Analyse de données de réseaux sociaux

Module 2 : Présentation de MapReduce et de Hadoop

  • Architecture Hadoop
  • Framework MapReduce
  • Programmation avec MapReduce
  • MapReduce et HDFS/S3
  • Cas d'utilisation : Système de recommandation

Module 3 : Analyse de données à l'aide de la programmation dans Pig

  • Présentation de Pig
  • Types de données Pig
  • Représentation des données dans Pig
  • Exécution de Pig
  • Fonctions définies par l'utilisateur
  • Comparaison entre Pig et les SGBDR traditionnels
  • Techniques avancées dans Pig  

Module 4 : Interrogation de Big Data avec Hive

  • Présentation de Hive
  • Représentation des données dans Hive
  • Types de données Hive
  • Interrogation de données avec les requêtes Hive
  • Hive et AWS
  • Cas d'utilisation : Analyse ad hoc et commentaires sur les produits
Inscrivez-vous dès maintenant sur aws.training