Découvrez comment utiliser Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena et le reste de la plate-forme Big Data d'AWS pour traiter les données et créer des environnements de Big Data

Le cours Big Data sur AWS vous présente les solutions de Big Data basées sur le cloud, comme Amazon EMR, Amazon Redshift, Amazon Kinesis et le reste de la plate-forme de Big Data d'AWS. Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Hive et Hue. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift, Amazon Quicksight, Amazon Athena et Amazon Kinesis, et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.

Niveau

Intermédiaire

Modalité

En salle de classe, cours en personne ou virtuel

Durée

3 jours

Ce cours vous explique comment :

  • Intégrer une solution AWS dans un écosystème de Big Data.
  • Utiliser Apache Hadoop dans le cadre d'Amazon EMR.
  • Identifier les composants d'un cluster Amazon EMR.
  • Lancer et configurer un cluster Amazon EMR.
  • Utiliser les frameworks de programmation courants compatibles avec Amazon EMR, notamment Hive, Pig et Streaming.
  • Utiliser Hue pour améliorer la facilité d'utilisation d'Amazon EMR.
  • Utiliser les analyses en mémoire avec Spark sur Amazon EMR.
  • Choisir les options de stockage de données AWS appropriées.
  • Identifier les avantages de l'utilisation d'Amazon Kinesis pour le traitement de Big Data en temps quasi réel.
  • Utiliser Amazon Redshift pour stocker et analyser des données de manière efficace.
  • Comprendre et gérer les coûts et la sécurité pour une solution de Big Data.
  • Identifier les options pour l'importation, le transfert et la compression de données.
  • Tirez parti d'Amazon Athena pour des analyses de requêtes ad hoc.
  • Exploiter AWS Glue pour automatiser les charges ETL.
  • Utiliser un logiciel de visualisation pour représenter les données et les requêtes avec Amazon QuickSight.
  • Orchestrer des flux de travail de Big Data avec AWS Data Pipeline.

Ce cours s'adresse aux personnes suivantes :

  • Personnes en charge de la conception et de l'implémentation de solutions de Big Data, c'est-à-dire architectes de solutions et administrateurs SysOps
  • Scientifiques et analystes de données souhaitant en savoir plus sur les services et les types d'architectures soutenant les solutions de Big Data sur AWS

Pour assister à ce cours, il est recommandé :

Ce cours combine les méthodes d'apprentissage suivantes :

  • Formation assurée par un instructeur
  • Ateliers pratiques

Ce cours vous permet de tester de nouvelles compétences et d'appliquer vos connaissances dans votre environnement de travail grâce à différents exercices pratiques.

Remarque : le déroulement du cours peut varier légèrement selon l'emplacement et/ou la langue régionale dans laquelle le cours est donné.

Journée 1

  • Présentation des technologies Big Data
  • Importation
  • Streaming de Big Data et Amazon Kinesis
  • Utilisation d'Amazon Kinesis pour diffuser en streaming et analyser des journaux Apache Server
  • Solutions de stockage
  • Utilisation d'Amazon Athena pour analyser des données de journal
  • Présentation d'Apache Hadoop et d'Amazon EMR

Journée 2

  • Utilisation d'Amazon Elastic MapReduce
  • Stockage et interrogation des données sur DynamoDB
  • Frameworks de programmation Hadoop
  • Traitement de journaux de serveur avec Hive sur Amazon EMR
  • Simplification de votre expérience Amazon EMR avec Hue
  • Exécution de scripts Pig dans Hue sur Amazon EMR
  • Spark sur Amazon EMR
  • Traitement de l'ensemble de données des taxis de New York avec Spark sur Amazon EMR

Journée 3

  • Utilisation d'AWS Glue pour automatiser des charges ETL
  • Amazon Redshift et les technologies Big Data
  • Visualisation et orchestration de Big Data
  • Gestion des frais liés à Amazon EMR
  • Sécurisation des solutions de Big Data
  • Modèles de conception de Big Data
Big Data Thumbnail

Accéder à aws.training