Découvrez comment utiliser Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena et le reste de la plate-forme Big Data d'AWS pour traiter les données et créer des environnements de Big Data

Le cours Big Data sur AWS vous présente les solutions de Big Data basées sur le cloud, comme Amazon EMR, Amazon Redshift, Amazon Kinesis et le reste de la plate-forme de Big Data d'AWS. Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce au vaste écosystème d'outils Hadoop tels que Hive et Hue. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift, Amazon Quicksight, Amazon Athena et Amazon Kinesis, et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.

Niveau

Intermédiaire

Modalité

Cours assuré par un instructeur, en personne ou virtuel

Durée

3 jours

Ce cours vous explique comment :

  • Intégrer une solution AWS dans un écosystème de Big Data.
  • Utiliser Apache Hadoop dans le cadre d'Amazon EMR.
  • Identifier les composants d'un cluster Amazon EMR.
  • Lancer et configurer un cluster Amazon EMR.
  • Utiliser les frameworks de programmation courants compatibles avec Amazon EMR, notamment Hive, Pig et Streaming.
  • Utiliser Hue pour améliorer la facilité d'utilisation d'Amazon EMR.
  • Utiliser les analyses en mémoire avec Spark sur Amazon EMR.
  • Choisir les options de stockage de données AWS appropriées.
  • Identifier les avantages de l'utilisation d'Amazon Kinesis pour le traitement de Big Data en temps quasi réel.
  • Utiliser Amazon Redshift pour stocker et analyser des données de manière efficace.
  • Comprendre et gérer les coûts et la sécurité pour une solution de Big Data.
  • Sécuriser une solution de Big Data.
  • Identifier les options pour l'importation, le transfert et la compression de données.
  • Tirez parti d'Amazon Athena pour des analyses de requêtes ad hoc.
  • Utiliser un logiciel de visualisation pour représenter les données et les requêtes avec Amazon QuickSight.
  • Orchestrer des flux de travail de Big Data avec AWS Data Pipeline.

Ce cours s'adresse aux personnes suivantes :

  • Personnes responsables de la conception et de l'implémentation de solutions de Big Data, c'est-à-dire architectes de solutions
  • Scientifiques et analystes de données souhaitant en savoir plus sur les services et les types d'architectures soutenant les solutions de Big Data sur AWS

Pour assister à ce cours, il est recommandé :

Ce cours combine les méthodes d'apprentissage suivantes :

  • Formation assurée par un instructeur
  • Ateliers pratiques

Ce cours vous permet de tester de nouvelles compétences et d'appliquer vos connaissances dans votre environnement de travail grâce à différents exercices pratiques.

Remarque : le déroulement du cours peut varier légèrement selon l'emplacement et/ou la langue régionale dans laquelle le cours est donné.

Journée 1

  • Présentation des technologies Big Data
  • Absorption et transfert de Big Data
  • Streaming de Big Data et Amazon Kinesis
  • Atelier 1 : utilisation d'Amazon Kinesis pour diffuser et analyser les données de journal d'un serveur Apache
  • Solutions de stockage de Big Data
  • Traitement et analyses de Big Data
  • Atelier 2 : utilisation d'Amazon Athena pour interroger des données de journal depuis Amazon S3

Journée 2

  • Apache Hadoop et Amazon EMR
  • Atelier 3 : stockage et interrogation de données sur Amazon DynamoDB
  • Utilisation d'Amazon EMR
  • Frameworks de programmation Hadoop
  • Atelier 4 : traitement des journaux du serveur avec Hive sur Amazon EMR
  • Interfaces Web sur Amazon EMR
  • Atelier 5 : exécution de scripts Pig dans Hue sur Amazon EMR
  • Apache Spark sur Amazon EMR
  • Atelier 6 : traitement des données de taxis new-yorkais avec Spark sur Amazon EMR

Journée 3

  • Amazon Redshift et les technologies Big Data
  • Visualisation et orchestration de Big Data
  • Atelier 7 : utilisation de TIBCO Spotfire pour visualiser les données
  • Gestion des coûts du Big Data
  • Sécurisation de vos déploiements Amazon
  • Modèles de conception de Big Data
Big Data Thumbnail

Accéder à aws.training