Commencer le projet

5 étapes | 60 minutes

Analyze_Big_Data_HERO-ART_SM

Amazon EMR est un service géré qui permet d'exécuter Apache Hadoop et Spark rapidement, facilement et à moindre coût, afin de traiter de grandes quantités de données. Amazon EMR prend également en charge de puissants outils Hadoop à l'efficacité prouvée, tels que Presto, Hive, Pig, HBase et bien plus encore. Dans ce projet, vous allez déployer un cluster Hadoop entièrement fonctionnel, prêt en quelques minutes à analyser des données de journalisation. Vous commencerez en lançant un cluster Amazon EMR, puis vous utiliserez un script HiveQL pour traiter les exemples de données de journalisation stockés dans un compartiment Amazon S3. HiveQL est un langage de script de type SQL pour l'entreposage et l'analyse de données. Vous pouvez ensuite utiliser une configuration semblable pour analyser vos propres données de journalisation.

aws-project_analyze-big-data_diagram
Commencer le projet

Ce que vous accomplirez :

Lancer un cluster Hadoop entièrement fonctionnel en utilisant Amazon EMR.

Définir le schéma et créer un tableau pour les exemples de données de journalisation, stockés dans Amazon S3.

Analyser les données en utilisant un script HiveQL et réécrire les résultats sur Amazon S3.

Télécharger et consulter les résultats sur votre ordinateur.

Ce dont vous avez besoin avant de commencer :

Un compte AWS : vous devez disposer d'un compte AWS pour commencer à mettre en service des ressources afin d'héberger votre site Web. Inscrivez-vous à AWS.

Expérience informatique : une expérience préalable avec Hadoop est recommandée, mais pas nécessaire, pour réaliser ce projet.

Expérience AWS : une connaissance de base d'Amazon S3 et des paires de clés Amazon EC2 est souhaitable, mais pas nécessaire, pour réaliser ce projet.

Estimation des coûts :

Coût d'exécution du projet : le coût d'exécution de ce projet est estimé à 1,05 USD, en partant du principe que vous êtes dans les limites de l'offre gratuite d'AWS, que vous respectez les configurations recommandées et que vous supprimez toutes les ressources utilisées dans le projet dans l'heure qui suit leur création. Votre cas d'utilisation peut exiger d'autres configurations qui auront une incidence sur votre facture. Utilisez le Calculateur mensuel simple pour estimer les coûts que vos besoins exigent.

Estimation de la facture mensuelle : le coût total de ce projet variera en fonction de votre utilisation et des paramètres de configuration. L'utilisation de la configuration par défaut recommandée dans ce guide coûtera 769 USD/mois pour ce projet. La tarification AWS se base sur votre utilisation de chaque service. Votre facture mensuelle reflétera le total de votre utilisation des différents services. Examinez les onglets ci-dessous pour comprendre l'utilité de chaque service et les répercussions sur votre facture. Pour connaître la répartition des services utilisés et les coûts associés, consultez la page Services utilisés et coûts.


Apprenez-en davantage sur les solutions Big Data sur AWS et inscrivez-vous à un webinaire.

Découvrez les fonctionnalités, les avantages et les cas d'utilisation clés d'Amazon EMR.

Vous avez besoin de plus de ressources pour commencer avec AWS ? Consultez la pageMise en route pour en savoir plus.