Cloud AWS
Cloud AWS
Démarrez avec Amazon EMR

Amazon EMR fournit une infrastructure Hadoop qui permet de traiter de manière simple, rapide et rentable de grandes quantités de données sur des instances Amazon EC2 dynamiquement évolutives. Vous pouvez également exécuter d'autres frameworks distribués courants tels qu'Apache Spark, HBase, Presto et Flink dans Amazon EMR et interagir avec le contenu d'autres magasins de données AWS comme Amazon S3 et Amazon DynamoDB.

Amazon EMR gère un large éventail de cas d'utilisation de Big Data de façon sûre et fiable, tels que l'analyse des journaux, l'indexation Web, les transformations de données (ETL), l'apprentissage machine, l'analyse financière, la simulation scientifique et la recherche bio-informatique.

amazon_emr_thumb_resize_prod_pg_378x171
6:03
Présentation d'Amazon EMR

Cliquez pour agrandir

Vitesse de publication des versions d'Amazon EMR

Vitesse de publication des versions d'Amazon EMR

Grâce au contrôle de version sur Amazon EMR, vous pouvez facilement sélectionner et utiliser les derniers projets open source dans votre cluster EMR, notamment des applications dans les écosystèmes Apache Hadoop et Spark. Le logiciel est installé et configuré par Amazon EMR. Vous pouvez donc consacrer plus de temps à la valorisation de vos données sans vous soucier des tâches d'infrastructure et d'administration.


Utilisation simple

Utilisation simple

Vous pouvez lancer un cluster Amazon EMR en quelques minutes. Vous n'avez pas à vous préoccuper de la mise en service des nœuds, ni de la mise en place et du réglage du cluster, ni de la configuration d'Hadoop. Amazon EMR prend en charge ces tâches, afin que vous puissiez vous concentrer sur vos opérations d'analyse. 

Coût réduit

Coût réduit

La tarification d'Amazon EMR est simple et prévisible : vous payez à la seconde ce que vous utilisez avec un forfait d'une minute minimum. Vous pouvez lancer un cluster Hadoop à 10 nœuds pour un coût aussi bas que 0,15 USD de l'heure. De plus, Amazon EMR propose une prise en charge native des instances Amazon EC2 spot et réservées, vous pouvez donc également économiser entre 50 et 80 % sur le coût de vos instances sous-jacentes.

Elasticité

Elasticité

Avec Amazon EMR, vous pouvez mettre en service une, des centaines, voire des milliers d'instances de calcul afin de traiter vos données à n'importe quelle échelle. Vous pouvez facilement augmenter ou diminuer le nombre d'instances, aussi bien manuellement qu'à l'aide de l'option Auto Scaling, et vous ne payez qu'en fonction de votre utilisation.

Fiable

Fiable

Vous perdez moins de temps à régler les paramètres de votre cluster et à surveiller son exécution. Amazon EMR permet un réglage d'Hadoop pour le cloud, ainsi que la surveillance de votre cluster. Les tâches ayant échoué sont réexécutées, et les instances aux performances insatisfaisantes sont automatiquement remplacées.

 

Sécurité

Sécurité

Amazon EMR configure automatiquement les paramètres du pare-feu Amazon EC2 qui contrôlent l'accès réseau aux instances, et vous pouvez lancer vos clusters dans Amazon Virtual Private Cloud (VPC), un réseau isolé de manière logique que vous définissez. Pour les objets stockés dans Amazon S3, vous pouvez utiliser le chiffrement côté serveur ou le chiffrement côté client Amazon S3 avec le système EMRFS à l'aide d'AWS Key Management Service ou de clés gérées par le client. Vous pouvez également activer en toute simplicité d'autres options de chiffrement et d'authentification avec Kerberos.

Flexible

Flexibilité

Vous disposez d'un contrôle total sur votre cluster. Vous disposez d'un accès racine à chaque instance afin de pouvoir facilement installer des applications supplémentaires et personnaliser chaque cluster par des actions d'amorçage. Vous pouvez également lancer des clusters Amazon EMR avec des AMI Linux Amazon personnalisées. 

Analyse des parcours de navigation

Analyse des parcours de navigation

Amazon EMR permet d'analyser les données de parcours de navigation afin de segmenter les utilisateurs, de comprendre leurs préférences et de proposer des publicités plus efficaces.    
    
Découvrez comment Razorfish utilise EMR pour ses analyses de parcours de navigation »

Analyse en temps réel

Analyses en temps réel

Utilisez et traitez des données en temps réel depuis Amazon Kinesis, Apache Kafka ou d'autres flux de données avec Spark Streaming sur Amazon EMR. Effectuez des analyses en continu en profitant d'une tolérance élevée aux pannes et écrivez les résultats sur Amazon S3 ou sur le système HDFS.
Découvrez comment Hearst utilise Spark Streaming »

Analyse des données consignées

Analyse des données consignées

Amazon EMR permet de traiter les journaux générés par les applications Web et mobiles. Amazon EMR permet aux clients de transformer des pétaoctets de données non structurées ou semi-structurées en informations utiles à propos de leurs applications ou de leurs utilisateurs.
Découvrez comment Yelp utilise EMR pour diriger des fonctionnalités de site Web essentielles »

ETL

Extraction, transformation et chargement (ETL)

Amazon EMR permet d'exécuter rapidement et de façon rentable des charges de travail de transformation de données (ETL), telles que le tri, l'agrégation et la liaison, sur de grands ensembles de données.
  
Découvrez comment Redfin utilise les clusters EMR transitoires pour l'ETL »

Analyses prédictives

Analyses prédictives

Apache Spark sur Amazon EMR comprend la bibliothèque MLlib pour offrir un large éventail d'algorithmes d'apprentissage machine évolutifs. Vous pouvez également utiliser vos propres bibliothèques. En stockant des ensembles de données en mémoire, Spark peut offrir d'excellentes performances pour les charges de travail d'apprentissage machine courantes.
Découvrez comment Intent Media utilise Spark MLib »

Génomique

Génomique

Amazon EMR peut être utilisé pour traiter des volumes importants de données génomiques et d'autres grands ensembles de données scientifiques, rapidement et efficacement. Les chercheurs peuvent accéder aux données hébergées gratuitement sur AWS.
Découvrez Apache Spark et la médecine de précision »

Pour commencer à utiliser Amazon EMR, c'est très simple. Suivez notre guide de démarrage pour lancer votre premier cluster Amazon EMR et commencer à analyser des données en quelques clics.

 

Mise en route