Amazon EMR

Exécutez et mettez à l'échelle facilement Apache Spark, Hive, Presto et d'autres applications Big Data

Exécutez des applications Big Data et des analytiques des données à l'échelle du pétaoctet plus rapidement, et pour un coût inférieur de moitié à celui des solutions sur site.

Créez des applications à l'aide des derniers cadres open source, combinées à des options d'exécution sur des clusters Amazon EC2 personnalisés, Amazon EKS, AWS Outposts, ou Amazon EMR Serverless.

Obtenez un délai d'obtention des informations 2 x plus rapide avec les versions open source, optimisées pour les performances et compatibles avec l'API de Spark, Hive et Presto.

Développez, visualisez et déboguez en toute facilité vos applications à l'aide d'EMR Notebooks et les outils open source connus d'EMR Studio.

Fonctionnement

Amazon EMR est une plateforme de big data dans le cloud utilisée par les clients pour exécuter des tâches de traitement de données distribuées à grande échelle, des requêtes SQL interactives et des applications de machine learning à l'aide de cadres d'analytique open source tels que Apache Spark, Apache Hive et Presto.

Fonctionnement d'Amazon EMR
 Cliquer pour agrandir
Présentation d'EMR Serverless (2:02)
Présentation d'Amazon EMR Serverless
Amazon EMR Serverless est une nouvelle option d'Amazon EMR qui permet aux ingénieurs et analystes des données d'exécuter facilement et à moindre coût des applications conçues à l'aide de cadres big data open source tels qu'Apache Spark, Hive ou Presto, sans avoir à régler, exploiter, optimiser, sécuriser ou gérer des clusters.
Présentation d'Amazon EMR Serverless
Amazon EMR Serverless est une nouvelle option d'Amazon EMR qui permet aux ingénieurs et analystes des données d'exécuter facilement et à moindre coût des applications conçues à l'aide de cadres big data open source tels qu'Apache Spark, Hive ou Presto, sans avoir à régler, exploiter, optimiser, sécuriser ou gérer des clusters. EMR Serverless augmente ou diminue les ressources de calcul et de mémoire en fonction des besoins de votre application, et vous ne payez que les ressources utilisées par votre application.

Cas d'utilisation

Effectuer des analytiques Big Data

Exécutez un traitement de données et des analyses basées sur les hypothèses à grande échelle à l'aide d'algorithmes statistiques et de modèles prédictifs afin de découvrir des modèles cachés, des corrélations, des tendances du marché et des préférences de client.

Créer des pipelines de données évolutifs

Extrayez des données de sources diverses, traitez-les à grande échelle et mettez-les à la disposition des applications et des utilisateurs.

Traiter les flux de données en temps réel

Analysez les événements provenant de sources de données de streaming en temps réel pour créer des pipelines de données de streaming à exécution longue, hautement disponibles et tolérants aux pannes.

Accélérer la science des données et l'adoption du ML

Analysez les données à l'aide de cadres ML open source tels qu'Apache Spark MLlib, TensorFlow et Apache MXNet. Connectez-vous à Amazon SageMaker Studio pour l'entraînement de modèle à grande échelle, l'analyse et la génération de rapports.

Comment démarrer

Découvrir le fonctionnement d'Amazon EMR

Apprenez-en davantage sur l'approvisionnement des clusters, la mise à l'échelle des ressources, la configuration de la haute disponibilité, etc.

Explorer les fonctions d'Amazon EMR »

Explorer la tarification Amazon EMR

Payez à la seconde tout en bénéficiant d'options d'exécution des clusters EMR sur Amazon EC2, Amazon EKS, AWS Outposts ou Amazon EMR Serverless.

En savoir plus sur la tarification d'Amazon EMR »

Démarrer avec Amazon EMR

Découvrez le traitement des flux en temps réel, le machine learning à grande échelle et bien d'autres choses encore en utilisant EMR.

Consulter les didacticiels Amazon EMR »

Découvrir davantage AWS