Amazon EMR

轻松运行和扩展 Apache Spark、Hive、Presto 以及其他大数据工作负载

通过快速集群预置、托管扩展和自动化软件安装简化管理。

使用 EMR Studio 开发、可视化和调试大数据应用程序。

通过 AWS Identity and Access Management (IAM)、AWS Lake Formation 和 Apache Ranger 中的可自定义权限保护您的数据和资源的安全。

更快地运行大数据应用程序和 PB 级分析,并且成本不到本地解决方案成本的一半。

工作原理

Amazon EMR 是一个使用开源框架快速处理、分析和将机器学习 (ML) 应用于大数据的平台。
product-page-diagram_Amazon-EMR_Diagram-V5
 单击可放大

使用案例

构建可扩展的数据管道

从各种来源中提取数据、大规模处理数据,并将数据提供给应用程序和用户。将 Apache Hudi 功能用于 PB 级数据湖。

利用 ML 加速数据科学

使用内置在 EMR 中的 Apache Spark MLlib、TensorFlow 和 Apache MXNet 等开源 ML 框架。连接到 SageMaker Studio 以进行分析、报告和模型训练。

处理实时数据流

实时分析来自流式数据源的事件,以创建长期运行、高度可用且具有容错能力的流式数据管道。

查询任何数据集


使用开源 SQL 工具从不同的数据存储(包括对象存储、关系数据库、NoSQL 数据库等)中查询数据集。

如何开始使用

探索 Amazon EMR 工作原理

了解有关预置集群、扩展资源、配置高可用性等的详情。

探索 Amazon EMR 功能 »

探索 Amazon EMR 定价


利用在 Amazon Elastic Compute Cloud (EC2)、Amazon EKS 或 AWS Outposts 上运行 EMR 集群的选项,按秒随用随附。

了解有关 Amazon EMR 定价的更多信息 »

开始使用 Amazon EMR


了解使用 EMR 进行实时流处理、大规模机器学习等的信息。

查看 Amazon EMR 教程 »

更深入了解 AWS