Amazon EMR

轻松运行和扩展 Apache Spark、Hive、Presto 以及其他大数据工作负载

EMR Serverless 简介

Amazon EMR Serverless 是 Amazon EMR 中的一个新选项,它使数据工程师和分析师能够轻松且成本高效地运行使用开源大数据框架(例如 Apache Spark、Hive 或 Presto)构建的应用程序,而无需调整、运营、优化、保护或管理集群。

优势

更快地运行大数据应用程序和 PB 级数据分析,并且成本不到本地解决方案成本的一半。

使用最新开源框架搭建应用程序,可在自定义 Amazon EC2 集群、Amazon EKSAWS OutpostsAmazon EMR Serverless 上运行。

通过性能优化且兼容开源 API 的 Spark、Hive 和 Presto 版本,洞察时间提升为原来的 2 倍。

使用 EMR Notebooks 和 EMR Studio 中的熟悉开源工具,轻松开发、可视化和调试应用程序。

使用案例

使用统计算法和预测性模型运行大规模数据处理和 what-if 分析,发现隐藏的模式、相关性、市场趋势和客户偏好。
从各种来源中提取数据、大规模处理数据,并将数据提供给应用程序和用户。
实时分析来自流式数据源的事件,以创建长期运行、高度可用且具有容错能力的流式数据管道。
使用 Apache Spark MLlib、TensorFlow 和 Apache MXNet 等开源 ML 框架。连接 Amazon SageMaker Studio 进行大型模型训练、分析和报告。

深入了解 AWS