发布于: Jun 1, 2022

我们很高兴地宣布全面推出 Amazon EMR Serverless,它是 Amazon EMR 中的一种全新的无服务器部署选项,可使数据工程师和分析师能够轻松而经济高效地在云中运行 PB 级数据分析。Amazon EMR 是云中大数据平台,您可以在该平台上使用开源分析框架(如 Apache SparkApache HivePresto 等)来运行大规模分布式数据处理任务,交互式 SQL 查询,以及机器学习(ML)应用程序。借助 EMR Serverless,您可以运行 Spark 和 Hive 应用程序,而无需配置、优化、调整或管理集群。

EMR Serverless 提供细粒度的自动扩展,可预置并快速扩展应用程序所需的计算和内存资源。例如,如果一个 Spark 任务前 5 分钟需要 2 个执行程序,接下来 10 分钟需要 10 个执行程序,最后 20 分钟需要 5 个执行程序,EMR Serverless 会根据需要自动提供资源,您只需为使用的资源付费。EMR Serverless 还包括性能已优化的 EMR 运行时,因此您的任务可以快速运行。此外,EMR Serverless 已与 EMR Studio 集成,可为您提供全面的工具来检查正在运行的任务的状态,查看任务历史记录,以及使用熟悉的开源工具来调试任务。

Amazon EMR Serverless 已在四个区域全面推出:美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(东京)和欧洲地区(爱尔兰)。

单击此处阅读 EMR Serverless 博客文章,并参阅 EMR Serverless 文档了解更多详细信息。