发布于: Nov 30, 2021
我们很高兴地宣布推出 Amazon EMR 无服务器版(预览版),它是 Amazon EMR 中的一种全新的无服务器选项,使数据工程师和分析师能够轻松而经济高效地在云中运行 PB 级数据分析。Amazon EMR 是云中大数据平台,用户可以在该平台上使用开源分析框架(如 Apache Spark、Apache Hive 和 Presto 等)运行大规模分布式数据处理作业,交互式 SQL 查询,以及机器学习应用程序。通过 EMR 无服务器版,客户只需单击数次即可运行采用这些框架构建的应用程序,而不必配置、优化或保护集群的安全。EMR 无服务器版会自动预置与扩展应用程序所需的计算和内存资源,而且客户只需为使用的资源付费。
借助于 EMR 无服务器版,您可以轻松指定您想用于应用程序的开源框架和版本,并使用 API、EMR Studio 或 JDBC/ODBC 客户端提交作业。EMR 无服务器版会自动确定与预置处理请求所需的计算和内存资源,根据不断变化的要求在处理的不同阶段扩展与缩减资源。例如,在处理您的数据时,某 Spark 作业可能在前 5 分钟需要两个执行程序,接下来的 10 分钟需要十个,而在最后 20 分钟需要五个。 EMR 无服务器版会视需要自动预置与调整资源,因此即使随着时间变化数据卷发生更改,您也无需担心。而且,由于您只需要为所使用的资源付费,对于运行 PB 级分析,EMR 无服务器版是一种非常经济高效的选项。客户可以通过 EMR Studio 查看正在运行的作业的状态,检查作业历史记录,并且使用熟悉的开源工具调试作业。