发布于: Oct 31, 2023

今天,我们很高兴地宣布,您可以在 EMR Serverless 应用程序上启用交互式分析。除 EMR on EC2 集群和 EMR on EKS 虚拟集群之外,此次发布还允许您选择 EMR Serverless 应用程序作为计算,以便从 EMR Studio 工作区运行 Jupyterlab notebook。Amazon EMR Studio 是一个集成式开发环境 (IDE),数据科学家和数据工程师可以在该环境中轻松地开发、可视化和调试以 PySpark、Python 和 Scala 编写的分析应用程序。Amazon EMR Serverless 是 Amazon EMR 的无服务器选项,可让运行 Apache Spark 等开源大数据分析框架,而无需配置、管理和扩展集群或服务器。

即日起,您可以启用 EMR Serverless 应用程序在 EMR Studio 中执行交互式分析。启用后,您可以直接从 EMR Studio 工作区连接到 EMR Serverless 应用程序。现在,您无需管理集群即可使用内置的 SparkMagic Jupyter notebook 以交互方式查询、浏览和可视化数据,并运行 Spark 工作负载。您可以直接从 notebook 中启动实时 Spark UI 以访问日志并调试应用程序。

此功能已在支持 EMR Studio 和 EMR Serverless 的所有区域中的 EMR 发行版本 6.14 及更高版本中正式发布。有关更多信息,请参阅 EMR 文档