Amazon SageMaker 融通式合作开发工作室现支持 Amazon EMR Serverless

发布于: 2026年6月9日

Amazon SageMaker 融通式合作开发工作室 Notebook 现在支持配备了 Apache Spark Connect 的 Amazon EMR Serverless,这使数据工程师和分析师在为交互式分析和数据工程工作负载选择 Spark 运行时方面拥有了更大的灵活性。除了 Amazon Athena Spark 外,用户现在还可以使用 Amazon EMR Serverless 作为其 Spark 运行时,并根据自身需求选择最合适的引擎。

此次发布后,您可以在 Notebook 单元格中,在 EMR Serverless Spark 应用程序上运行 PySpark 和 Spark SQL。用户可以从 Notebook 侧边栏选择 Spark 运行时,所选运行时将同时适用于 Python 和 SQL 单元格。此外,用户还可以利用内置的人工智能助手 SageMaker Data Agent,通过自然语言提示词生成代码和执行计划,从而加速基于 EMR Serverless 的 Spark 开发工作流。企业可利用预初始化的容量来缩短会话启动时间,同时借助跨所有受支持引擎的统一 Spark UI 监控功能,持续掌握作业执行和性能状况。此外,EMR Serverless 还为需要网络隔离的工作负载提供了 VPC 连接支持。

此功能已在所有提供 Amazon SageMaker 融通式合作开发工作室的 AWS 区域推出,同时支持 SageMaker 融通式合作开发工作室 Notebook 和 JupyterLab IDE 环境。要开始使用,请参阅 Amazon SageMaker 融通式合作开发工作室用户指南