Amazon SageMaker 融通式合作开发工作室现已在基于 IDC 的域中提供 Apache Spark 血统

发布于: 2026年2月4日

Amazon SageMaker 宣布在基于 IDC 的域的 SageMaker Unified Studio 中,面向在 Amazon EMR 和 AWS Glue 中执行的 Apache Spark 作业正式推出数据血统功能。数据血统可以为您提供所需的信息,来确定复杂问题的根本原因和了解变更影响。

此功能支持在 EMR-EC2、EMR-Serverless、EMR-EKS 和 AWS Glue 中捕获架构血统信息以及转换 Spark 执行中的数据资产和列。然后,您可以在 SageMaker Unified Studio 中以图表的形式直观地探索这个血统,或者使用 API 进行查询。您还可以使用血统来比较 Spark 作业历史记录中的转换。

Spark 血统在所有现有的 SageMaker Unified Studio 区域可用。有关如何使用这些新功能开始使用血统的详细信息,请参阅文档