Apache Spark 系譜現已在 Amazon SageMaker Unified Studio 中針對以 IDC 為基礎的網域推出
張貼日期:
2026年2月4日
Amazon SageMaker 宣佈在以 IDC 為基礎的網域中,SageMaker Unified Studio 現已推出資料沿襲功能,可用於追蹤在 Amazon EMR 與 AWS Glue 上執行的 Apache Spark 作業。資料沿襲可提供您識別複雜問題根本原因,以及了解變更影響所需的資訊。
此功能支援擷取在 EMR-EC2、EMR-Serverless、EMR-EKS 與 AWS Glue 中執行 Spark 時,資料資產與資料欄位的結構描述與轉換之系譜。接著,您可以在 SageMaker Unified Studio 中以圖形方式將此系譜視覺化呈現為圖表,或使用 API 進行查詢。您也可以使用系譜來比較 Spark 作業歷史記錄中的轉換。
Spark 系譜可在所有現有的 SageMaker Unified Studio 區域中使用。如需了解如何使用這些新功能開始使用系譜的詳細資訊,請參閱文件。