IDC ベースのドメイン向けの Amazon SageMaker Unified Studio で Apache Spark リネージュが利用可能に
投稿日:
2026年2月4日
Amazon SageMaker は、IDC ベースのドメイン向けに、SageMaker Unified Studio で Amazon EMR および AWS Glue で実行される Apache Spark ジョブのデータリネージュの一般提供を開始しました。データリネージュは、複雑な問題の根本原因を特定し、変更の影響を理解するために必要な情報を提供します。
この機能は、EMR-EC2、EMR-Serverless、EMR-EKS、AWS Glue での Spark 実行から、スキーマのリネージュキャプチャ、およびデータアセットと列の変換をサポートします。このリネージュは、SageMaker Unified Studio でグラフとして視覚的に確認したり、API を使用してクエリを実行したりできます。また、リネージュを使用して、Spark ジョブの履歴全体の変換を比較することもできます。
Spark リネージュは、既存のすべての SageMaker Unified Studio リージョンで利用できます。これらの新機能を使用してリネージュを利用開始する方法の詳細については、ドキュメントを参照してください。