Amazon SageMaker Catalog は、アセットのメタデータのクエリ可能なデータセットとしてのエクスポートを開始

投稿日: 2025年12月2日

Amazon SageMaker Catalog は、Amazon S3 Tables を介してアセットのメタデータを Apache Iceberg テーブルとしてエクスポートするようになりました。これにより、カスタム ETL インフラストラクチャを構築することなく、標準 SQL を使用して「先月登録されたアセットはどれくらいか?」、「どのアセットが機密として分類されてるか?」、「事業内容が記載されていないアセットはどれか?」といった質問に対して、カタログインベントリへ直接クエリを実行できるようになります。

この機能は、カタログアセットのメタデータをクエリ可能なテーブルに自動的に変換し、Amazon Athena、SageMaker Unified Studio ノートブック、AI エージェント、その他の分析ツールや BI ツールからアクセスできるようにします。エクスポートされるテーブルには、テクニカルメタデータ (resource_id、resource_type など)、ビジネスメタデータ (asset_name、business_description など)、所有権の詳細、タイムスタンプが含まれます。データはタイムトラベルクエリ用に snapshot_date ごとに分割され、SageMaker Unified Studio の aws-sagemaker-catalog バケットの下に自動的に表示されます。

この機能は、SageMaker Catalog がサポートされているすべての AWS リージョンで追加料金なしで利用できます。S3 Tables ストレージや Amazon Athena クエリなど、基盤となるサービスに対してのみ支払いが発生します。エクスポートされるテーブルに保持ポリシーを設定して、指定した期間より古いレコードを自動的に削除することで、ストレージコストを管理できます。

使用を開始するには、AWS CLI を使用してデータセットのエクスポートを有効にし、その後 24 時間以内に S3 Tables または SageMaker Unified Studio の [データ] タブからアセットテーブルにアクセスしてください。クエリは、Amazon Athena、Studio ノートブックを使用するか、S3 Tables Iceberg REST Catalog エンドポイントを介して外部の BI ツールに接続することで実行できます。手順については、Amazon SageMaker ユーザーガイドをご覧ください。