Amazon SageMaker 資料目錄現在會將資產中繼資料匯出為可查詢的資料集

張貼日期: 2025年12月2日

Amazon SageMaker Catalog 現在可透過 Amazon S3 Tables,將資產中繼資料匯出為 Apache Iceberg 資料表。這使資料團隊能查詢目錄清單,並使用標準 SQL 回答問題,例如「上個月註冊了多少資產?」、「哪些資產分類為機密?」或「哪些資產缺少業務描述?」,而無須建置自訂的 ETL 報表基礎結構。

此功能會自動將目錄資產中繼資料轉換為可查詢的資料表,可從 Amazon Athena、SageMaker Unified Studio 筆記本、AI 代理程式及其他分析與 BI 工具存取。匯出的資料表包含技術中繼資料 (如 resource_id、resource_type)、業務中繼資料 (如 asset_name、business_description)、擁有權詳細資訊以及時間戳記。資料會依 snapshot_date 進行分區,以支援時間旅行查詢,並會自動顯示於 SageMaker Unified Studio 的 aws-sagemaker-catalog 儲存貯體中。

此功能已在所有支援 SageMaker Catalog 的 AWS 區域推出,且不需額外付費。您只需支付基礎服務的費用,包括 S3 Tables 儲存空間與 Amazon Athena 查詢。您可以透過在匯出資料表上設定保留政策,控制儲存成本,自動移除超過您指定期間的舊記錄。

若要開始使用,請透過 AWS CLI 啟用資料集匯出,然後在 24 小時內透過 S3 Tables 或 SageMaker Unified Studio 的資料索引標籤存取資產資料表。使用 Amazon Athena、Studio 筆記本查詢,或透過 S3 Tables Iceberg REST 資料目錄端點連接外部 BI 工具。如需操作說明,請參閱 Amazon SageMaker 使用者指南。