Amazon SageMaker Catalog 使用 AI 代理程式提供自動資料分類功能

張貼日期: 2025年11月30日

Amazon SageMaker Catalog 現在提供自動化資料分類功能,可在資料發佈期間建議商業詞彙表術語,從而減少進行手動標記的工作量,並改善組織間的中繼資料一致性。

此功能使用 Amazon Bedrock 的語言模型來分析表格中繼資料和結構描述資訊,以從組織商業詞彙表中建議相關術語。資料生產者會收到 AI 為其詞彙表中定義之商業術語產生的建議,其中包括功能術語和敏感資料分類 (例如 PII 和 PHI),使資料生產者得以輕鬆使用標準化詞彙來標記其資料集。生產者可以在發佈前接受或修改這些建議,從而確保跨資料資產的一致術語,並改善企業使用者對資料的可探索性。

自動化資料分類功能適用於 Amazon SageMaker 營運範圍內的美國東部 (維吉尼亞北部、俄亥俄)、美國西部 (奧勒岡)、亞太區域 (東京、首爾、新加坡、雪梨、孟買) 和歐洲 (法蘭克福、愛爾蘭、倫敦、巴黎)
AWS 區域。

若要著手使用,請前往 SageMaker Unified Studio 設定您的業務詞彙表,以產生商業詞彙表的建議。您也可以使用 AWS CLI 或 SDK,以程式設計方式管理詞彙表術語建議。
如需詳細資訊,請參閱 SageMaker Catalog 使用者指南