Amazon SageMaker Catalog が AI エージェントを使用した自動データ分類を提供

投稿日: 2025年11月30日

Amazon SageMaker Catalog で、データ公開時にビジネス用語を提案する自動データ分類が可能になり、手作業によるタグ付けの手間が減り、組織間のメタデータの一貫性が向上しました。

この機能は、Amazon Bedrock の言語モデルを使用してテーブルメタデータとスキーマ情報を分析し、組織のビジネス用語集にある関連する用語を推奨します。データ制作者は、用語集で定義されているビジネス用語について、AI が生成した候補を受け取ります。これには、機能用語と、PII や PHI などの機密データ分類の両方が含まれるため、データセットに標準化された語彙を簡単にタグ付けできます。制作者は公開前にこれらの提案を受け入れたり修正したりできるため、データ資産全体で用語の一貫性が保たれ、ビジネスユーザーがデータを見つけやすくなります。

自動データ分類は、Amazon SageMaker が運用されている米国東部 (バージニア北部、オハイオ)、米国西部 (オレゴン)、アジアパシフィック (東京、ソウル、シンガポール、シドニー、ムンバイ)、欧州 (フランクフルト、アイルランド、ロンドン、パリ) の AWS リージョンで利用でき
ます。

使用を開始するには、SageMaker Unified Studio にアクセスして、ビジネス用語集の推奨用語を生成するようにビジネス用語集を設定します。AWS CLI または SDK を使用して、用語集の候補をプログラムで管理することもできます。
詳細については、SageMaker Catalog のユーザーガイドを参照してください。