Amazon SageMaker、標準化を強化してデータガバナンスを改善するためのメタデータルールを発表
次世代の SageMaker では、広く採用されている AWS の機械学習と分析機能が統合されており、すべてのデータに一元的にアクセスできる統合されたエクスペリエンスを利用できます。Amazon SageMaker Lakehouse では一元的なデータアクセスがサポートされ、Amazon DataZone 上に構築された Amazon SageMaker Catalog では企業のセキュリティニーズを満たすカタログ機能とガバナンス機能を利用できます。
今回、Amazon SageMaker Catalog では、メタデータルールがサポートされるようになりました。これにより、組織はデータ公開ワークフローとサブスクリプションワークフローにメタデータ標準を適用できます。メタデータの用法を標準化することで、組織はコンプライアンスを改善し、監査への準備を強化し、より効率的で管理されたアクセスワークフローを実現できるようになります。
ドメイン所有者はメタデータルールを使用することで、データ利用者がアセットをカタログに公開するときやデータへのアクセスを要求するときに入力する必要がある、必須のメタデータフィールドを定義できます。例えば、金融サービス機関では、プロデューサーに対してデータを公開する前に分類するよう要求したり、コンシューマーに対してアクセスリクエストの一部としてプロジェクトの詳細とコンプライアンスの証拠を提供するよう要求したりできます。医療サービス提供者は、メタデータルールを使用してメタデータ標準を適用し、患者データに関する規制に準拠できます。
また、メタデータルールを使用すると、収集したメタデータを使用して、Amazon SageMaker の外部でアセットのサブスクリプションのカスタム承認ワークフローを作成することもできます。これにより、アクセス決定や自動実行が容易になります。
メタデータルールの使用を開始するには以下のドキュメントをご覧ください。