Amazon SageMaker Catalog、SageMaker Unified Studio に技術的な識別子の高精度な検索機能を追加
投稿日:
2025年4月9日
Amazon SageMaker Catalog は、次世代の Amazon SageMaker を支える機能の一つです。今回、列名やテーブル名などの技術的な識別子に対する完全一致と部分一致のタイプを備えた高度な検索機能をサポートするようになりました。この機能を使用すると、検索用語を二重引用符 (" ") などの修飾子で囲むことで、精度の高い検索を実行できます。これにより、技術名と完全に一致するか、部分的に一致するアセットをすばやく見つけることができます。例えば、アナリストは特定の列をより速く見つけることができ、データスチュワードは「audit_」などの命名パターンを使用してアセットを検証できます。また、エンジニアは「temp_」といったプレフィックスを使って一時テーブルを識別することができます。
この機能強化は、SageMaker Catalog の既存のキーワード検索とセマンティック検索を基にしており、複雑な命名規則を伴う大規模なデータカタログを管理する組織向けに設計されています。例えば、「customer_id」を検索すると、完全一致するアセットのみが返されますが、「sales_」のような検索では、sales_summary や sales_data_2024 などのアセットが返されます。これらの機能は、ユーザーが技術アセットをすばやく見つけ、エラーを減らすことでデータガバナンスを改善し、コラボレーションを強化するのに役立ちます。
サブスクリプションと公開ワークフローのメタデータルールを設定する方法の詳細については、製品ドキュメントをご覧ください。