Amazon SageMaker Catalog, SageMaker Unified Studio에 정확한 기술 식별자 검색 기능 추가

게시된 날짜: 2025년 4월 9일

Amazon SageMaker Catalog는 차세대 Amazon SageMaker의 일부로, 이제 컬럼명 및 테이블명과 같은 기술 식별자에 대해 정확히 일치 검색 또는 부분적으로 일치 검색과 같은 향상된 검색 기능을 지원합니다. 이 기능을 사용하는 사용자는 검색어를 큰따옴표(” “)와 같은 한정자로 감싸 정확한 검색을 수행할 수 있으며, 이를 통해 정확히 일치하거나 부분적으로 일치하는 기술 이름을 가진 자산을 빠르게 찾을 수 있습니다. 예를 들어 분석가는 특정 컬럼을 더 빠르게 찾을 수 있고, 관리자는 "audit_" 같은 명명 패턴을 사용하여 자산을 검증할 수 있으며, 엔지니어는 "temp_" 같은 접두사로 임시 테이블을 식별할 수 있습니다.

이번 향상된 기능은 SageMaker Catalog의 기존 키워드 및 시맨틱 검색 기능을 기반으로 구축되었으며, 복잡한 명명 규칙을 가진 대규모 데이터 카탈로그를 관리하는 조직을 위해 설계되었습니다. 예를 들어 'customer_id'를 검색하면 정확히 일치하는 자산만 반환되며, 'sales_'를 검색하면 sales_summary, sales_data_2024 등 접두사가 일치하는 자산이 반환됩니다. 이러한 기능은 기술 자산을 빠르게 찾을 수 있도록 도와주며, 오류를 줄여 데이터 거버넌스를 개선하고, 협업을 강화하는 데 기여합니다.

제품 설명서를 확인하면 구독 및 게시 워크플로에 대한 메타데이터 규칙을 설정하는 방법을 자세히 알아볼 수 있습니다.