게시된 날짜: Dec 1, 2021
Amazon SageMaker는 이제 고객이 ML 워크플로 전체에서 데이터, 기능, 모델과 같은 아티팩트의 계보를 추적하고 쿼리할 수 있도록 지원하는 향상된 기계 학습(ML) 계보 추적 기능을 제공합니다. 이제 고객은 단일 쿼리를 통해 데이터 준비에서 모델 배포에 이르기까지 워크플로 전체에 걸친 포괄적인 계보 그래프를 검색할 수 있습니다. 이 기능은 계보 정보를 한 번에 한 워크플로 단계에서 검색하고 모두 함께 수동으로 연결하는 데 필요한 획일적이고 번거로운 작업을 제거합니다. 또한 고객은 단계를 중심점으로 정의하고 해당 중심점의 업스트림 또는 다운스트림에 있는 단계의 계보를 쿼리함으로써 워크플로 세그먼트의 계보 정보를 검색할 수도 있습니다. 예를 들어 고객은 모델을 중심 엔터티로 정의하고 해당 모델을 훈련하기 위해 추출된 기능이 있는 원시 데이터 집합의 위치를 검색할 수 있습니다.
또한 새로운 기능을 사용하면 여러 AWS 계정에 걸쳐 있는 워크플로 단계의 계보 정보를 추적할 수 있습니다. 다양한 페르소나(데이터 사이언티스트, ML 엔지니어 등)에 대해 여러 계정을 생성하여 조직의 모든 리소스를 구성하는 것은 일반적인 DevOps 방식입니다. 이 기능을 활성화하기 위해 고객은 AWS RAM을 사용하여 AWS 계정 간에 계보 리소스를 공유할 수 있습니다. AWS RAM은 운영 오버헤드를 줄이도록 지원하며 공유 리소스에 대한 가시성을 제공합니다. 구성이 완료되면 고객은 계보 쿼리 API를 사용하여 여러 AWS 계정에 걸쳐 있는 다양한 아티팩트 간의 관계를 추적할 수 있습니다.
ML 계보 정보를 사용하여 모델 거버넌스를 개선하거나 이전 버전의 아티팩트를 재현하거나 워크플로 문제를 더 효율적으로 해결할 수 있습니다. 시작하려면 SageMaker Studio 또는 SDK를 사용하여 새 ML 모델을 훈련하고 계보 쿼리 API를 사용하여 계보 정보를 추적하세요. 자세히 알아보려면 교차 계정 그래프 기반 계보 추적 및 계보 쿼리 API에 대한 문서 페이지를 참조하세요.