게시된 날짜: Jul 8, 2022
오늘, 뛰어난 모델 성능을 갖춘 ML 모델을 생성하기 위한 Amazon SageMaker Autopilot 실험이 최대 2배 더 빠르게 실행된다는 것을 발표하게 되어 기쁘게 생각합니다. Amazon SageMaker Autopilot은 데이터에 기반해 최상의 기계 학습 모델을 자동으로 구축, 훈련 및 튜닝하는 동시에, 완전한 제어와 가시성을 유지 관리하는 로우 코드 기계 학습(ML) 제품입니다. 그러나 데이터 세트 크기가 증가함에 따라 모델 훈련 및 튜닝은 컴퓨팅 비용이 많이 들 수 있습니다.
오늘부터 SageMaker Autopilot은 제로샷 하이퍼 파라미터 초기화 방법과 ml.m5.12xlarge 인스턴스(48vCPU, 192GiB 메모리)를 사용하여 필요한 기본 시도 횟수를 250에서 100으로 줄이는 데 도움이 됩니다. 결과적으로 SageMaker Autopilot 실험이 최대 2배 빠르게 완료되어 최고 성능의 ML 모델을 제공합니다. 성능 개선을 평가하기 위해 0.5MB에서 1GB에 이르는 다양한 크기의 여러 OpenML 벤치마크 데이터 세트를 사용했습니다. 저희 결과에 따르면 소규모 데이터 세트(< 100MB)에서는 전체 Autopilot 작업 런타임이 최대 45%(평균 230분에서 120분으로) 향상된 반면, 중간(> 100MB < 1GB) 및 대규모 데이터 세트(> 1GB)에서는 런타임이 각각 40%(평균 540분에서 430분으로) 향상되었습니다. 이러한 개선 사항을 통해 기존 작업 구성을 변경하지 않고도 SageMaker Autopilot 실험을 더 빠르게 실행할 수 있습니다.
SageMaker Autopilot에 대한 자세한 내용은 SageMaker Autopilot 제품 페이지 및 설명서를 참조하세요.