게시된 날짜: May 10, 2023
최고의 ML 모델을 자동으로 구축, 훈련 및 튜닝하는 로우 코드 기계 학습(ML) 서비스인 Amazon SageMaker Autopilot은 이제 앙상블 모드에서 가중치 기반 목표 지표를 사용한 훈련을 지원하고 8개의 추가 목표 지표도 지원합니다. 훈련 데이터 세트의 각 데이터 샘플에 가중치를 할당하면 모델의 학습을 개선하고 특정 클래스에 대한 편향을 줄이며 안정성을 높임으로써 전체 모델 성능을 향상시킬 수 있습니다.
일부 클래스의 데이터 샘플이 다른 클래스보다 훨씬 적은 불균형 데이터 세트로 훈련하는 경우, 해당 클래스에 더 높은 가중치를 할당하면 모델의 학습을 개선하고 다수 클래스에 대한 편향을 줄일 수 있습니다. 오늘부터 Autopilot 실험을 생성할 때 입력 데이터 세트에 가중치 열 이름을 전달할 수 있습니다. SageMaker Autopilot은 이러한 가중치 값을 사용하여 데이터 세트에 대해 학습하고 학습한 내용을 ML 모델을 훈련할 때 적용합니다.
이제 SageMaker Autopilot에서는 RMSE, MAE, R2, Balanced Accuracy, Precision, Precision Macro, Recall, Recall Macro(여기에 설명되어 있음)와 같은 8개의 추가 목표 지표도 지원합니다. 선택한 목표 지표는 훈련 중에 최적화되어 데이터에서 모델 파라미터 값에 대한 최상의 추정치를 제공합니다. 지표를 명시적으로 지정하지 않을 경우의 기본 동작은 회귀 분석에는 MSE를, 바이너리 분류에는 F1을, 다중 클래스 분류에는 Accuracy를 자동으로 사용하는 것입니다.
시작하려면 SageMaker Studio 콘솔에서 SageMaker Autopilot 실험을 생성하세요. 새로운 샘플 가중치 열 기능과 추가 목표 지표 세트를 사용하려면 최신 버전의 SageMaker Studio로 업그레이드하세요. 자세한 내용은 개발자 안내서와 제품 페이지를 참조하세요.