게시된 날짜: Nov 29, 2023

Amazon SageMaker의 새로운 스마트 선별 기능 평가판이 오늘 발표되었습니다. 이 기능은 훈련 데이터를 실시간으로 자동 검사 및 평가하여 가장 유익한 데이터 샘플만 선별적으로 학습합니다. 따라서 모델 훈련 시간과 비용이 최대 35%까지 감소합니다. 기존 데이터 파이프라인이나 훈련 스크립트를 변경하지 않고도 몇 분 내에 스마트 데이터 선별 기능 사용을 시작할 수 있습니다.

스마트 선별 기능은 훈련 중에 라이브 모델을 사용하여 수신 데이터 샘플을 분석합니다. 그런 다음 모델 학습 프로세스 개선에 도움이 되지 않으며 손실률이 낮은 샘플을 자동으로 폐기합니다. 즉, 스마트 선별 기능 사용 시에는 가장 유익한 데이터 샘플만 선별적으로 사용되므로 딥 러닝 모델 훈련 시간이 단축되며 비용도 감소합니다. SageMaker의 가속 GPU 인스턴스에서 PyTorch로 딥 러닝 모델 훈련을 진행하는 고객의 경우 훈련 시간을 35%까지 단축할 수 있습니다. 손실률이 비교적 낮은 샘플만 제외되므로 훈련 대상 모델의 정확도는 거의 또는 전혀 영향을 받지 않습니다. 스마트 선별 기능 사용을 시작하려면 관련 설명서를 참조하세요.