게시된 날짜: Mar 28, 2018
이제 Amazon SageMaker에서 트레이닝 속도를 높이고 Linear Learner 알고리즘을 사용한 선형 회귀 분석 및 바이너리 분류 모델을 사용자 지정할 수 있는 새로운 기능을 활용할 수 있습니다.
Linear Learner를 향상시키기 위한 업데이트의 일환으로 Amazon SageMaker에 모델 튜닝 중에 검증 데이터 세트 제공 여부에 관계없이 자동으로 조기 중지하는 기능이 추가되었습니다. Linear Learner 알고리즘에 검증 데이터 세트를 제공할 경우 validation loss의 향상이 중지되면 모델 트레이닝이 중지됩니다. 검증 세트를 제공하지 않을 경우 training loss의 향상이 중지되면 모델 트레이닝이 중지되고 최상의 모델로 되돌려집니다.
또한 Linear Learner 하이퍼파라미터에 새로운 loss 함수를 사용하여 모델 트레이닝을 위한 Linear Learner 알고리즘을 사용자 지정하는 몇 가지 새로운 기능이 추가되었습니다. 이제 Amazon SageMaker에서 대부분의 회귀 문제에서 평균을 구하는 Squared Loss, 중앙값을 구하는 Absolute Loss, 예측을 위한 변위치 값(예: 분산의 0.9 변위치)을 구하는 Quantile Loss, Squared loss를 사용하지만 특이치 식별은 배제하는 트레이닝을 위한 Huber Loss, 허용 가능한 오류에 대한 임계값을 지정하는 Epsilon-Insensitive Loss, 바이너리 분류 문제를 위한 Logistic Regression, Support Vector Machine(SVM)이라고도 하며 바이너리 분류에 사용되는 Hinge Loss 등 8가지 새로운 loss 함수를 사용할 수 있습니다. 마지막으로, Linear Learner는 바이너리 분류 문제에서 매우 불균형한 트레이닝 데이터에 대해 클래스 가중치를 지정하는 기능도 지원합니다.
이러한 Amazon SageMaker의 새로운 기능은 현재 미국 동부(버지니아 북부), 미국 동부(오하이오), EU(아일랜드) 및 미국 서부(오레곤) AWS 리전에서 사용할 수 있습니다. 새로운 loss 함수를 비롯하여 Linear Learner의 향상된 기능에 대한 자세한 내용은 AWS Machine Learning 블로그를 참조하십시오.