게시된 날짜: Dec 3, 2019
이제 Amazon SageMaker Autopilot을 상용 버전으로 사용할 수 있습니다. 이를 통해 Amazon SageMaker는 사용자가 지정한 테이블 형식 데이터와 대상 열을 사용하여 자동으로 모델을 교육하고 튜닝하면서 프로세스에 대한 완전한 가시성을 제공할 수 있습니다. Amazon SageMaker는 이름에서 알 수 있듯이 오토파일럿에 사용할 수 있으며 Amazon SageMaker Studio에서 한 번의 클릭을 통해 가장 높은 정확도로 모델을 배포하거나, 이를 의사 결정에 활용하여 지연 시간이나 모델 크기와 정확도를 절충할 수 있습니다.
대개의 경우 적절한 알고리즘 파라미터를 찾기 어려우며, 특정 데이터 세트에 어느 ML 알고리즘이 가장 적합한지 결정하는 것도 어렵습니다. 또한 좋은 ML 모델을 만들기 위해서는 데이터 정리나 전처리가 필요합니다. 이 작업은 시간이 많이 소요되며 고급 기계 학습 기술이 필요하기도 합니다. 이러한 문제 때문에 팀은 데이터를 정리하거나 전처리하는 대신 데이터 세트를 있는 그대로 사용하는 등의 해결 방법이나 편법을 취합니다. 결국 팀은 직면한 문제에 적합한 알고리즘이 아닌 사용하기 쉬운 알고리즘을 사용합니다. 그 결과, 기업은 원하는 모델 품질에 도달하는 데 어려움을 겪습니다. 또한 광범위한 ML 지식을 갖고 있는 데이터 과학자가 특정 문제, 특히 모델 크기와 지연 시간 제한이 있는 광고 제공이나 IoT와 같은 애플리케이션에 가장 적합한 ML 모델을 찾기 전에 많은 시간을 들여 여러 ML 모델을 실험해 봅니다.
Amazon SageMaker Autopilot은 이러한 전체 프로세스를 간소화하여 기계 학습을 더 쉽고, 빠르고, 투명하게 만듭니다. 이제 기계 학습에 대한 깊은 지식이 없어도 분류 및 회귀 모델을 만들 수 있습니다. 테이블 형식 데이터 세트를 제공하고 예측할 타겟 열을 선택하기만 하면 SageMaker Autopilot이 데이터 전처리기, 알고리즘 및 알고리즘 파라미터 설정을 조합하여 자동으로 기계 학습 솔루션을 탐색하고 가장 정확한 모델을 찾습니다. 사용자가 알고리즘을 직접 결정하는 대신 SageMaker Autopilot이 자동으로 기본적으로 지원되는 고성능 알고리즘 목록에서 적절한 알고리즘을 선택하고 이를 모두 평가합니다. 또한 SageMaker Autopilot은 최상의 모델 품질을 얻기 위해 자동으로 이러한 알고리즘에 여러 파라미터 설정을 사용해 봅니다. 이제 단 한 번의 클릭으로 최고의 모델을 프로덕션에 직접 배포하거나 여러 후보를 평가하여 정확도, 지연 시간 및 모델 크기와 같은 지표를 절충할 수 있습니다. SageMaker Autopilot이 모델 교육을 위해 알고리즘을 통해 데이터를 전달하기 전에 자동으로 여러 유형의 데이터 전처리기를 데이터에 적용하므로 데이터 정리에 대해 걱정할 필요가 없습니다.
Amazon SageMaker Autopilot은 현재 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(캘리포니아 북부), 미국 서부(오레곤), 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), 캐나다(중부), EU(프랑크푸르트), EU(아일랜드), EU(런던), EU(파리), EU(스톡홀름) AWS 리전에서 사용할 수 있습니다. SageMaker Autopilot에 대한 자세한 내용은 설명서 페이지를 참조하고, 모델 생성 태스크에 SageMaker Autopilot을 사용하는 방법은 블로그 게시물을 참조하십시오.