Amazon SageMaker Autopilot

완전한 가시성으로 기계 학습 모델 자동 생성

Amazon SageMaker Autopilot은 데이터에 기반해 최상의 기계 학습 모델을 자동으로 구축, 훈련 및 튜닝하는 동시에, 완전한 제어와 가시성을 유지 관리할 수 있습니다.

기계 학습(ML) 모델을 구축하려면 수동으로 피처를 준비하고 여러 알고리즘을 테스트하며 수백 개의 모델 파라미터를 최적화하여 데이터에 적합한 최상의 모델을 찾아야 합니다. 하지만 이 접근 방식에는 자세한 ML 전문 지식이 요구됩니다. 이러한 전문 지식이 없다면 자동화된 접근 방식(AutoML)을 사용할 수 있지만, 일반적으로 AutoML 접근 방식은 모델 예측에 대한 피처 영향은 거의 확인할 수 없습니다. 그 결과, 다시 생성할 수 없고 예측 방식을 학습할 수 없으므로 신뢰도가 떨어질 수밖에 없습니다.

Amazon SageMaker Autopilot은 ML 모델을 구축하는 과도한 부담을 없애주고, 데이터를 기반으로 최상의 ML 모델을 자동으로 구축, 훈련 및 튜닝시킬 수 있습니다. SageMaker Autopilot에서는 테이블 형식의 데이터 세트를 제공하고 예측할 대상 열을 선택하기만 하면 됩니다. 이때 데이터는 집 가격과 같은 숫자(회귀)이거나, 스팸인지 스팸이 아닌지와 같은 범주(분류)일 수 있습니다. SageMaker Autopilot은 여러 솔루션을 자동으로 탐색하여 최상의 모델을 찾습니다. 그러면 Amazon SageMaker Studio에서 한 번의 클릭으로 모델을 프로덕션에 직접 배포하거나 권장되는 솔루션에서 반복하여 모델 품질을 더 향상시킬 수 있습니다.

작동 방식

Amazon SageMaker Autopilot 작동 방식

주요 기능

자동 데이터 사전 처리 및 피처 엔지니어링

누락된 데이터가 있어도 Amazon SageMaker Autopilot을 사용할 수 있습니다. SageMaker Autopilot은 누락된 데이터를 자동으로 채우고, 데이터 세트의 열에 대한 통계 인사이트를 제공하며, 타임스탬프의 날짜 및 시간 정보와 같은 숫자가 아닌 열에서 정보를 자동으로 추출합니다.

자동 기계 학습 모형 선택

Amazon SageMaker Autopilot은 바이너리 분류, 다중 클래스 분류 또는 회귀와 같이 데이터에 가장 적합한 예측 유형을 자동으로 추론합니다. 그러면 SageMaker Autopilot이 점진적 부스팅 의사결정 트리, 딥 신경망 피드포워드, 로지스틱 회귀와 같은 고성능 알고리즘을 탐색하고, 이러한 알고리즘에 기반하여 수백 개의 모형을 훈련 및 최적화하여 데이터에 가장 적합한 모형을 찾습니다.

모형 리더보드

Amazon SageMaker Autopilot을 사용하면 데이터에 대해 자동으로 생성된 모든 기계 학습 모형을 검토할 수 있습니다. 정확도, 정밀도, 회수 및 곡선 아래 면적(AUC)과 같은 지표로 등급이 지정된 모델의 목록을 보고, 예측 시 피처 영향과 같은 모델 세부 정보를 검토하며, 사용 사례에 가장 적합한 모델을 배포할 수 있습니다.

자동 노트북 생성

Amazon SageMaker Autopilot에서 생성한 모든 모델에 대해 Amazon SageMaker Studio 노트북을 자동으로 생성하고 생성 방식에 대한 세부 정보를 심층 분석하고, 원하는 경우 이를 구체화하며, 나중에 언제라도 노트북에서 이를 다시 생성할 수 있습니다.

중요 기능

Amazon SageMaker Autopilot은 Amazon SageMaker Clarify에서 생성한 설명 가능한 보고서를 제공하므로 SageMaker Autopilot으로 생성된 모델이 예측을 수행하는 방법을 더 쉽게 이해하고 설명할 수 있습니다. 학습 데이터의 각 특성이 예측 결과에 어떻게 기여하는지 백분율로 파악할 수도 있습니다. 백분율이 높을수록 해당 기능이 모형의 예측에 더 큰 영향을 미치는 것입니다.

애플리케이션과 손쉬운 통합

Amazon SageMaker Autopilot Application Programming Interface(API)를 사용하여 모델을 쉽게 생성하고 데이터 분석 및 데이터 웨어하우징 도구와 같은 애플리케이션에서 바로 추론할 수 있습니다.

사용 사례

가격 예측

가격 예측 모델은 금융 서비스, 부동산, 에너지 및 공익 사업에서 주가, 부동산 및 천연자원의 가격을 예측하는 데 많이 사용됩니다. Amazon SageMaker Autopilot은 수요, 계절별 추세 및 기타 상품의 가격과 같은 기록 데이터에 기반하여 건전한 투자 결정을 내리는 데 도움이 되도록 향후 가격을 예측할 수 있습니다.

이탈 예측

고객 이탈은 고객이나 클라이언트의 손실을 말하며, 모든 회사는 고객 이탈을 방지하는 방법을 모색하고 있습니다. Amazon SageMaker Autopilot에서 자동으로 생성되는 모델은 이탈 패턴을 파악하는 데 유용합니다. 이탈 예측 모델은 이탈할 가능성이 있는 고객을 예측할 수 있도록 먼저 기존 데이터에서 패턴을 학습하고 새 데이터 세트에서 패턴을 식별하여 작동합니다.

위험 평가

위험 평가를 수행하려면 개인, 자산 및 회사에 부정적인 영향을 미칠 수 있는 잠재적 이벤트를 식별하고 분석해야 합니다. Amazon SageMaker Autopilot에서 자동으로 생성되는 모델은 새로운 이벤트가 나타날 때 위험을 예측합니다. 위험 평가 모형은 비즈니스에 대한 예측을 최적화할 수 있도록 기존 데이터 세트를 사용하여 훈련됩니다.

고객

Skullcandy Inc.
"Amazon SageMaker Autopilot으로 구동되는 Sisense의 새로운 기계 학습 서비스는 이번 COVID-19 사태에 한 발 앞선 차별화된 고객 서비스를 지원하는 데 필요한 모든 기능을 제공합니다. Skullcandy는 고객 요구 사항에 대한 심층적 인사이트를 확보하고 문제 해결 능력을 개선하며 고객 만족도를 높일 수 있었습니다."

Mark Hopkins, Skullcandy Inc.의 CIO

Freddy’s
"이전에는 비슷해 보이는 두 개의 레스토랑을 선택했지만 이제는 메뉴 항목, 고객 및 위치 간의 관계를 제대로 이해할 수 있습니다. Domo의 새로운 ML 기능을 지원하는 Amazon SageMaker Autopilot 덕분에 마케팅 및 구매 팀은 보다 원활하고 효율적으로 새로운 아이디어를 시도하고 고객 경험을 개선할 수 있습니다."

Sean Thompson, Freddy’s의 IT 이사

Mobilewalla
"인구 매핑에서 기본적인 목표는 정확도와 규모 사이에서 최적화하는 것입니다. 일반적으로 이러한 최적화는 달성하기 어렵지만, 자사의 포괄적인 훈련 데이터와 정교한 피처와 함께 Amazon SageMaker Autopilot을 사용하여 예측 정확도를 137% 향상시킨 더 나은 모델을 생성할 수 있었습니다."

Anindya Datta, Mobilewalla의 CEO

RetentionX
"RetentionX는 전자 상거래 회사에 원클릭 비즈니스 인사이트를 제공합니다. 고객의 요구에 부응하기 위해서 고객이 빠르게 시작하고 비즈니스 의사 결정을 신속하게 내릴 수 있어야 하지만, 정확한 기계 학습 모델을 구축하려면 비용이 많이 들고 수개월의 시행착오를 거쳐야 할 수 있습니다. 또한 모델의 정확도는 각 고객에게 제공되는 고유한 기능 집합과 훈련 데이터의 범위와 깊이에도 크게 영향을 받습니다. Amazon SageMaker Autopilot의 도움으로 저희 고객은 고유한 데이터 집합을 기반으로 최고의 기계 학습 모델을 자동으로 생성할 수 있습니다. SageMaker Autopilot 덕분에 AutoML의 기능을 활용하는 수억 명의 쇼핑객에게 맞춤형 인사이트를 제공할 수 있습니다."

Alexander Jost, RetentionX의 CEO

Amazon SageMaker Autopilot에 대한 리소스

Amazon SageMaker Autopilot으로 높은 품질의 기계 학습 모형을 쉽고 빠르게 구축하기(31:39)

Amazon SageMaker Autopilot