Amazon SageMaker 오토 파일럿

완전한 가시성으로 기계 학습 자동 생성

Amazon SageMaker 오토 파일럿은 데이터에 기반해 분류 또는 회귀를 위해 최상의 기계 학습 모델을 자동으로 학습 및 튜닝하는 동시에, 완전한 제어와 가시성을 유지 관리할 수 있습니다.

ML(기계 학습) 모델을 구축하려면 기존에는 두 가지 방법 중에서 선택해야 했습니다. 하나는, 수동으로 기능을 준비하고 알고리즘을 선택한 후에 모델 설계를 완전히 제어하기 위해 모델 파리미터를 최적화하고 생성 단계에 반영할 모든 아이디어를 파악하는 방법입니다. 하지만 이 접근 방식에는 자세한 ML 전문 지식이 요구됩니다. 다른 방법은, 이러한 전문 지식이 없는 경우 모든 힘든 일을 처리하는 모델을 생성하는 자동화된 접근 방식(AutoML)을 사용하는 것입니다. 하지만 이 방식은 모델이 생성되는 방식에 대한 가시성을 거의 제공하지 않습니다. AutoML에서 생성된 모델도 원활하게 작동할 수 있지만, 신뢰도는 낮을 수 있습니다. 이 모델에 반영된 개념을 이해할 수 없으므로 다시 생성할 수 없고, 나중에 도움이 되는 모범 사례로 학습할 수 없기 때문입니다.

Amazon SageMaker 오토 파일럿을 사용하면 이러한 선택의 제약을 없애고, 성능에 영향을 주지 않고도 자동으로 기계 학습 모델을 구축할 수 있습니다. SageMaker 오토 파일럿에서는 테이블 형식의 데이터 세트를 제공하고 예측할 대상 열을 선택합니다. 이때 데이터는 집 가격과 같은 숫자(회귀)이거나, 스팸인지 스팸이 아닌지와 같은 카테고리(분류)일 수 있습니다. SageMaker 오토 파일럿은 여러 솔루션을 자동으로 탐색하여 최상의 모델을 찾습니다. 그러면 Amazon SageMaker Studio에서 한 번의 클릭으로 모델을 프로덕션에 직접 배포하거나 권장되는 솔루션에서 반복하여 모델 품질을 더 향상시킬 수 있습니다.

작동 방식

작동 방식 - 오토 파일럿

이점

빠르게 높은 품질의 모델 생성

초기 반복 세트 이후 Amazon SageMaker 오토 파일럿은 SageMaker Studio에서 성능별로 등급이 지정된 모델의 리더보드를 생성합니다. 데이터에서 각 모델이 사용하는 기능을 보고 사용 사례에 가장 적합한 모델을 배포할 수 있습니다.

가시성 및 제어 유지 관리

모델을 생성하는 프로세스는 완전히 자동화됩니다. Amazon SageMaker 오토 파일럿이 생성하는 모든 모델에 대해 Amazon SageMaker 노트북을 자동으로 생성할 수 있습니다. 그러면 생성 방식에 대한 세부 정보를 탐색하고 원하는 경우 이를 구체화한 후 나중에 언제라도 노트북에서 이를 다시 생성할 수 있습니다.

용이한 배포

배포할 모델을 선택하면 Amazon SageMaker 오토 파일럿은 한 번의 클릭으로 추론 파이프라인을 생성합니다. 추론 파이프라인은 배치 추론을 위해 직접 사용하거나 실시간 추론을 위해 완전관리형 SageMaker 엔드포인트에 이를 배포할 수 있습니다.

사용 사례

가격 예측

가격 예측은 금융 서비스, 부동산, 에너지 및 공익 사업에서 주가, 부동산 및 천연자원의 가격을 예측하는 데 많이 사용됩니다. Amazon SageMaker 오토 파일럿은 수요, 계절별 추세 및 기타 상품의 가격과 같은 기록 데이터에 기반하여 건전한 투자 결정을 내리는 데 도움이 되도록 향후 가격을 예측할 수 있습니다.

이탈 예측

고객 이탈은 고객이나 클라이언트의 손실을 말하며, 모든 회사는 고객 이탈을 방지하는 방법을 모색하고 있습니다. Amazon SageMaker 오토 파일럿에서 자동으로 생성되는 모델은 이탈 패턴을 파악하는 데 유용합니다. 이탈 예측 모델은 이탈할 가능성이 있는 고객을 예측할 수 있도록 먼저 기존 데이터에서 패턴을 학습하고 새 데이터 세트에서 패턴을 식별하여 작동합니다.

위험 평가

위험 평가를 수행하려면 개인, 자산 및 회사에 부정적인 영향을 미칠 수 있는 잠재적 이벤트를 식별하고 분석해야 합니다. Amazon SageMaker 오토 파일럿에서 자동으로 생성되는 모델은 새로운 이벤트가 나타날 때 위험을 예측합니다. 위험 평가 모델은 비즈니스에 대한 예측을 최적화할 수 있도록 기존 데이터 세트를 사용하여 학습합니다.