Amazon SageMaker

기계 학습 모델을 대규모로 구축, 교육 및 배포

Amazon SageMaker는 개발자 및 데이터 과학자가 어떠한 규모의 기계 학습 모델이든 쉽고 빠르게 구축, 교육 및 배포할 수 있도록 지원하는 완전관리형 플랫폼입니다. Amazon SageMaker는 기계 학습을 사용하려는 개발자가 일반적으로 빠른 속도를 내지 못하게 하는 모든 장벽을 제거합니다.

기계 학습은 모델을 구축 및 교육한 후 프로덕션에 배포하는 프로세스가 너무 복잡하고 시간이 오래 걸려 개발자 대부분이 실제보다 이를 훨씬 더 어렵게 느낍니다. 먼저, 데이터 세트 중 어떤 요소가 중요한지 알아내기 위해서는 교육 데이터를 수집하고 준비해야 합니다. 그런 다음, 사용할 알고리즘과 프레임워크를 선택해야 합니다. 접근 방식을 결정한 후에는 모델을 교육하여 예측하는 방법을 가르쳐야 하며 이를 위해서는 많은 컴퓨팅 리소스가 필요합니다. 그리고 최상의 예측을 제공하도록 모델을 튜닝해야 하는데, 이는 대개 지루한 수작업입니다. 완전히 교육된 모델을 개발하고 나면, 해당 모델을 애플리케이션에 통합하고 확장 가능한 인프라에 해당 애플리케이션을 배포해야 합니다. 이 모든 작업에는 상당한 전문 지식, 대규모 컴퓨팅 및 스토리지에 대한 액세스, 그리고 각 프로세스를 실험하고 최적화하는 데 드는 많은 시간이 필요합니다. 결국 개발자 대부분이 이를 무리라고 느끼는 것은 놀라운 일이 아닙니다.

Amazon SageMaker는 개발자가 이러한 각 단계를 성공적으로 완료하지 못하게 방해하는 복잡성을 없애줍니다. Amazon SageMaker에는 함께 또는 개별적으로 사용하여 기계 학습 모델을 구축, 교육 및 배포할 수 있는 모듈이 포함되어 있습니다.

Introducing Amazon SageMaker

작동 방식

구축

Amazon SageMaker는 교육 데이터에 빠르게 연결하고 애플리케이션을 위한 최상의 알고리즘과 프레임워크를 선택 및 최적화하는 데 필요한 모든 것을 제공함으로써 손쉽게 ML 모델을 구축하고 교육할 수 있는 상태로 만들어 줍니다. Amazon SageMaker에는 Amazon S3에 저장된 학습 데이터를 손쉽게 탐색하고 시각화할 수 있는 호스팅된 Jupyter 노트북이 포함되어 있습니다. S3에 있는 데이터에 바로 연결하거나 AWS Glue를 사용해 Amazon RDS, Amazon DynamoDB, Amazon Redshift에서 S3로 데이터를 이동하면 노트북에서 분석할 수 있습니다.

알고리즘을 선택할 수 있도록 돕기 위해 Amazon SageMaker에는 가장 일반적으로 사용하는 기계 학습 알고리즘 12가지가 미리 설치되어 있으며 어디서든 이들 알고리즘의 실행 성능의 최대 10배를 구현하도록 최적화되어 있습니다. Amazon SageMaker는 Docker 컨테이너에서 TensorFlow 및 Apache MXNet을 실행하도록 미리 구성되어 있습니다 프로덕션 환경에서 모델을 교육 또는 호스팅을 위해 Amazon SageMaker를 사용하기 전에 로컬 환경에 이러한 오픈 소스 컨테이너를 다운로드하고 Amazon SageMaker Python SDK를 사용하여 로컬 모드로 스크립트를 테스트 할 수 있습니다. 그뿐만 아니라 기존 보유 프레임워크를 사용할 수 있는 옵션도 주어집니다.

교육

Amazon SageMaker 콘솔에서 클릭 한 번으로 모델 학습을 시작할 수 있습니다. Amazon SageMaker는 사용자를 위해 기본 인프라를 모두 관리하고 교육 모델을 페타바이트 규모로 손쉽게 확장할 수 있으며, 교육 프로세스를 더 쉽고 빠르게 진행하기 위해 Amazon SageMaker는 가능한 최고의 정확성을 달성하도록 모델을 자동으로 튜닝할 수 있습니다.

배포

모델 교육과 조정이 끝나면, Amazon SageMaker를 통해 손쉽게 프로덕션에 배포하여 새 데이터에서 예측을 생성하기 시작할 수 있습니다(추론이라 불리는 프로세스). Amazon SageMaker는 다중 가용 영역 전체에 걸쳐 분산된 Amazon SageMaker ML 인스턴스의 Auto Scaling 클러스터에 모델을 배포하여 고성능과 고가용성을 모두 구현합니다. 또한 Amazon SageMaker에는 A/B 테스트 기능이 내장되어 있어 사용자가 최선의 결과를 내기 위해 모델을 테스트하고 여러 버전을 실험하는 데 도움이 됩니다.

Amazon SageMaker가 기계 학습의 부담을 덜어주므로 사용자는 기계 학습 모델을 쉽고 빠르게 빌드, 학습 및 배포할 수 있습니다.

이점

기계 학습으로 신속하게 프로덕션에 투입

Amazon SageMaker는 기계 학습 모델을 교육, 튜닝 및 배포하는 데 필요한 시간을 현격히 줄여줍니다. Amazon SageMaker는 모든 정교한 교육 및 튜닝 기법을 관리하고 자동화하므로, 모델을 신속하게 프로덕션에 투입할 수 있습니다.

원하는 프레임워크 또는 알고리즘 선택

Amazon SageMaker는 모든 기계 알고리즘 및 프레임워크를 지원하므로 사용자는 이미 익숙한 기술을 사용할 수 있습니다. Apache MXNet 및 TensorFlow가 사전에 설치되어 제공되며,  Amazon SageMaker는 내장된 다양한 고성능 기계 학습 알고리즘을 제공합니다. 다른 프레임워크 또는 알고리즘을 사용해 교육하고 싶다면, Docker 컨테이너로 이를 가져올 수 있습니다.

클릭 한 번으로 교육 및 배포

Amazon SageMaker를 사용하면 콘솔에서 클릭 한 번 또는 간단한 API 호출을 통해 모델 교육을 시작할 수 있습니다. 교육이 완료되고 모델을 배포할 준비가 되면, Amazon SageMaker 콘솔에서 클릭 한 번으로 이를 시작할 수 있습니다.

기존 워크플로와 손쉽게 통합

Amazon SageMaker는 이미 사용하고 있는 기존 ML 워크플로를 진행하면서 함께 또는 개별적으로 사용할 수 있는 3개의 모듈로 설계되었습니다.

교육된 모델에 간편하게 액세스

Amazon SageMaker는 어느 애플리케이션에서든 호출할 수 있는 HTTPS 엔드포인트를 제공하므로, 기계 학습 모델을 애플리케이션에 손쉽게 통합할 수 있습니다.

속도에 최적화됨

Amazon SageMaker는 TensorFlow 및 Apache MXNet의 최신 버전이 사전에 구성되어 있으며 NVIDIA GPU에서 최대 성능을 내는 CUDA9 라이브러리 지원합니다. NVIDIA Volta V100 GPU 기반의 Amazon SageMaker P3 인스턴스가 적용된 Amazon SageMaker를 사용하면 타의 추종을 불허하는 속도로 딥 러닝 모델을 교육할 수 있습니다.

SageMaker 고객

원하는 딥 러닝 프레임워크로 교육

Amazon SageMaker에서는 원하는 딥 러닝 프레임워크를 사용하여 모델을 교육할 수 있습니다. 선호하는 프레임워크 및 라이브러리(Caffe2, PyTorch, Microsoft Cognitive Toolkit(CNTK), Chainer 또는 Torch)와 함께 자체 Docker 컨테이너를 가져오기만 하면 Amazon SageMaker에서 모델을 교육할 기본 인프라를 관리합니다.

TensorFlow
Caffe2
Apache MXNet
Chainer
Keras
Torch
Gluon
Microsoft Cognitive Toolkit
PyTorch

사용 사례

광고 타게팅

Amazon SageMaker를 다른 AWS 서비스와 함께 사용하면 광고 투자 수익률을 최적화하는 데 도움이 됩니다. Amazon SageMaker는 온라인 광고를 좀 더 효과적으로 타게팅하도록 기계 학습 모델을 손쉽게 교육하고 배포할 수 있으므로 고객 참여율 및 전환율을 높일 수 있습니다. Amazon SageMaker의 서버리스 분산 환경에서 추천 시스템, 클릭률 예측, 고객 세그멘테이션 및 평생 가치 모델을 모두 교육할 수 있습니다. 모델은 구축이 완료되면, 지연 시간이 짧은 Auto-Scaling 엔드포인트에서 호스팅되거나 다른 실시간 입찰 시스템으로 전달될 수 있습니다.

신용 부도 예측

Amazon SageMaker를 사용하면 일반적인 기계 학습 문제인 신용 부도의 가능성을 좀 더 쉽게 예측할 수 있습니다. Amazon SageMaker는 Amazon Redshift, Amazon EMR 및 AWS Glue와 같은 기존 분석 프레임워크와 긴밀하게 통합되므로, 온라인 예측을 위해 대규모의 다양한 데이터 세트를 Amazon S3 데이터 레이크에 게시하고, 신속하게 변환한 후, 기계 학습 모델을 구축하고, 즉시 호스팅할 수 있습니다.

산업용 IoT 및 기계 학습

산업용 IoT 및 기계 학습은 장비 고장 또는 유지 보수 일정을 미리 준비하도록 실시간 예측을 지원하여 더 높은 수준의 효율성을 실현할 수 있습니다.  사전 예방적 유지 보수를 예측하거나 복잡한 기계 또는 산업 공정의 산출량을 최적화하기 위한 모델로서 물리적 자산, 프로세스 또는 시스템의 디지털 트윈 또는 복제본을 생성할 수 있습니다. 이 모델은 발생할 수 있는 변경 사항을 거의 실시간으로 '학습'하도록 지속적으로 업데이트할 수 있습니다.

공급망 및 수요 예측

Amazon SageMaker는 최대 규모의 전자 상거래 환경에서 모든 제품에 대한 개별 판매 예측을 개발하는 데 필요한 인프라와 알고리즘을 제공합니다. Amazon SageMaker는 시계열 및 제품 카테고리 데이터만으로도 계절적 변동, 추세, 제품 유사성을 발견하여 심지어 새로운 항목에 대해서도 정확한 예측을 제공합니다.

클릭률 예측

Amazon SageMaker는 XGboost 알고리즘의 단일 머신 및 분산 CPU 구현을 제공하며, 이는 다중 분류, 회귀 및 순위 사용 사례(광고 클릭률 예측 등)에 유용합니다. 클릭 예측 시스템은 거의 모든 온라인 광고 시스템의 핵심입니다. 소비자에게 최상의 경험을 제공하기 위해서는 최대한 가장 정확한 클릭률(CTR)을 예측하는 것이 중요하기 때문입니다. XGBoost 알고리즘을 사용하면 실시간 예측 변수를 실행하고 점수가 매겨진 예측 결과를 반환할 수 있습니다. 그런 다음 특정 광고주의 광고를 제공할지를 결정하고 디스플레이 광고의 CTR 예측 결과를 개선할 수 있습니다.

콘텐츠 품질 예측

Amazon SageMaker에는 텍스트 내 구조를 사전 처리 및 검색할 수 있는 몇 가지 도구가 있습니다. 해당 정보를 사용하여 콘텐츠 품질에 대한 예측을 수행합니다. 워드임베딩을 생성하여 대량의 텍스트에서 유사한 의미 체계 및 구문을 찾고, 유사한 단어를 함께 그룹화하여 희소성을 방지할 수 있습니다. 그런 다음 개별적으로 유사한 문서를 Amazon SageMaker의 고급 주제 모델로 클러스터링합니다. 마지막으로 차원을 축소하여 그룹화된 단어 데이터를 기반으로 클러스터별로 개별 분류 모델을 구축하여 문서를 적절히 조정해야 하는지 결정합니다.

Amazon SageMaker에 대해 자세히 알아보기

기능 페이지로 이동하기
구축할 준비가 되셨습니까?
Amazon SageMaker 시작하기