Amazon SageMaker Studio

기계 학습을 위한 완전한 IDE(통합 개발 환경)

단일 웹 기반 시각적 인터페이스에서 가장 포괄적인 도구 세트에 액세스하여 원시 데이터 준비부터 기계 학습 모델 배포 및 모니터링에 이르기까지 모든 기계 학습 개발 단계를 수행할 수 있습니다.

기계 학습 수명 단계에서 신속하게 전후로 이동하여 모델을 세부적으로 조정할 수 있습니다. SageMaker Studio에서 나가지 않고 훈련 실험을 재연하고, 모델 기능 및 다른 입력을 조정하고, 결과를 비교할 수 있습니다.

많이 사용되는 150개 이상의 오픈 소스 모델 및 15개 이상의 사전 구축된 솔루션을 사용하여 몇 분 만에 기계 학습 모델을 구축할 수 있습니다. 클릭 몇 번으로 자체 데이터를 사용해 기계 학습 모델을 생성하세요.

Amazon SageMaker Studio는 데이터 준비부터 기계 학습 모델 구축, 훈련, 배포에 이르기까지 모든 기계 학습(ML) 개발 단계를 수행하기 위해 목적별 도구를 이용할 수 있는 단일 웹 기반 시각적 인터페이스를 제공하는 IDE(통합 개발 환경)이며, 데이터 과학 팀의 생산성을 최대 10배 향상시킵니다. Studio에서 나가지 않고도 신속하게 데이터를 업로드하고, 새로운 노트북을 생성하며, 모델을 훈련 및 튜닝하고, 단계를 전후로 이동하며 실험을 조정하고, 모델을 프로덕션에 배포할 수 있습니다.

Amazon SageMaker(1:38)

작동 방식

Amazon SageMaker Studio의 작동 방식

주요 기능

데이터 준비

코드 없이 또는 코드를 조금만 사용하여 클릭 몇 번으로 데이터 준비

Studio 내에서 SageMaker Data Wrangler를 사용하여 클릭 몇 번으로 데이터 소스에 연결하고, 데이터 품질을 검증하고, 300개 넘는 내장 데이터 변환을 사용하여 모델 기능을 엔지니어링하고, SageMaker 특성 저장소에 저장할 수 있습니다.

SageMaker Studio Notebooks를 사용하여 데이터 준비

SageMaker Studio Notebooks에서 직접 Amazon EMR 클러스터를 생성, 검색, 연결할 수 있습니다. 노트북에서 바로 Spark UI와 같은 익숙한 도구를 사용하여 Spark 작업을 디버깅할 수도 있습니다.

클릭 몇 번으로 데이터 처리

Studio 내의 SageMaker Processing을 통해 데이터 스토어에 연결하고, 데이터 처리 작업을 실행하기 위한 리소스를 구동하며, 영구 스토리지에 출력을 저장하고, 로그 및 지표를 제공할 수 있습니다.

중앙 특성 저장소

Studio에서 완전관리형 목적별 리포지토리인 SageMaker 특성 저장소를 사용하여 훈련 및 추론을 위한 기계 학습 모델 특성을 저장, 공유 및 관리하여 기계 학습 애플리케이션 전체에서 특성 재사용을 촉진할 수 있습니다. 훈련 및 추론 중에 모두 동일한 특성을 일관되게 가져올 수 있어서 수개월의 개발 작업을 줄일 수 있습니다.

구축

Amazon SageMaker Studio Notebooks를 빠르게 시작

Studio에서 클릭 한 번으로 완전관리형 Jupyter Notebook에 액세스하세요. SageMaker Studio Notebooks에는 AWS에 최적화된 TensorFlow 및 PyTorch용 딥 러닝 환경이 사전 구성되어 있어 모델 구축을 빠르게 시작할 수 있습니다. 작업을 중단하지 않고 기본 컴퓨팅 리소스에 쉽게 다이얼 업 또는 다이얼 다운할 수 있습니다.

협업할 수 있는 Amazon SageMaker Studio Notebooks

클릭 한 번으로 SageMaker Studio Notebook을 공유하면 동료들이 모든 출력을 통해 쉽게 복제할 수 있는 동일한 노트북을 얻을 수 있습니다.

기본 제공 알고리즘

추론을 빠르게 훈련하고 실행하는 데 사용할 수 있는 사전 구축된 컨테이너 이미지에서 사용 가능한 15개 이상의 기본 제공 알고리즘을 사용하거나 자체 사용자 지정 이미지를 Studio로 가져올 수 있습니다.

AutoML

Studio에서 SageMaker Autopilot을 사용하여 완벽한 제어와 가시성을 유지하면서 데이터를 기반으로 최상의 기계 학습 모델을 자동으로 구축, 훈련 및 튜닝할 수 있습니다. 그런 다음 클릭 한 번으로 모델을 직접 프로덕션으로 배포하거나 생성된 노트북을 사용하여 모델 품질을 개선할 수 있습니다.

사전 구축된 솔루션 및 오픈 소스 모델

Studio 내의 Amazon SageMaker JumpStart를 사용하면 클릭 몇 번으로 배포 가능한 사전 구축된 솔루션을 통해 기계 학습을 빠르게 시작할 수 있습니다. 또한 SageMaker JumpStart는 원클릭 배포와 널리 사용되는 150개 넘는 오픈 소스 모델의 세분화된 튜닝도 지원합니다.

훈련

분산 훈련

클릭 한 번으로 분산 컴퓨팅 클러스터를 설정하고, 훈련을 수행하며, 결과를 Amazon S3로 출력하고, 클러스터를 해체할 수 있습니다. Studio 내에서 SageMaker 데이터 병렬 라이브러리 및 모델 병렬 라이브러리를 사용하여 규모에 맞게 모델을 훈련하고, SageMaker Training Compiler를 사용한 그래프 수준 및 커널 수준 최적화를 통해 훈련 프로세스를 최대 50% 가속화할 수 있습니다. 관리형 스팟 인스턴스 훈련을 사용하여 비용을 최대 90% 줄일 수 있습니다.

실험 관리 및 추적

Studio 내의 SageMaker Experiments를 사용하여 입력 파라미터, 구성 및 결과를 캡처하고 이를 실험으로 저장하여 기계 학습 모델에 대한 반복을 추적할 수 있습니다. 활성 실험을 탐색하고, 이전 실험을 검색하며, 결과로 이전 실험을 검토하고, 실험 결과를 비교할 수 있습니다.

자동 모델 튜닝

모델이 생성할 수 있는 가장 정확한 예측에 도달하기 위해 수천 개의 알고리즘 파라미터 조합을 조정하여 모델을 자동으로 튜닝함으로써 몇 주가 소요되는 작업을 줄일 수 있습니다.

훈련 실행 디버깅 및 프로파일링

Studio 내의 SageMaker Debugger를 사용하면 실시간으로 지표를 캡처하고 훈련 작업을 프로파일링하므로 모델을 프로덕션에 배포하기 전에 성능 문제를 빠르게 수정할 수 있습니다.

배포 및 관리

손쉬운 배포

훈련된 모델을 클릭 한 번으로 프로덕션에 배포하세요. Studio 내의 SageMaker 모델 배포를 사용하여 짧은 대기 시간(몇 밀리초) 및 많은 처리량(초당 수십만 개의 추론 요청)에서 자연어 처리 및 컴퓨터 비전과 같은 사용 사례를 위한 장기 실행 추론에 이르기까지 모든 추론 요구 사항을 충족할 수 있습니다.

다중 모델 엔드포인트

Studio 내에서 SageMaker의 다중 모델 엔드포인트 및 다중 컨테이너 엔드포인트를 사용하여 수천 개의 모델을 단일 엔드포인트에 배포할 수 있으므로, 필요한 만큼 모델을 사용할 수 있는 유연성을 제공하면서 비용 효율성을 높일 수 있습니다.

모델 버전을 중앙에서 추적 및 관리

Studio 내의 SageMaker Model Registry를 사용하여 모델 버전, 메타데이터, 성능을 추적할 수 있으므로, 비즈니스 요구 사항에 따라 배포에 적합한 모델을 손쉽게 선택할 수 있습니다. 또한 감사 및 규정 준수에 대한 승인 워크플로를 자동으로 로깅할 수 있습니다.

프로덕션 애플리케이션의 새 모델을 신속하게 제공

Studio 내의 SageMaker Projects를 사용하여 개발 환경과 프로덕션 환경 간의 동등성 유지, 소스 및 버전 제어, A/B 테스트, 엔드 투 엔드 자동화와 같은 CI/CD 사례를 기계 학습으로 가져올 수 있습니다.

모델을 지속적으로 모니터링 및 재훈련

Studio 내의 SageMaker Model Monitor를 사용하면 모델 드리프트 및 개념 드리프트를 실시간으로 감지하여 품질을 유지할 수 있습니다. SageMaker에서 훈련된 모든 모델은 Studio에서 수집하고 볼 수 있는 주요 지표를 자동으로 생성합니다.

엔드 투 엔드 모델 구축 워크플로 자동화

Studio의 SageMaker Pipelines를 사용하여 데이터 준비, 특성 추출, 모델 훈련, 모델 튜닝, 모델 검증과 같은 전체 모델 구축 워크플로를 자동화할 수 있습니다. SageMaker Pipelines를 구성하여 일정한 간격으로 또는 특정 이벤트가 트리거될 때 자동 실행하거나 필요할 때 수동으로 실행할 수 있습니다.

책임감 있는 기계 학습 사용

Studio 내의 SageMaker Clarify를 사용하면 지정한 속성을 조사함으로써 데이터 준비 작업 동안, 모델 훈련 직후, 배포된 모델에서 잠재적인 바이어스를 감지하고 제한할 수 있습니다. 또한 Clarify는 이해관계자가 모델에서 예측을 수행하는 이유와 방법을 이해할 수 있도록 모델 설명 보고서도 제공합니다.

고객

AstraZeneca

SageMaker Studio를 통해 AstraZeneca는 대량의 데이터를 분석하는 솔루션을 신속하게 배포할 수 있었고, 데이터 사이언티스트의 수동 워크로드를 줄이면서 인사이트를 향상시킬 수 있었습니다. 이는 전 세계 사람들의 삶을 변화시키는 의약품을 탐색하고 개발하는 AstraZeneca의 임무에 중요했습니다.

“수동 프로세스를 많이 만들지 않고, Amazon SageMaker Studio 내에서 간단하게 대부분의 기계 학습 개발 프로세스를 자동화할 수 있습니다.”

Cherry Cabading, AstraZeneca 글로벌 수석 엔터프라이즈 아키텍트

Invista

INVISTA는 모델 추적을 위해 Studio 내의 Amazon SageMaker Experiments를 사용했습니다. 실험을 관리하기 쉬운 인터페이스를 통해 더 넓은 범위의 프로젝트를 가져오고 새 모델, 지표, 성능을 정형화된 방식으로 추가할 수 있으므로 INVISTA는 데이터 과학의 가치를 높였습니다.

"이제 Amazon SageMaker Studio를 사용하여 데이터 과학 업무를 코로케이션할 수 있습니다. 이를 통해 인프라와 리포지토리 관리에 소요되는 시간을 절약할 수 있고 알고리즘과 분석 프로젝트를 프로덕션에 배포하는 시간을 줄이는 데 도움이 됩니다."

Tanner Gonzalez, INVISTA 분석가 겸 클라우드 리더

SyntheticGestalt

SyntheticGestalt는 SageMaker Studio 및 Experiments를 통해 최상의 실험 설정을 2배 더 빠르게 결정할 수 있으며, 이는 궁극적으로 삶을 변화시키는 후보 물질을 생산하는 능력을 향상시킵니다.

"SageMaker는 연구자들이 수천 가지의 실험 설정을 쉽게 비교하는데 도움이 됩니다. 이전에는 연구자들이 몇 시간씩 소비했지만 이제는 한 단계만으로 수행할 수 있습니다."

Kotaro Kamiya, SyntheticGestalt Ltd.의 CTO

리소스

웨비나

SageMaker Studio에 빠르게 온보딩

웨비나

SageMaker Studio 기술 심층 분석

웨비나

SageMaker와 함께 Apache Spark on Amazon EMR 사용

새로운 소식

최신 SageMaker Studio 공지 받기

블로그

SageMaker Studio 블로그 시리즈

워크숍

Amazon SageMaker Studio Notebooks를 사용하여 데이터 준비 확장

워크숍

Amazon SageMaker Studio Notebooks를 사용하여 기계 학습 모델 구축

자습서 시작하기

이 단계별 자습서에 따라 Amazon SageMaker Studio 내에서 기계 학습(ML) 모델을 로컬로 구축하고 훈련하세요.

자세히 알아보기 
Amazon Pinpoint 시작하기 자습서
자습형 워크숍 사용해 보기

이 실습에서 Amazon SageMaker를 사용하여 기계 학습 모델을 구축, 훈련 및 배포하는 방법을 알아보세요.

자세히 알아보기 
콘솔에서 구축 시작

AWS Management Console에서 Amazon SageMaker를 사용하여 구축을 시작하세요.

로그인