Amazon SageMaker 노트북

데이터를 탐색하고 ML 모델을 구축하기 위한 완전관리형 노트북

클라우드에서 완전관리형 Jupyter Notebook을 사용하여 ML 개발을 빠르게 시작합니다.

업계에서 가장 다양한 클라우드용 컴퓨팅 최적화 및 GPU 가속 인스턴스 옵션을 사용하여 컴퓨팅 리소스를 스케일 업 또는 스케일 다운합니다.

같은 노트북을 함께 편집하면서 ML 수명 주기의 모든 단계에서 팀원들과 효율적으로 협업합니다.

Spark, NumPy, Scikit-learn 등 인기 있는 프레임워크 및 패키지를 최적화하는 솔루션을 활용하여 데이터에서 최대 2배 더 빠르게 인사이트를 도출합니다.

Amazon SageMaker는 데이터 탐색과 ML 모델 구축에 사용되는 두 가지 유형의 완전관리형 Jupyter Notebook(Amazon SageMaker Studio 노트북 및 Amazon SageMaker 노트북 인스턴스)을 제공합니다.

SageMaker Studio 노트북

Spark on Amazon EMR을 사용하여 페타바이트 규모의 데이터를 준비하는 것부터 모델을 훈련 및 디버깅하고 실험을 추적하고 모델을 배포 및 모니터링하고 파이프라인을 관리하는 것에 이르기까지, 전체 ML 개발 작업을 ML을 위한 완전 통합 개발 환경(IDE)인 Amazon SageMaker Studio에서 모두 지원하기 위해 SageMaker 및 기타 AWS 서비스의 목적별 ML 도구와 통합되는 빠른 시작을 위한 협업 노트북입니다. 작업을 중단하지 않고 컴퓨팅 리소스를 손쉽게 스케일 업하거나 스케일 다운합니다. 공유 가능한 링크를 사용하여 팀원들과 노트북을 손쉽게 공유하거나 단일 노트북을 동시에 함께 편집할 수 있습니다.

SageMaker Studio 노트북 시작하기

Amazon SageMaker Studio 노트북을 사용하여 대규모 ML 모델 구축(1:17)

Amazon SageMaker 노트북 인스턴스

Amazon SageMaker 콘솔에서 독립적으로 실행되는 완전관리형 Jupyter Notebook 인스턴스입니다. 가속 컴퓨팅을 위한 GPU를 비롯하여 클라우드에서 사용할 수 있는 가장 다양한 컴퓨팅 리소스 중에서 선택하고, 신뢰할 수 있는 최신 버전의 오픈 소스 소프트웨어로 작업합니다.

SageMaker 노트북 인스턴스 시작하기

차세대 SageMaker 노트북 소개(1:42)

작동 방식

  • SageMaker Studio 노트북
  • Amazon SageMaker Studio 노트북의 작동 방식
  • SageMaker 노트북 인스턴스
  • Amazon SageMaker 노트북의 작동 방식

주요 기능

SageMaker Studio 노트북

SageMaker 노트북 인스턴스

빠른 시작
Studio에서 빠르게 완전관리형 Jupyter Notebook에 액세스합니다. SageMaker Studio 노트북에는 AWS에 최적화된 TensorFlow 및 PyTorch용 딥 러닝 환경이 사전 구성되어 있어 모델 구축을 손쉽게 시작할 수 있습니다.

익숙한 Jupyter Notebook을 클라우드에서 제공
익숙하고 신뢰하는 Jupyter 및 JupyterLab Notebook을 완전관리형 SageMaker 서비스에서 사용합니다. 컴퓨팅 리소스를 설정하고, 데이터 과학 및 ML 패키지를 업그레이드하고, 보안 패치를 적용해야 하는 번거로움에서 벗어날 수 있습니다. SageMaker 노트북 인스턴스를 사용하면 최신 오픈 소스 소프트웨어로 컴퓨팅 환경을 안전하게 보호하면서 ML에만 전적으로 집중할 수 있습니다.

대규모 데이터 준비
데이터 엔지니어링, 분석 및 ML을 위한 통합 노트북 환경을 통해 데이터 워크플로를 간소화할 수 있습니다. SageMaker Studio 노트북에서 직접 Amazon EMR 클러스터 및 AWS Glue 대화형 세션을 생성하고 찾아보고 연결할 수 있습니다. 노트북에서 바로 Spark UI와 같은 익숙한 도구를 사용하여 Spark 작업을 모니터링하고 디버깅할 수 있습니다. Amazon SageMaker Data Wrangler로 구동되는 기본 제공 데이터 준비 기능을 노트북에서 직접 사용하여 데이터를 시각화하고, 데이터 품질 문제를 식별하며, 권장 솔루션을 적용하여 코드 작성 없이 데이터 품질 및 모델 정확성을 개선할 수 있습니다.

AWS의 성능과 규모 활용
최적화된 성능으로 사전 패키징된 AWS의 데이터 과학 및 ML 프레임워크를 활용하여 데이터에서 인사이트를 도출하기 걸리는 시간을 단축할 수 있습니다. 업계에서 가장 다양한 클라우드용 컴퓨팅 최적화 및 GPU 가속 인스턴스 옵션 중에서 선택하여 리소스를 확장합니다. 내장된 SageMaker Python SDK를 사용하여 SageMaker에서 모델을 훈련하고 배포합니다. Amazon CloudWatch에서 Jupyter 로그를 가져와 이벤트와 지표를 추적하고 악의적인 행동을 감지하고 경보를 설정하고 사용 패턴을 파악합니다.

Elastic Compute
작업을 중단하지 않고 기본 컴퓨팅 리소스를 스케일 업하거나 스케일 다운하고, 공유 영구 스토리지를 사용하여 컴퓨팅 환경을 전환할 수 있습니다. 가장 강력한 ML용 GPU 인스턴스를 비롯하여 AWS에서 제공하는 다양한 컴퓨팅 리소스 중에서 선택할 수 있습니다.

영감을 얻으세요
구축 방법에 대한 아이디어가 필요하세요? 노트북 인스턴스에는 SageMaker를 사용하여 ML 솔루션을 적용하는 방법을 보여주는 코드와 함께 SageMaker에서 제공하는 200여개의 예제 노트북이 포함되어 있습니다.

노트북 코드를 프로덕션 환경에 적용 가능한 작업으로 자동 변환
노트북을 선택하면 SageMaker Studio 노트북이 전체 노트북의 스냅샷을 자동 생성하고 해당하는 종속성을 컨테이너로 패키지합니다. 그런 다음 인프라를 구축하고 실무자가 설정한 일정에 따라 노트북을 자동 작업으로 실행한 후 작업이 완료되면 인프라를 프로비저닝 해제합니다. 그러므로 노트북을 프로덕션 환경으로 이동하는 데 걸리는 시간을 몇 주에서 몇 시간으로 줄일 수 있습니다. 

팀을 위해 구축
AWS IAM Identity Center(AWS Single Sign-On의 후속 서비스)를 사용하여 팀원들의 SageMaker Studio 노트북 액세스 권한을 설정합니다. SageMaker Studio의 비용과 사용량을 플랫폼 관리자와 비즈니스 리더가 모니터링할 수 있는 별도의 환경을 만듭니다. 팀원들이 실시간으로 노트북을 읽고, 편집하고, 실행할 수 있는 공유 공간을 만들어 손쉽게 협업하고 커뮤니케이션할 수 있도록 합니다. 팀원들이 정보를 서로 주고받지 않고도 결과를 함께 검토하면서 모델 성능을 즉시 파악할 수 있습니다. BitBucket 및 AWS CodeCommit과 같은 서비스를 기본적으로 지원하므로 팀원들이 다양한 노트북 버전을 손쉽게 관리하고 시간 경과에 따른 변화를 비교할 수 있습니다. 모든 리소스가 자동으로 태깅되므로 AWS Budgets 및 AWS Cost Explorer와 같은 도구를 사용하여 비용을 모니터링하고 예산 계획을 수립할 수 있습니다.

사용자 지정 가능
사용자 지정 도커 이미지를 사용하여 자신만의 노트북 개발 환경을 SageMaker Studio로 가져올 수 있습니다. 수명 주기 구성을 사용하여 팀에 맞게 노트북 환경을 자동화하고 사용자 지정할 수 있습니다. 예를 들어 사용자 지정 패키지 및 노트북 확장 기능을 설치하고, 데이터 세트를 사전 로드하고, 사용하지 않는 인스턴스를 자동으로 종료할 수 있습니다.

고객

AstraZeneca

Amazon SageMaker Studio를 통해 AstraZeneca는 대량의 데이터를 분석하는 솔루션을 신속하게 배포할 수 있었고, 데이터 사이언티스트의 수동 워크로드를 줄이면서 인사이트를 향상시킬 수 있었습니다. 이는 전 세계 사람들의 삶을 변화시키는 의약품을 탐색하고 개발하는 AstraZeneca의 임무에 중요했습니다.

많은 수동 프로세스를 생성하는 대신, Amazon SageMaker Studio 내에서 간단하게 대부분의 기계 학습 개발 프로세스를 자동화할 수 있습니다."라고 말합니다.

Cherry Cabading, AstraZeneca 글로벌 수석 엔터프라이즈 아키텍트

사례 연구 읽기

Vanguard
"이제 Vanguard 데이터 사이언티스트와 데이터 엔지니어가 단일 노트북에서 분석 및 기계 학습과 관련한 협업을 진행할 수 있게 되어 기쁩니다. Amazon SageMaker Studio에 Amazon EMR에서 실행되는 Spark, Hive 및 Presto와의 통합 기능이 내장되어 있는 만큼, 개발 팀의 생산성이 개선될 것으로 기대됩니다. 우리 팀은 이 단일 개발 환경에서 기계 학습 모델을 구축하고 훈련하고 배포하는 데 집중할 수 있습니다."

Doug Stewart, Vanguard 데이터 및 분석 담당 상무 이사

Provectus
"저희는 고객이 Amazon SageMaker Studio 노트북에서 직접 Spark, Hive 및 Presto 워크플로를 실행할 수 있도록 Amazon SageMaker Studio에서 직접 Amazon EMR 클러스터를 생성하고 관리하도록 지원하는 기능이 제공되기를 기다려왔습니다. 이제 Amazon SageMaker에 이 기능이 기본적으로 내장되어 Spark 및 기계 학습 작업의 관리가 간소화되어 기쁩니다. 이는 고객의 데이터 엔지니어와 데이터 사이언티스트가 보다 효과적으로 협업하면서 대화형 데이터 분석을 수행하고 EMR 기반 데이터 변환을 통해 기계 학습 파이프라인을 개발하는 데 도움이 될 것입니다."

Stepan Pushkarev, Provectus CEO

자습서 시작하기

Amazon SageMaker를 사용하여 추론 모델을 배포하려면 이 단계별 자습서를 따르세요.

자세히 알아보기 
Amazon Pinpoint 시작하기 자습서
자습형 워크숍 사용해 보기

이 실습에서 Amazon SageMaker를 사용하여 기계 학습 모델을 구축, 훈련 및 배포하는 방법을 알아보세요.

자세히 알아보기 
콘솔에서 구축 시작

AWS Management Console에서 Amazon SageMaker를 사용하여 구축을 시작하세요.

로그인