데이터 사이언티스트를 위한 Amazon SageMaker

기계 학습 수명 주기를 위한 통합 개발 환경(IDE)

ml.t3.medium 월 250시간

AWS 프리 티어를 사용하여 처음 2개월 동안 Studio 노트북에서

정형 및 비정형 데이터 원본의 데이터에 액세스

목적별 도구로 생산성 향상

단 몇 번의 클릭으로 사용 가능한 완전관리형 Jupyter 노트북

작동 방식

데이터 과학은 비즈니스에 대한 의미 있는 인사이트를 추출하기 위한 데이터 연구로서, 무슨 일이 일어났는지, 왜 그런 일이 일어났는지, 무슨 일이 일어날지와 같은 질문을 하고 대답합니다. 기계 학습은 이를 통해 기존 분석이 규칙 기반 로직으로 쉽게 해결할 수 없는 문제를 머신에서 해결하는 것이 실용적이기 때문에 데이터 과학에 필수적입니다. 기계 학습은 데이터를 분석하고 예제에서 학습하여 패턴을 검색합니다. 그러면 머신이 패턴을 사용하여 알 수 없는 인스턴스를 인식할 수 있습니다. Amazon SageMaker는 데이터에 액세스 및 분석하고 고품질 기계 학습 모델을 구축, 훈련 및 배포하기 위해 수만 명의 고객이 사용하는 광범위한 기계 학습 기능을 제공합니다. 데이터 과학 팀은 Amazon SageMaker를 사용하여 생산성을 10배까지 높일 수 있습니다.

데이터 사이언티스트를 위한 Amazon SageMaker

준비

몇 분 안에 기계 학습 데이터 준비

SageMaker Data Wrangler의 데이터 선택 도구를 사용하면 여러 데이터 원본(예: Amazon Athena, Amazon Redshift, AWS Lake Formation, Amazon Simple Storage Service(S3), Amazon SageMaker 특성 저장소)에서 빠르게 데이터를 선택할 수 있습니다. 또한 데이터 원본에 대한 쿼리를 작성하고 다양한 파일 형식에서 SageMaker로 직접 데이터를 가져올 수 있으며, SageMaker Data Wrangler의 시각화 템플릿 및 기본 제공 데이터 변환 기능을 사용하여 준비된 데이터로 정확한 기계 학습 모델을 구축하도록 할 수 있습니다.

자세히 알아보기 »
몇 분 안에 기계 학습 데이터 준비

짧은 대기 시간의 특성 저장소

기계 학습 기능을 저장, 업데이트, 검색 및 공유하는 완전관리형 리포지토리인 SageMaker 특성 저장소는 훈련을 위해 일괄적으로 그리고 추론을 위해 실시간으로 정확히 동일한 기능을 제공합니다. 따라서 사용자는 기능을 일관되게 유지하기 위해 코드를 작성할 필요가 없습니다. 사용자는 새로운 기능을 쉽게 추가하고, 기존 기능을 업데이트하고, 훈련을 위해 기능을 일괄적으로 검색하고, 실시간 추론에 한 자릿수의 밀리초 대기 시간으로 동일한 기능을 사용할 수 있습니다.

자세히 알아보기 »
짧은 대기 시간의 특성 저장소

노트북을 사용하는 확장 가능한 데이터 준비

SageMaker Studio 노트북에서 클릭 몇 번으로 Amazon EMR에서 실행되는 Apache Spark 데이터 처리 환경을 시각적으로 찾아보고 검색하고 연결할 수 있습니다. 연결된 후에는 대화형으로 데이터를 쿼리, 탐색 및 시각화하고 선택한 언어(SQL, Python 및 Scala)로 Spark 작업을 실행하여 엔드 투 엔드 데이터 준비 및 기계 학습 워크플로를 구축할 수 있습니다.

자세히 알아보기 »
노트북을 사용하는 확장 가능한 데이터 준비

데이터 레이블 지정

Amazon SageMaker 데이터 레이블 지정으로 이미지, 텍스트 파일 및 비디오와 같은 원시 데이터를 식별하고 정보 레이블을 추가하여 기계 학습 모델을 위한 고품질 훈련 데이터 집합을 생성할 수 있습니다.

자세히 알아보기 »
데이터 레이블 지정

구축

원클릭 Jupyter 노트북

Amazon SageMaker Studio 노트북은 클릭 한 번으로 작동하는 Jupyter 노트북으로, 빠르게 작업을 시작할 수 있습니다. 기본 컴퓨팅 리소스는 완전히 탄력적이므로 사용 가능한 리소스를 쉽게 확장하거나 축소할 수 있으며 변경 작업이 백그라운드에서 자동으로 진행되므로 작업에 방해가 되지 않습니다. 사용자는 클릭 한 번으로 노트북을 공유할 수 있으며, 사용자의 동료는 동일한 장소에 저장된 동일한 노트북을 받을 수 있습니다.

자세히 알아보기 »
원클릭 Jupyter 노트북

기본 제공 알고리즘

Amazon SageMaker는 추론을 빠르게 훈련하고 실행하는 데 사용할 수 있는 사전 구축된 컨테이너 이미지에서 사용 가능한 15개 이상의 기본 제공 알고리즘을 제공합니다.

시작하기 »
기본 제공 알고리즘

사전 구축된 솔루션 및 오픈 소스 모델

Amazon SageMaker JumpStart를 사용하면 몇 번의 클릭만으로 배포 가능한 사전 구축된 솔루션을 사용하여 기계 학습을 빠르게 시작할 수 있습니다. 또한 SageMaker JumpStart는 클릭 한 번으로 배포와 150개가 넘는 널리 사용되는 오픈 소스 모델의 세분화된 튜닝도 지원합니다.

시작하기 »
사전 구축된 솔루션 및 오픈 소스 모델

주요 프레임워크에 최적화된 기능

Amazon SageMaker는 TensorFlow, Apache MXNet, PyTorch 등과 같은 널리 사용되는 많은 딥 러닝 프레임워크에 맞게 최적화되었습니다. 프레임워크는 항상 최신 버전을 사용하여 최신 상태로 유지되며, AWS 기반에서 성능을 위해 최적화됩니다. 이러한 프레임워크를 수동으로 설정하지 않아도 되며, 기본 제공 컨테이너에서 사용할 수 있습니다.

시작하기 »
주요 프레임워크에 최적화된 기능

훈련

바이어스 감지 및 예측 이해

Amazon SageMaker Clarify는 데이터 준비 중에 그리고 훈련 후에 바이어스 감지를 통해 모델 품질을 개선하는 데이터를 제공합니다. 또한 SageMaker Clarify는 모델 설명가능성 보고서를 제공하므로 이해관계자는 모델이 예측을 수행하는 방법과 이유를 확인할 수 있습니다.

자세히 알아보기 »
바이어스 감지 및 예측 이해

훈련 실행 구성, 추적 및 평가

Amazon SageMaker Experiments는 훈련 입력 파라미터, 구성, 결과를 자동으로 캡처하여 “실험“으로 저장합니다. 사용자는 활성 실험을 탐색하고, 특성별로 이전 실험을 검색하고, 결과와 함께 이전 실험을 검토하고, 실험 결과를 시각적으로 비교할 수 있습니다.

자세히 알아보기 »
훈련 실행 구성, 추적 및 평가

문제 감지 및 디버그

Amazon SageMaker Debugger는 실시간으로 지표를 캡처하므로, 사용자는 모델이 프로덕션에 배포되기 전에 성능 문제를 빠르게 수정할 수 있습니다.

자세히 알아보기 »
문제 감지 및 디버그

배포

모델을 지속적으로 모니터링

Amazon SageMaker Model Monitor는 모델 및 개념 드리프트를 자동으로 감지하고 문제의 원인을 식별하도록 도와주는 자세한 알림을 제공하므로, 사용자는 시간이 지나면서 모델 품질을 개선할 수 있습니다. SageMaker에서 훈련된 모든 모델은 SageMaker Studio에서 수집하고 볼 수 있는 주요 메트릭을 자동으로 생성합니다.

자세히 알아보기 »
모델을 지속적으로 모니터링

쉬운 배포 옵션

Amazon SageMaker는 실시간이든 배치이든 상관없이 사용 사례의 요구 사항을 충족하는 가장 광범위한 기계 학습 인프라 및 모델 배포 옵션을 제공하므로 대규모 기계 학습 모델을 쉽게 배포할 수 있습니다. SageMaker는 짧은 대기 시간(몇 밀리초)과 높은 처리량(초당 수십만 개의 추론 요청)에서 자연어 처리(NLP) 및 컴퓨터 비전(CV)과 같은 사용 사례를 위한 장기 실행 추론에 이르기까지 추론 요구 사항의 전체 스펙트럼을 지원합니다.

자세히 알아보기 »
쉬운 배포 옵션

시작하기

Amazon SageMaker Studio에 대해 자세히 알아보기

웹 페이지 방문 »

기계 학습에 대해 알아보기

구축 시작 »

추가 질문이 있으신가요?

리소스 살펴보기 »

AWS 자세히 살펴보기