JupyterLab의 Amazon SageMaker 노트북

데이터를 탐색하고 ML 모델을 구축하기 위한 JupterLab의 완전관리형 노트북

Amazon SageMaker 노트북이란 무엇인가요?

Amazon SageMaker Studio에서 완전관리형 JupyterLab을 몇 초 만에 시작할 수 있습니다. 노트북, 코드 및 데이터를 지원하는 통합 개발 환경(IDE)을 사용합니다. IDE의 빠른 시작 협업 노트북을 사용하면 SageMaker에서 목적별 ML 도구 및 기타 AWS 서비스에 액세스하여, Amazon EMR에서 Spark를 사용해 페타바이트 규모의 데이터를 준비하는 것부터 모델 훈련 및 디버깅, 모델 배포 및 모니터링, 파이프라인 관리에 이르기까지, 전체 ML 개발의 모든 작업을 하나의 웹 기반 시각적 인터페이스에서 실행할 수 있습니다. 작업을 중단하지 않고 컴퓨팅 리소스를 손쉽게 스케일 업하거나 스케일 다운합니다.

SageMaker 노트북의 이점

Amazon SageMaker Studio에서 완전관리형 JupyterLab을 몇 초 만에 시작합니다. SageMaker Studio는 PyTorch, TensorFlow, Keras 등의 딥 러닝 프레임워크와 NumPy, scikit-learn, panda 등의 인기 Python 패키지를 비롯하여 널리 사용되는 ML용 패키징이 포함된 SageMaker 배포판으로 사전 구성되어 있습니다.
업계에서 가장 다양한 클라우드용 컴퓨팅 최적화 및 GPU 가속 인스턴스 옵션을 사용하여 컴퓨팅 리소스를 스케일 업 또는 스케일 다운합니다.
생성형 AI 기반 코딩 도우미 및 보안 도구를 사용하여 고품질 코드를 더 빠르게 작성합니다. Amazon CodeWhisperer를 사용하여 소스 코드를 생성, 디버깅 및 설명하고, Amazon CodeGuru를 사용하여 보안 및 코드 품질 검사를 수행합니다.
동일한 노트북에 통합 분석과 ML 워크플로를 구축합니다. 노트북에서 바로 Amazon EMR 및 AWS Glue 서버리스 인프라의 대화형 Spark 작업을 실행합니다. 인라인 Spark UI를 사용하여 작업을 더 빠르게 모니터링하고 디버깅합니다. 몇 개의 간단한 단계로 노트북을 하나의 작업으로 예약하여 데이터 준비를 쉽게 자동화합니다.

대규모 ML 구축

빠른 시작

완전관리형 JupyterLab을 Studio에서 몇 초 만에 시작할 수 있습니다. SageMaker Studio는 PyTorch, TensorFlow, Keras 등의 딥 러닝 프레임워크와 모델 구축을 시작하는 데 도움이 되는 NumPy, scikit-learn, panda 등의 인기 Python 패키지를 비롯하여 널리 사용되는 ML용 패키징이 포함된 사전 구축된 SageMaker 배포판으로 사전 구성되어 있습니다.

Elastic Compute

작업을 중단하지 않고 기본 컴퓨팅 리소스를 스케일 업하거나 스케일 다운하고, 공유 영구 스토리지를 사용하여 컴퓨팅 환경을 전환할 수 있습니다. 가장 강력한 ML용 GPU 인스턴스를 비롯하여 AWS에서 제공하는 다양한 컴퓨팅 리소스 중에서 선택할 수 있습니다.

ML 개발 생산성 향상

데이터 준비

통합 환경으로 데이터 워크플로를 간소화합니다. JupyterLab에서 바로 Amazon EMR 클러스터 및 AWS Glue 대화형 세션을 생성하고 찾아보고 연결할 수 있습니다. 내장된 데이터 준비 기능을 사용하여 데이터를 시각화하고 데이터 품질을 개선합니다.

노트북 작업

SageMaker 노트북 작업을 사용하여 필요에 따라 또는 일정에 따라 실행되는 비대화형 작업을 생성할 수 있습니다. 직관적인 사용자 인터페이스 또는 SageMaker Python SDK를 사용하여 JupyterLab에서 바로 작업을 예약할 수 있습니다. 노트북을 선택하면 SageMaker Studio 노트북이 전체 노트북의 스냅샷을 생성하고 해당하는 종속성을 컨테이너로 패키지합니다. 그런 다음 인프라를 구축하고 실무자가 설정한 일정에 따라 노트북을 자동 작업으로 실행한 후 작업이 완료되면 인프라를 프로비저닝 해제합니다. SageMaker 노트북 작업은 Amazon SageMaker Pipelines의 기본 단계로도 제공되므로, 단 몇 줄의 코드로 CI/CD 배포에 대한 종속성이 포함된 다단계 워크플로로 노트북을 자동화할 수 있습니다.

AI 기반 도구

Amazon CodeWhisperer는 실시간 코드 제안을 생성하는 AI 코딩 도우미입니다. CodeWhisperer를 사용하면 ‘CSV 파일을 사용하여 panda 데이터 프레임 만들기’와 같은 구체적인 작업을 요약한 주석을 자연어로 작성할 수 있으며, CodeWhisperer는 노트북에서 해당 작업을 수행할 수 있는 하나 이상의 코드 조각을 직접 추천합니다. Amazon CodeGuru Security는 노트북 사용자가 노트북 셀 내 주입 결함, 데이터 유출, 취약한 암호화 또는 누락된 암호화와 같은 보안 취약성을 탐지하는 데 도움이 됩니다. 취약성 또는 품질 문제가 식별되면 CodeGuru는 AWS 보안 모범 사례에 따라 해당 문제를 해결하기 위한 권장 사항을 생성합니다.