게시된 날짜: Nov 29, 2023

오늘 AWS는 Amazon SageMaker Pipelines를 위한 간소화된 개발자 경험의 정식 버전을 발표했습니다. 개선된 Python SDK를 사용하면 익숙한 Python 구문을 사용하여 기계 학습(ML) 워크플로를 빠르게 구축할 수 있습니다. SDK의 주요 기능으로는 사용자 지정 단계를 위한 새로운 Python 데코레이터(@step), 노트북 작업 단계 유형, 워크플로 스케줄러가 있습니다.

ML 개발은 분리된 파이프라인 단계를 통해 실행을 자동화하기로 결정하기 전에 로컬 개발 환경(예: Jupyter Notebook)에서 실험하기 위한 모놀리식 Python 코드로 시작하는 경우가 많습니다. 새로운 Amazon SageMaker Pipelines 개발자 경험을 사용하면 몇 분 만에 ML 코드를 다양한 ML 단계의 자동화된 DAG(방향성 비순환 그래프)로 변환할 수 있습니다. ML 워크플로를 생성하려면 기존 Python 함수에 '@step' 데코레이터로 주석을 달고 마지막 단계를 파이프라인 생성 API로 전달하면 됩니다. Amazon SageMaker는 주석이 달린 Python 함수 간의 종속성을 자동으로 해석하고, 각 함수에 대한 사용자 지정 파이프라인 단계를 만들고, 파이프라인 DAG를 생성합니다. ML 코드가 여러 Python 노트북에 분산되어 있다면, 이를 함께 연결하여 노트북 작업의 워크플로를 오케스트레이션할 수 있습니다. 나중에 주기적으로 워크플로를 자동으로 실행하려는 경우, 새로운 Python SDK에서 단일 함수 호출을 사용하여 실행 일정을 구성할 수 있습니다.

시작하려면 GitHub에서 사전 구축된 샘플 노트북 중 하나를 사용하여 ML 워크플로를 생성하고 Amazon SageMaker Studio UI에서 시각화하세요. 추가 정보는 Amazon SageMaker Pipelines 개발자 안내서에서 확인하세요.