Amazon Web Services 한국 블로그
Amazon SageMaker AI, 서버리스 MLflow 기반 AI 개발 가속화 지원
2024년 6월 Amazon SageMaker AI with MLflow 출시 이후, 고객은 MLflow 추적 서버를 사용하여 기계 학습(ML) 및 AI 실험 워크플로를 관리해 왔습니다. 이러한 토대를 바탕으로 실험의 접근성을 더욱 높이기 위해 MLflow 환경을 지속적으로 발전시켜 나가고 있습니다.
오늘 MLFlow를 지원하는 Amazon SageMaker AI에 인프라 관리가 필요 없는 서버리스 기능이 추가되었다는 기쁜 소식을 전해드립니다. 이 새로운 MLFlow 기능은 용량 계획이 필요 없는 오토 스케일링을 통해 실험 추적을 즉각적인 온디맨드 경험으로 전환합니다.
인프라 관리가 필요 없는 환경으로의 전환은 팀의 AI 실험 접근 방식을 근본적으로 변화시킵니다. 인프라 계획 없이 아이디어를 즉시 테스트할 수 있으므로 더욱 반복적이고 탐색적인 개발 워크플로가 가능해집니다.
Amazon SageMaker AI 및 MLflow 시작하기
첫 번째 서버리스 MLflow 인스턴스를 생성하는 방법을 안내해 드리겠습니다.
Amazon SageMaker AI Studio 콘솔로 이동하여 MLFlow 애플리케이션을 선택합니다. MLFlow 앱이라는 용어는 이전의 MLFlow 추적 서버 용어를 대체하며, 간소화되고 애플리케이션 중심적인 접근 방식을 반영합니다.

여기에서 기본 MLflow 앱이 이미 생성되어 있는 것을 볼 수 있습니다. 이렇게 간소화된 MLflow 환경 덕분에 실험을 더 쉽게 시작할 수 있습니다.
MLFlow 앱 생성을 선택하고 이름을 입력합니다. 여기에는 AWS Identity and Access Management(IAM) 역할 및 Amazon Simple Service(Amazon S3) 버킷은 이미 구성되어 있습니다. 필요한 경우에만 고급 설정에서 수정하면 됩니다.

여기서 첫 번째 주요 개선 사항은 확실하게 느낄 수 있습니다. 생성 프로세스가 약 2분 만에 완료됩니다. 이러한 즉각적인 가용성 덕분에 인프라 계획 지연 없이 신속하게 실험할 수 있으며, 이전에 실험 워크플로를 방해했던 대기 시간이 사라집니다.

생성 후 노트북에서 연결할 수 있는 MLflow Amazon 리소스 이름(ARN)을 받게 됩니다. 관리가 간소화되어 서버 크기 결정이나 용량 계획이 필요하지 않습니다. 더 이상 다양한 구성 중에서 선택하거나 인프라 용량을 관리할 필요가 없으므로 실험에만 집중할 수 있습니다. MLflow SDK를 사용하는 방법은 Amazon SageMaker 개발자 안내서의 MLflow를 환경에 통합할 수 있습니다.

MLFlow 3.4 지원을 통해 이제 생성형 AI 개발을 위한 새로운 기능을 활용할 수 있습니다. MLFlow Tracing은 개발 수명 주기 전반에 걸쳐 상세한 실행 경로, 입력, 출력 및 메타데이터를 캡처하여 분산 AI 시스템 전반에서 효율적인 디버깅을 지원합니다.

이 새로운 기능은 AWS Resource Access Manager(AWS RAM) 공유를 통해 교차 도메인 및 교차 계정 액세스를 지원합니다. 이러한 향상된 협업을 통해 다양한 AWS 도메인 및 계정에 속한 팀이 MLflow 인스턴스를 안전하게 공유하여 조직 간 사일로를 해소할 수 있습니다.
통합으로 효율성 향상: 파이프라인 통합
Amazon SageMaker Pipelines가 MLflow와 통합되었습니다. SageMaker Pipelines는 기계 학습 운영(MLOps) 및 대규모 언어 모델 운영(LLMOps) 자동화를 위한 목적별 서버리스 워크플로 오케스트레이션 서비스입니다. 직관적인 드래그 앤 드롭 UI 또는 Python SDK를 사용하여 반복 가능한 포괄적인 AI 워크플로를 쉽게 구축, 실행 및 모니터링할 수 있습니다.

파이프라인에서, 기본 MLflow 앱이 없으면 자동으로 생성됩니다. 실험 이름을 정의할 수 있으며 코드에 정의된 대로 지표, 파라미터 및 아티팩트가 MLFlow 앱에 기록됩니다. MLflow를 사용하는 SageMaker AI는 SageMaker AI JumpStart 및 모델 레지스트리와 같은 익숙한 SageMaker AI 모델 개발 기능과도 통합되어 데이터 준비부터 모델 미세 조정까지 포괄적인 워크플로 자동화를 지원합니다.
알아야 할 사항
주요 사항은 다음과 같습니다.
- 요금 – 새로운 서버리스 MLflow 기능은 추가 비용 없이 제공됩니다. 적용되는 서비스 한도가 있습니다.
- 가용성 – 이 기능은 미국 동부(버지니아 북부, 오하이오), 미국 서부(캘리포니아 북부, 오리건), 아시아 태평양(뭄바이, 서울, 싱가포르, 시드니, 도쿄), 캐나다(중부), 유럽(프랑크푸르트, 아일랜드, 런던, 파리, 스톡홀름), 남아메리카(상파울루)의 AWS 리전에서 사용할 수 있습니다.
- 자동 업그레이드: MLflow 인플레이스 버전 업그레이드가 자동으로 진행되어 수동 마이그레이션 작업이나 호환성 문제 없이 최신 기능에 액세스할 수 있습니다. 이 서비스는 현재 MLflow 3.4를 지원하여 향상된 추적 기능을 비롯한 최신 기능에 액세스할 수 있습니다.
- 마이그레이션 지원 – mlflow-export-import에서 제공되는 오픈 소스 MLflow export-import 도구를 사용하여 SageMaker AI, 셀프 호스팅 또는 기타 기존 추적 서버에서 서버리스 MLflow(MLflow 앱)로 마이그레이션할 수 있습니다.
Amazon SageMaker AI Studio로 이동하여 첫 번째 MLFlow 앱을 생성함으로써 서버리스 MLFlow를 시작하세요. SageMaker Unified Studio에서도 서버리스 MLflow를 지원하여 워크플로 유연성을 높입니다.
즐겁게 실험해 보세요!
– Donnie