메인 콘텐츠로 건너뛰기

Amazon SageMaker AI

Amazon SageMaker AI와 MLflow로 생성형 AI 개발 가속화

인프라를 관리하지 않으면서 실험 추적, 모델 평가 및 AI 애플리케이션 추적

MLflow가 포함된 Amazon SageMaker AI를 사용해야 하는 이유는 무엇인가요?

AI 모델 구축 및 사용자 지정은 수백 번의 훈련 실행을 통해 최적의 모델 정확도를 위한 최적의 알고리즘, 아키텍처 및 파라미터를 찾는 반복적 프로세스입니다. Amazon SageMaker AI가 제공하는 관리형 서버리스 MLflow 기능을 활용하여 AI 개발자는 인프라를 관리하지 않고도 손쉽게 실험을 추적하고, 동작을 관찰하고, AI 모델 및 애플리케이션의 성능을 평가할 수 있습니다. MLflow가 포함된 SageMaker AI는 SageMaker AI JumpStart, Model Registry, Pipelines 및 서버리스 모델 사용자 지정 기능 등 SageMaker AI 모델 개발 도구와도 통합되어 실험에서 배포에 이르는 AI 수명 주기의 모든 단계를 연결하는 데 도움이 됩니다.

MLflow가 포함된 Amazon SageMaker AI의 이점

인프라를 프로비저닝하고 추적 서버를 구성할 필요 없이 실험 추적 및 AI 애플리케이션 추적을 시작할 수 있습니다. AI 개발자는 팀이 인프라 관리 대신 AI 애플리케이션 구축에 집중할 수 있도록 돕는 서버리스 MLflow 기능에 즉시 액세스할 수 있습니다.

MLflow가 포함된 SageMaker AI는 단일 실험을 실행하거나 수백 개의 병렬 미세 조정 작업을 관리하는지 여부와 무관하게 필요에 따라 자동으로 규모가 조정됩니다. MLflow는 수동 개입 없이도 실험 횟수가 폭증하는 동안 인프라 크기를 조정하고 횟수가 감소하는 동안에는 크기를 축소하여 서버 관리 측면에서의 운영 부담 없이 일관된 성능을 유지합니다.

단일 인터페이스를 사용하여 훈련 작업 진행 상황을 시각화하고, 실험 중에 팀원과 협업하고, 각 모델 및 애플리케이션의 버전 관리 상태를 유지할 수 있습니다. MLflow는 버그 또는 예상치 못한 동작의 원인을 신속하게 찾는 데 도움이 되는 고급 추적 기능도 제공합니다.

MLflow 프로젝트가 발전함에 따라 SageMaker AI 고객은 AWS의 서버리스 지원을 받으면서 오픈 소스 커뮤니티 혁신이 제공하는 이점을 계속해서 이용할 수 있습니다.

MLflow가 포함된 Amazon SageMaker AI는 최신 버전의 MLflow로 자동 업그레이드되기 때문에 유지 보수 기간이나 마이그레이션 작업 없이도 최신 기능을 이용할 수 있습니다.

AI 모델 사용자 지정 간소화

SageMaker AI에서 MLflow를 활용하면 실험을 추적, 구성 및 비교하여 최적의 성능을 발휘하는 모델을 식별할 수 있습니다. MLflow는 Amazon Nova, Lama, Qwen, DeepSeek 및 GPT-OSS 등 많이 사용되는 모델에 대해 Amazon SageMaker AI 서버리스 모델 사용자 지정 기능과 통합되어 있으므로 단일 인터페이스를 통해 진행 중인 훈련 작업 및 평가를 시각화할 수 있습니다. 

Missing alt text value

프롬프트 관리로 일관성 유지

조직 전체에서 프롬프트의 버전 지정, 추적 및 재사용이 가능한 강력한 기능인 MLflow Prompt Registry를 사용하여 AI 애플리케이션의 프롬프트 엔지니어링 및 관리를 간소화하면 프롬프트 개발에서 일관성 유지와 협업 개선에 도움이 됩니다.

Missing alt text value

실시간 AI 애플리케이션 및 에이전트 추적

MLflow가 포함된 SageMaker AI는 AI 개발의 모든 단계에서 입력, 출력 및 메타데이터를 기록하여 버그 또는 예상치 못한 동작을 신속하게 파악합니다. 에이전트 워크플로와 다단계 애플리케이션에 대한 고급 추적을 활용하면 복잡한 생성형 AI 시스템을 디버깅하고 성능을 최적화하는 데 필요한 가시성을 확보할 수 있습니다. 

Missing alt text value

SageMaker Model Registry를 활용한 중앙 집중식 모델 거버넌스

정보를 기반으로 어떤 모델을 프로덕션으로 진행할지 결정하기 위해 여러 개발 팀의 모든 후보 모델을 추적할 수 있는 간편한 방법이 조직에 필요합니다. 관리형 MLflow에는 MLflow에 등록된 모델을 SageMaker Model Registry와 자동으로 동기화하는 전용 통합 기능이 포함되어 있습니다. 이를 활용하면 AI 모델 개발 팀이 각자의 작업에 고유한 도구를 사용할 수 있습니다. 즉, 실험에 MLflow를 사용하고 포괄적인 모델 리니지를 통한 프로덕션 수명 주기 관리에 SageMaker Model Registry를 사용할 수 있습니다. 

Missing alt text value

SageMaker AI 엔드포인트로 원활하게 모델 배포

원하는 모델 정확도 및 성능 목표를 달성한 후에는 클릭 몇 번으로 SageMaker Model Registry에서 SageMaker AI 추론 엔드포인트로 모델을 프로덕션에 배포할 수 있습니다. 이 원활한 통합으로 모델 저장을 위한 사용자 지정 컨테이너를 구축할 필요가 없게 되고, 고객은 SageMaker AI의 최적화된 추론 컨테이너를 활용하면서 MLflow의 사용자 친화적인 모델 로깅 및 등록 환경을 유지할 수 있습니다.

Missing alt text value

Wildlife Conservation Society

“WCS는 ML 모델을 사용하여 전 세계 과학자들의 산호초 사진을 분석하는 오픈 소스 플랫폼인 MERMAID 활용을 통해 전 세계 산호초 보존에서 진전을 보이고 있습니다. MLflow가 포함된 Amazon SageMaker를 사용하고 인프라 요구 사항의 변화에 따라 MLflow 추적 서버를 구성하거나 용량을 관리할 필요가 없어 생산성이 향상되었습니다. 팀이 모델 혁신에만 집중할 수 있게 되면서 해양 과학자와 관리자에게 중요한 클라우드 기반 인사이트를 제공하기 위한 배포 시간을 단축하고 있습니다.”

Kim Fisher, MERMAID
수석 소프트웨어 엔지니어, WCS

Missing alt text value