MLflow가 포함된 Amazon SageMaker를 사용한 기계 학습 실험

MLflow를 사용하여 대규모 기계 학습 모델 및 생성형 AI 애플리케이션 실험을 효율적으로 관리하세요

MLflow가 포함된 Amazon SageMaker를 사용해야 하는 이유는 무엇인가요?

Amazon SageMaker는 기계 학습(ML) 및 생성형 AI 실험을 위한 관리형 MLflow 기능을 제공합니다. 이 기능을 통해 데이터 과학자는 SageMaker에서 MLflow를 모델 훈련, 등록, 배포에 쉽게 사용할 수 있습니다. 관리자는 AWS에서 안전하고 확장 가능한 MLflow 환경을 신속하게 설정할 수 있습니다. 데이터 과학자와 ML 개발자는 ML 실험을 효율적으로 추적하고 비즈니스 문제에 적합한 모델을 찾을 수 있습니다.

MLflow가 포함된 Amazon SageMaker의 이점

데이터 과학자는 MLflow를 사용하여 파운데이션 모델을 미세 조정하는 동안 생성된 모든 지표를 추적하고, 모델을 평가하고, 샘플 데이터로 모델을 테스트하고, MLflow UI에서 각 모델의 출력을 나란히 비교하고, 사용 사례에 적합한 모델을 등록할 수 있습니다. 모델을 등록하고 나면 ML 엔지니어가 모델을 SageMaker 추론에 배포할 수 있습니다.
MLflow를 호스트하는 데 필요한 인프라를 관리할 필요가 없습니다. 관리자가 인프라 오버헤드에 대해 걱정할 필요 없이 데이터 과학자가 모든 MLflow 오픈 소스 기능을 사용할 수 있습니다. 이를 통해 데이터 과학 환경을 설정할 때 시간과 비용을 절약할 수 있습니다. MLflow는 Amazon Identity and Access Management(IAM)와 통합되어 MLflow 추적 서버에 역할 기반 액세스 제어(RBAC)를 설정할 수 있습니다.
MLflow에 등록된 모델은 관련 Amazon SageMaker 모델 카드와 함께 Amazon SageMaker 모델 레지스트리에 자동으로 등록됩니다. 이를 통해 데이터 과학자는 컨텍스트를 변경하지 않고도 프로덕션 배포를 위해 모델을 ML 엔지니어로 전환할 수 있습니다. ML 엔지니어는 사용자 지정 컨테이너를 구축하거나 MLflow 모델 아티팩트를 다시 패키징하지 않고도 MLflow에서 SageMaker 엔드포인트로 모델을 배포할 수 있습니다.
MLflow 프로젝트가 발전함에 따라 SageMaker 고객은 AWS에서 제공하는 인프라 관리의 도움을 받으면서 MLflow 커뮤니티의 오픈 소스 혁신의 혜택을 누릴 수 있습니다.

어디서나 실험을 추적

ML 실험은 로컬 노트북, IDE, 클라우드 기반 훈련 코드 또는 Amazon SageMaker Studio의 관리형 IDE 등 다양한 환경에서 수행됩니다. SageMaker와 MLflow를 사용하면 선호하는 환경을 사용하여 모델을 훈련하고, MLflow에서 실험을 추적하고, MLflow UI를 직접 또는 SageMaker Studio를 통해 실행하여 분석할 수 있습니다.

실험 로그

모델 실험을 위한 협업

효과적인 팀 협업은 성공적인 데이터 과학 프로젝트에 필수적입니다. SageMaker Studio를 사용하면 MLflow 추적 서버 및 실험을 관리하고 액세스할 수 있으므로 팀원이 정보를 공유할 수 있고 일관된 실험 결과를 보장하여 협업이 더 쉬워집니다.

ML 실험 메타데이터를 중앙에서 관리

실험 평가

여러 번의 반복을 통해 최상의 모델을 식별하려면 모델 성능을 분석하고 비교해야 합니다. MLflow는 훈련 반복을 비교할 수 있도록 산점도, 막대 차트, 히스토그램과 같은 시각화를 제공합니다. 또한 MLflow를 사용하면 모델의 편향성과 공정성을 평가할 수 있습니다.

ML 실험 평가하기

MLflow 모델을 중앙에서 관리

여러 팀이 MLflow를 사용하여 실험을 관리하는 경우가 많고 일부 모델만 프로덕션 후보가 됩니다. 조직은 어떤 모델을 프로덕션으로 진행할지 정보에 입각한 결정을 내리기 위해 모든 후보 모델을 추적할 수 있는 간편한 방법이 필요합니다. MLflow는 SageMaker 모델 레지스트리와 원활하게 통합되므로 조직은 MLflow에 등록된 모델이 SageMaker 모델 레지스트리에 거버넌스를 위한 SageMaker 모델 카드와 함께 자동으로 표시되는 것을 볼 수 있습니다. 이 통합을 통해 데이터 과학자와 ML 엔지니어는 각자의 작업에 고유한 도구를 사용할 수 있습니다. 즉, 실험에 MLflow를 사용하고 포괄적인 모델 계보를 통한 프로덕션 수명 주기 관리에 SageMaker 모델 레지스트리를 사용할 수 있습니다.

업데이트 및 결과 공유

SageMaker 엔드포인트에 MLflow 모델 배포

모델을 MLflow에서 SageMaker 엔드포인트로 원활하게 배포할 수 있으므로 모델 스토리지용 사용자 지정 컨테이너를 구축할 필요가 없습니다. 이 통합을 통해 고객은 SageMaker의 최적화된 추론 컨테이너를 활용하면서 MLflow의 사용자 친화적인 모델 로깅 및 등록 환경을 유지할 수 있습니다.

ML 실험 재현 및 감사