MLflow가 포함된 Amazon SageMaker를 사용해야 하는 이유는 무엇인가요?
Amazon SageMaker는 기계 학습(ML) 및 생성형 AI 실험을 위한 관리형 MLflow 기능을 제공합니다. 이 기능을 통해 데이터 과학자는 SageMaker에서 MLflow를 모델 훈련, 등록, 배포에 쉽게 사용할 수 있습니다. 관리자는 AWS에서 안전하고 확장 가능한 MLflow 환경을 신속하게 설정할 수 있습니다. 데이터 과학자와 ML 개발자는 ML 실험을 효율적으로 추적하고 비즈니스 문제에 적합한 모델을 찾을 수 있습니다.
Amazon SageMaker AI with MLflow 3.0의 이점
어디서나 실험을 추적
ML 실험은 로컬 노트북, IDE, 클라우드 기반 훈련 코드 또는 Amazon SageMaker Studio의 관리형 IDE 등 다양한 환경에서 수행됩니다. SageMaker AI와 MLflow를 사용하면 선호하는 환경을 사용하여 모델을 훈련하고, MLflow에서 실험을 추적하고, MLflow UI를 직접 또는 SageMaker Studio를 통해 실행하여 분석할 수 있습니다.

MLflow 3.0으로 생성형 AI 개발 가속화
파운데이션 모델 구축은 최적의 모델 정확도를 위한 최적의 알고리즘, 아키텍처 및 파라미터를 찾는 프로세스를 수백 회 반복하는 반복적인 프로세스입니다. 완전관리형 MLflow 3.0을 사용하면 생성형 AI 실험을 추적하고, 모델 성능을 평가하고, 실험 단계부터 프로덕션 단계에 이르기까지 전 과정에서 모델 및 AI 애플리케이션의 동작에 대한 심층적인 인사이트를 얻을 수 있습니다. 단일 인터페이스를 사용하여 훈련 진행 상황을 시각화하고, 실험 중에 동료와 협업하고, 각 모델 및 애플리케이션의 버전 관리 상태를 유지할 수 있습니다. 또한 MLflow 3.0은 고객이 버그 또는 예기치 못한 동작의 원인을 신속하게 찾아낼 수 있도록 생성형 AI 개발의 모든 단계에서 입력, 출력 및 메타데이터를 기록하는 고급 추적 기능도 제공합니다.

실험 평가
여러 번의 반복을 통해 최상의 모델을 식별하려면 모델 성능을 분석하고 비교해야 합니다. MLflow는 훈련 반복을 비교할 수 있도록 산점도, 막대 차트, 히스토그램과 같은 시각화를 제공합니다. 또한 MLflow를 사용하면 모델의 편향성과 공정성을 평가할 수 있습니다.

MLflow 모델을 중앙에서 관리
여러 팀이 MLflow를 사용하여 실험을 관리하는 경우가 많고 일부 모델만 프로덕션 후보가 됩니다. 조직은 어떤 모델을 프로덕션으로 진행할지 정보에 입각한 결정을 내리기 위해 모든 후보 모델을 추적할 수 있는 간편한 방법이 필요합니다. MLflow는 SageMaker 모델 레지스트리와 원활하게 통합되므로 조직은 MLflow에 등록된 모델이 SageMaker 모델 레지스트리에 거버넌스를 위한 SageMaker 모델 카드와 함께 자동으로 표시되는 것을 볼 수 있습니다. 이 통합을 통해 데이터 과학자와 ML 엔지니어는 각자의 작업에 고유한 도구를 사용할 수 있습니다. 즉, 실험에 MLflow를 사용하고 포괄적인 모델 계보를 통한 프로덕션 수명 주기 관리에 SageMaker 모델 레지스트리를 사용할 수 있습니다.

SageMaker 엔드포인트에 MLflow 모델 배포
모델을 MLflow에서 SageMaker 엔드포인트로 원활하게 배포할 수 있으므로 모델 스토리지용 사용자 지정 컨테이너를 구축할 필요가 없습니다. 이 통합을 통해 고객은 SageMaker의 최적화된 추론 컨테이너를 활용하면서 MLflow의 사용자 친화적인 모델 로깅 및 등록 환경을 유지할 수 있습니다.
