Amazon SageMaker と MLFlow を併用する理由
Amazon SageMaker には、機械学習 (ML) と生成 AI を実験するためのマネージド MLflow 機能が用意されています。この機能により、データサイエンティストは SageMaker の MLflow をモデルのトレーニング、登録、およびデプロイに簡単に利用できます。管理者は、安全でスケーラブルな MLflow 環境を AWS にすばやくセットアップできます。データサイエンティストと機械学習デベロッパーは、機械学習の実験を効率的に追跡し、ビジネス上の問題に適したモデルを見つけることができます。
Amazon SageMaker AI と MLflow 3.0 を併用するメリット
どこからでも実験を追跡する
ML テストは、Amazon SageMaker Studio のローカルノートブック、IDE、クラウドベースのトレーニングコード、マネージド IDE など、さまざまな環境で実行されます。SageMaker AI と MLflow を使用すると、希望の環境を使用してモデルをトレーニングしたり、MLflow で実験を追跡したり、MLFlow UI を直接または SageMaker Studio を通じて起動して分析したりできます。

MLflow 3.0 で生成 AI 開発を加速
基盤モデル構築は反復的なプロセスです。何百ものトレーニングイテレーションにより、最適なモデル精度を実現する最適なアルゴリズム、アーキテクチャ、パラメータを見つける必要があります。フルマネージド MLflow 3.0 では、生成 AI 実験を追跡し、モデルパフォーマンスを評価し、実験から本番までのモデルや AI アプリケーションの動作についてより深いインサイトを得ることができます。単一のインターフェースで、トレーニングジョブの進捗状況を視覚化し、実験中に同僚と共同作業を行い、各モデルとアプリケーションのバージョン管理を行うことができます。MLflow 3.0 は、生成 AI 開発のあらゆる段階で入力、出力、メタデータを記録する高度なトレース機能を提供することから、バグや予期しない動作の原因をすばやく特定できます。

実験を評価する
複数のイテレーションから最適なモデルを特定するには、モデルのパフォーマンスを分析および比較する必要があります。MLflow には、散布図、棒グラフ、ヒストグラムなどの視覚化機能があり、トレーニングのイテレーションを比較できます。さらに、MLflow ではモデルの偏りや公平性を評価できます。

MLflow モデルを一元管理
多くの場合、複数のチームが MLflow を使用して実験を管理しますが、本番環境の候補となるのは一部のモデルだけです。組織は、すべての候補モデルを簡単に追跡し、どのモデルを本番環境に進ませるかについて情報に基づいた決定を下すための方法を必要としています。MLflow は SageMaker Model Registry とシームレスに統合されるため、組織は MLFlow に登録されているモデルが SageMaker Model Registry に自動的に表示され、ガバナンス用の SageMaker Model Card で補完されていることを確認できます。この統合により、データサイエンティストと ML エンジニアは、実験のための MLflow と、包括的なモデルリネージにより本番ライフサイクルを管理するための SageMaker Model Registry という個別のツールをそれぞれのタスクに使用できるようになります。

MLflow モデルを SageMaker エンドポイントにデプロイする
MLflow から SageMaker エンドポイントへのモデルのデプロイはシームレスに行えるため、モデルストレージ用のカスタムコンテナを構築する必要がありません。この統合により、お客様は SageMaker の最適化された推論コンテナを活用しながら、モデルのログ記録と登録に MLflow のユーザーフレンドリーなエクスペリエンスを維持できます。
