投稿日: Aug 23, 2023

Amazon SageMaker エンドポイントが、ローリングデプロイ戦略を使用して更新できるようになりました。ローリングデプロイにより、何百もの一般的な高速コンピューティングインスタンスにデプロイされているフルスケールのエンドポイントを簡単に更新できます。

Amazon SageMaker は、機械学習モデルをエンドポイントに簡単にデプロイして呼び出すことができます。あらゆるユースケースに最適な価格性能で予測 (推論ともいう) を行うができます。SageMaker はこれまで、エンドポイントを新しいモデルで更新する必要がある場合、ブルー/グリーンデプロイのみをサポートしていました。ブルー/グリーンデプロイでは、更新されたモデルを適用した新しいインスタンスのフリートをプロビジョニングしてから、トラフィックを古いフリートから新しいフリートに移行します。そのため、エンドポイントを新しいモデルで更新すると、エンドポイントが使用するインスタンス数は 2 倍必要になっていました。ローリングデプロイでは、トラフィックが新しいエンドポイントに移行するたびに古いエンドポイントのインスタンスがクリーンアップされるため、エンドポイントの更新に必要な追加インスタンスの数が減ります。この新しい更新戦略はデプロイガードレールの一部です。これにより、トラフィック移行のステップのサイズを制御できるほか、古いエンドポイントのインスタンスを終了する前に、新しいインスタンスに問題がないか監視する評価期間を指定できます。

この機能は、Amazon SageMaker が利用可能なすべての商用リージョンで、API、SDK、および CloudFormation を通じてご利用いただけます。

ローリングデプロイの設定方法などの詳細については、こちらのドキュメントをご覧ください。さまざまなエンドポイント更新戦略については、本番環境のモデルの更新に関するドキュメントをご覧ください。