Amazon SageMaker AI が推論でのフレキシブルなトレーニングプランのキャパシティをサポート
投稿日:
2025年11月26日
Amazon SageMaker AI のフレキシブルなトレーニングプラン (FTP) が推論エンドポイントをサポートするようになり、計画的な評価や本番稼働のピーク時に GPU 容量が保証されるようになりました。これで、お客様はインフラストラクチャの管理を自身で行うことなく、必要なインスタンスタイプを正確に予約し、SageMaker AI を利用して推論エンドポイントを自動的に起動できます。
お客様が機械学習開発サイクルを計画する際には、モデル評価や本番前のテストに必要な GPU が、必要な日に利用できるという確信が必要です。FTP を使用すると、お客様は簡単に GPU 容量にアクセスして機械学習ワークロードを実行できます。推論エンドポイントの FTP サポートにより、推論ワークロードに対して好みのインスタンスタイプ、コンピューティング要件、予約期間、開始日を選択できます。エンドポイントを作成するときは、予約 ARN を参照するだけで、SageMaker AI がプラン期間全体にわたってその保証容量でエンドポイントを自動的にプロビジョニングして実行します。これにより、インフラストラクチャの管理やスケジューリングに何週間も費やす必要がなくなり、予測どおりに推論を実行しながら、モデルのパフォーマンスの向上に時間を注ぐことができます。
SageMaker AI 推論のフレキシブルなトレーニングプランのサポートは、米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ) の各リージョンでご利用いただけます。
推論エンドポイントでの FTP 予約の使用について詳しくは、こちらの SageMaker AI 推論 API リファレンスをご覧ください。