投稿日: Aug 9, 2022
Amazon SageMaker 自動モデルチューニングでは、容量が不足しているために優先的なインスタンスタイプが使用できない場合にチューニングジョブをさらに堅牢にするために、複数の代替 SageMaker トレーニングインスタンスタイプの指定のサポートを開始しました。
以前は、SageMaker 自動モデルチューニングジョブを作成する際に、1 つの SageMaker トレーニングインスタンスタイプのみを定義することができました。インスタンスタイプの容量が少ない場合、ジョブのランタイムが増加し、チューニングジョブが失敗する可能性が高くなります。この状態は特に望ましくありません。ハイパーパラメータのチューニングには長時間実行している可能性がある複数のトレーニングジョブの実行が含まれており、このような障害が発生した場合に、これらのジョブをゼロから再開する必要があるからです。今回のローンチにより、容量が不足している場合に、ハイパーパラメータのチューニングジョブが自動的に次の代替インスタンスタイプにフォールバックされるように、追加で最大 5 つのインスタンスタイプを希望する順序で指定できるようになりました。これにより、チューニングジョブは容量が不足するシナリオへの対障害性が高くなり、特定の SageMaker トレーニングインスタンスの可用性の低下によるランタイムの増加や障害が発生することなく、モデルをチューニングできます。
SageMaker 自動モデルチューニングで複数の代替インスタンスタイプを指定する機能は、すべての商用 AWS リージョンで利用できるようになりました。 詳細については、API リファレンスガイドと技術文書を参照してください。