投稿日: Jun 29, 2023

AWS Batch で、マルチノード並列 (MNP) ジョブの vCPU の最小数 (最小 vCPU) を指定できるようになりました。MNP ジョブを使用すると、ユーザーは複数の Amazon Elastic Compute Cloud (Amazon EC2) インスタンスで ML トレーニングなどの緊密に結合された大規模なワークロードを実行できます。今回のローンチにより、実行中のジョブがない場合でも、指定された数の vCPU をコンピューティング環境 (CE) 上に保持できるようになりました。この機能により、MNP ジョブの正常なインスタンスのウォームプールを維持できるため、急激なスケールダウンによって EC2 に容量が戻ってしまう事態を防ぐことができます。

MNP の最小 vCPU を設定するには、AWS Batch コンソールを使用するか、CreateComputeEnvironment または UpdateComputeEnvironment API を使用して、必要な「最小 vCPU」の数を指定します。AWS Batch は、MNP の容量をお客様が定義したレベルまでスケールして保持し、そのコンピューティング環境ですべてのジョブが完了しても容量レベルを保持するように設計されています。この機能の詳細については、AWS Batch ユーザーガイドを参照してください。

MNP ジョブを使用すると、ユーザーは大規模言語モデルなどの大規模かつ高性能なコンピューティングワークロードを複数の Amazon EC2 インスタンスで実行できます。Min vCPU を MNP ジョブにまで拡張することで、将来のジョブに備えて正常なインスタンスを簡単に特定して保持できるため、ジョブを実行する前の追加のブート時間とハードウェアチェックが不要になります。この機能は、現在 AWS Batch が利用可能なすべての AWS リージョンで利用できます。AWS Batch の詳細については、AWS Batch ユーザーガイドを参照してください。AWS Batch API の詳細については、AWS Batch API リファレンスを参照してください。