SageMaker HyperPod がコンピューティングリソースのきめ細かなクォータ割り当てのサポートを開始
SageMaker HyperPod のタスクガバナンスでは、インスタンス内の GPU、Trainium アクセラレーター、vCPU、および vCPU メモリといったリソースのコンピューティングクォータをきめ細かに割り当てることができるようになりました。管理者は複数のチームに対してコンピューティングクォータをきめ細かに割り当てることができるため、コンピューティングリソースの配分を最適化し、コストを予算内に収めることができます。
データサイエンティストは、トレーニングや推論など、HyperPod インスタンス全体を必要としない LLM タスクを実行することが多く、これにより、高速コンピューティングリソースが十分に使用されていない状態が発生してしまいます。HyperPod のタスクガバナンスを使用すると、管理者は複数のチーム間でコンピューティングクォータの割り当てを管理できます。こうした機能により、管理者はコンピューティングリソースを戦略的に割り当て、公平なアクセスを確保し、リソースの独占を防ぎ、クラスターの使用率を最大化できるようになりました。インスタンスレベルの割り当てに加え、組織のワークロードの需要に合わせて、きめ細かなコンピューティングクォータの割り当てが可能になります。
SageMaker HyperPod のタスクガバナンスは、HyperPod が利用可能なすべての AWS リージョン (米国東部 (バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (ストックホルム)、南米 (サンパウロ)) でご利用いただけます。
詳細については、SageMaker HyperPod ウェブページおよび HyperPod のタスクガバナンスのドキュメントをご覧ください。