AWS Parallel Computing Service (PCS) が Slurm v25.05 のサポートを開始

投稿日: 2025年10月17日

AWS Parallel Computing Service (PCS) が Slurm v25.05 のサポートを開始しました。新しい Slurm v25.05 を実行する AWS PCS クラスターを作成できるようになりました。

PCS の Slurm v25.05 のリリースでは、マルチクラスター sackd 設定の強化や、インスタンスの起動失敗時の再キュー動作の改善など、新しい Slurm 機能が提供されています。今回のリリースでは、ログインノードが sackd の再設定や再起動を必要とせずに複数のクラスターを制御できるようになりました。これにより、管理者はユーザーの複数のクラスターへのアクセスを事前設定できます。新しい再キュー動作により、キャパシティ不足時に失敗したインスタンスの起動が自動的に再試行されるため、より回復力のあるジョブスケジューリングが可能になり、クラスター全体の信頼性が向上します。

AWS PCS は、Slurm を使用して AWS 上でハイパフォーマンスコンピューティング (HPC) ワークロードを容易に実行およびスケールできるようにするマネージドサービスです。PCS の詳細については、サービスドキュメントAWS リージョン表を参照してください。