AWS Parallel Computing Service が Slurm の SPANK プラグインのサポートを開始
本日、AWS は、AWS Parallel Computing Service (AWS PCS) が SPANK (Slurm Plug-in Architecture for Node and job [K]control: ノードおよびジョブ [K] コントロール用 Slurm プラグインアーキテクチャ) プラグインをサポートすることを発表しました。これにより、Slurm を直接変更することなく、Slurm がハイパフォーマンスコンピューティング (HPC) ワークロードをスケジュールおよび処理する方法を拡張、変更できるようになります。
SPANK プラグインを使用することで、AWS PCS をコンテナテクノロジーと統合し、メモリと I/O パターンのカスタムモニタリングを実装し、ジョブの起動を動的に変更してリソース管理を強化できるようになります。例えば、Enroot および Pyxis プラグインを使用すると、Amazon Elastic Container Registry、Docker Hub、NVIDIA NGC、またはその他のコンテナレジストリのイメージを使用して、コンテナ化された機械学習と HPC ワークロードをシームレスに実行できます。
この機能は、AWS PCS を利用できるすべての AWS リージョンでご利用いただけます。SPANK プラグインは、AWS PCS コンピューティングノードを稼働させる Amazon マシンイメージ (AMI) にインストールおよび設定することで実装できます。プラグインはジョブ起動の実行時に動的に読み込まれるため、手間をかけずに Slurm の機能を拡張できます。
AWS PCS での SPANK プラグインの使用について詳しくは、AWS PCS ユーザーガイドを参照してください。