AWS Parallel Computing Service で Slurm のカスタマイズ機能を拡張
AWS Parallel Computing Service (AWS PCS) で、拡張 Slurm 設定機能が提供され、60 を超える追加パラメータを設定して、ハイパフォーマンスコンピューティング (HPC) クラスターの運用をきめ細かく制御できるようになりました。この機能強化により、ジョブのスケジューリング、リソース割り当て、アクセス制御、およびジョブのライフサイクルをより柔軟に管理できるようになります。
新しい Slurm カスタム設定により、フェアシェアスケジューリングやサービス品質レベルなど、さまざまなリソース管理シナリオをきめ細かく制御できます。例えば、キュー固有の優先度ポリシーを実装したり、プリエンプション設定を構成したり、カスタムの時間やリソースの制限を設定したりできるようになりました。さらに、アカウントレベルでアクセス権限を制御し、ジョブごとの実行動作を設定できます。これらの機能やその他の機能により、複数のチーム、プロジェクト、ワークロードタイプに効率的に対応する本番環境の HPC 環境を運用できます。
AWS PCS は、Slurm を使用して AWS で HPC ワークロードを実行およびスケールし、科学モデルやエンジニアリングモデルをより容易に構築できるようにするマネージドサービスです。AWS PCS を使用して、コンピューティング、ストレージ、ネットワーキング、および視覚化ツールを統合する、完全で伸縮自在な環境を構築することができます。AWS PCS は、管理された更新と組み込みのオブザーバビリティ機能でクラスター運用を簡素化するため、メンテナンス負担の解消に役立ちます。使い慣れた環境で作業することで、インフラストラクチャについて心配する代わりに、研究やイノベーションに集中できます。
拡張 Slurm カスタム設定は、AWS PCS が利用可能なすべての AWS リージョンで利用できます。詳細については、AWS PCS ユーザーガイドを参照してください。