AWS Parallel Computing Service (PCS) 現已支援 Slurm v25.05
張貼日期:
2025年10月17日
AWS Parallel Computing Service (PCS) 現已支援 Slurm v25.05。您現在可以建立執行較新的 Slurm v25.05 的 AWS PCS 叢集。
PCS 中的 Slurm v25.05 版本可提供全新 Slurm 功能,包括增強的多叢集 sackd 組態和改進的執行個體啟動失敗重新佇列行為。在此版本推出後,登入節點現在可以控制多個叢集,而不需要重新設定或重新啟動 sackd。這可讓管理員預先設定使用者對多個叢集的存取權。新的重新佇列行為會透過在容量短缺期自動重試失敗的執行個體啟動作業,使作業排程更具彈性,從而提高整體叢集可靠性。
AWS PCS 是一項受管服務,可讓您更輕鬆地使用 Slurm 在 AWS 上執行和擴展高效能運算 (HPC) 工作負載。若要進一步了解 PCS,請參閱服務文件和 AWS 區域表。