AWS Parallel Computing Service 擴充 Slurm 自訂功能
張貼日期:
2025年10月2日
AWS Parallel Computing Service (AWS PCS) 現在提供擴充的 Slurm 組態功能,讓您得以設定超過 60 個額外參數,以便對高效能運算 (HPC) 叢集作業進行精細控制。此增強功能可在管理工作排程、資源分配、存取控制和工作生命週期方面提供更大的彈性。
全新的 Slurm 自訂設定可讓您對各種資源管理案例進行精細控制,包括公平分享排程和服務層級品質。例如,您現在可以實作佇列特定的優先順序政策、設定先佔設定,以及設定自訂時間和資源限制。此外,您還可以在帳戶層級控制存取權限,並設定每項工作的執行行為。這些功能和其他功能可協助您執行能夠高效率地為多個團隊、專案和工作負載類型提供服務的生產 HPC 環境。
AWS PCS 是一項受管服務,可讓您更輕鬆地執行和擴展 HPC 工作負載,以及使用 Slurm 在 AWS 上建置科學和工程模型。您可以使用 AWS PCS 建置整合運算、儲存、網路和視覺化工具的完整彈性環境。AWS PCS 透過受管更新和內建的可觀測性功能簡化叢集操作,有助於減輕繁重的維護工作。您可以在熟悉的環境中開展工作,專注於研究和創新,而不必擔心基礎設施的處理。
提供 AWS PCS 的所有 AWS 區域均可使用擴充的 Slurm 自訂設定。若要進一步了解,請參閱 AWS PCS 使用者指南。