AWS ParallelCluster 3.15 支援 P6-B300 和 Slurm 25.11
AWS ParallelCluster 3.15 現已正式推出。此版本新增對 P6-B300 執行個體類型的支援,並將 Slurm 升級至 25.11 版,提供加速作業重新排入佇列功能。
透過對 P6-B300 的支援,您可以在最新的 NVIDIA Blackwell GPU 基礎設施上執行要求嚴苛的 AI/ML 和高效能運算工作負載。此版本包含改良的 EFA 網路組態預設值,並支援網路介面自訂。若要了解如何自訂網路介面,請參閱使用啟動範本覆寫自訂運算節點網路介面。其他改進包括更可靠的叢集更新、提升大型叢集中緊密耦合工作負載的效能,以及支援不中斷更新叢集標籤。如需更多詳細資訊,請查閱 AWS ParallelCluster 3.15.0 版本備註。
AWS ParallelCluster 是開放原始碼的叢集管理工具,可讓研發客戶和 IT 管理員在 AWS 上操作高效能運算 (HPC) 叢集。ParallelCluster 旨在自動、安全地將雲端資源佈建到能在 AWS 上大規模執行科學和工程工作負載的可彈性擴展 HPC 叢集。在此處列出的 AWS 區域中,您無需額外付費即可使用 ParallelCluster,而且僅需針對執行應用程式所需的 AWS 資源付費。
若要進一步了解有關在 AWS 上啟動 HPC 叢集的更多資訊,請瀏覽 ParallelCluster 使用者指南。若要開始使用 ParallelCluster,請參閱 ParallelCluster 的 UI 和 CLI 安裝說明。