AWS Parallel Computing Service 支援 slurmdbd 和 cgroups 設定

張貼日期: 2026年3月26日

AWS Parallel Computing Service (AWS PCS) 現在支援 slurmdbd 和 cgroups 的其他 Slurm 組態設定,讓您能直接透過 AWS PCS 主控台、CLI 或 SDK 微調記帳行為和資源隔離。此功能可協助您實作適合正式環境的 HPC 環境,具備更完善的隱私控制、彈性的資料保留政策,以及更優異的資源管理。

使用 slurmdbd 設定,您可以設定 Slurm 記帳在叢集上的運作方式──包括隱私控制、資料保留政策,以及工作負載追蹤功能。透過 cgroups 支援,您可以藉由繫結 CPU 核心來防止資源超額配置、強制執行記憶體限制以維持節點穩定性,並控制裝置存取,以確保工作負載在定義的界限內執行。

AWS PCS 是一項受管服務,可使用 Slurm 簡化在 AWS 上執行與擴展 HPC 工作負載。您可以建置完整且具彈性的環境,整合運算、儲存、網路和視覺化工具,而此服務則會透過受管更新和內建可觀測性功能來處理叢集作業。

此功能適用於所有提供 AWS PCS 的提供 AWS PCS 的 AWS 區域。在建立新的叢集時,或透過修改現有叢集時,您都可以設定這些設定。若要了解詳情,請參閱 AWS PCS 使用者指南