張貼日期: Nov 12, 2018
AWS ParallelCluster 是受完整支援和維護的開放原始碼叢集管理工具,可讓科學家、研究人員和 IT 管理員輕鬆在 AWS 雲端部署和管理高效能運算 (HPC) 叢集。HPC 叢集是緊密結合的運算、儲存和網路資源集合,可讓客戶執行大規模的科學和工程工作負載。AWS ParallelCluster 旨在做為熱門開放原始碼 CfnCluster 專案的增強功能和替代方案,讓客戶在 AWS 快速建立 HPC 叢集。該工具可自動設定所需的運算資源和共享檔案系統,並提供各種批次排程器選項,包括 AWS Batch、Sun Grid Engine (SGE)、Torque 和 Slurm。
AWS ParallelCluster 減少了叢集管理的操作開銷,並簡化在 AWS 執行 HPC 工作負載的程序。AWS ParallelCluster 可協助快速啟動概念驗證 (POC) 和生產部署。使用 AWS ParallelCluster 無須支付額外費用,只需支付應用程式執行所需的 AWS 資源費用。AWS ParallelCluster 透過 Python Package Index (PyPI) 發佈。AWS ParallelCluster 是託管在 GitHub Amazon Web Services 資料儲存器下的來源程式碼,網址為:https://github.com/aws/aws-parallelcluster
要了解如何使用 AWS ParallelCluster 啟動 HPC 叢集,請參閱這裡