問:什麼是彈性 HPC 叢集?

彈性叢集提供的 HPC 環境具備與傳統 HPC 叢集相同的「外觀和操作方式」,但是增加了可擴展的優點:將任務提交到佇列並視需要啟動節點,當節點閒置時自動啟動任務,而當不再需要節點時自動關閉它們。

問:為 HPC 使用 Amazon Web Services 有哪些好處?

AWS 很有彈性。您不用支付高額的前期資本費用,只需按使用量付費。啟動 1000 個核心叢集並只執行一天,則只需支付一天的費用。此外,雲端叢集可持續存取最新版的硬體,而且也能自訂將在硬體上執行的每個應用程式叢集。許多 AWS HPC 客戶每一天都在擴展 (和縮減) 叢集。AWS 可在大量的地理區域之間操作,每個區域中駐有多個大規模的可用區域,其中包含一或多個資料中心。這可讓 AWS 客戶在自己所選的位置輕鬆、有效率地存取無限的運算容量。

問:在 AWS 上執行 HPC 應用程式有哪些選項?

有許多開放原始碼和商用 HPC 解決方案都支援 AWS。許多 HPC 使用者選擇從 AWS ParallelCluster 開始,以自訂軟體來符合他們的獨特需求。其他 HPC 使用者則偏好以手動方式部署運算執行個體,或使用自己的指令碼,利用 AWS CLI 叫用 EC2 API。對於部分使用者來說,可能比較偏好使用全受管 SaaS 產品。所有這些選項都是可行的,且適合 AWS 客戶使用。 

問:什麼是 AWS ParallelCluster?

AWS ParallelCluster 是用來建立和啟動 AWS CloudFormation 範本的工具。它是可呼叫 AWS 服務 (包括 Amazon EC2、Amazon EBS 和 Amazon S3) 的 Python 應用程式。它也使用 Amazon SQS、Amazon DynamoDB、Amazon CloudWatch 和 AWS CloudFormation 來監控和維護叢集。如需詳細資訊,請參閱 AWS ParallelCluster 文件。 

問:使用 AWS ParallelCluster 執行 HPC 應用程式有哪些好處?

AWS ParallelCluster 搭配各式各樣的軟體開發工具、共享磁碟以及一系列精選的排程軟體、執行個體及執行監控功能,能夠快速地存取叢集環境。AWS ParallelCluster 佇列軟體可由多位使用者啟動。不僅如此,AWS ParallelCluster 啟動的環境已完全設定完畢,可使用 AWS 增強的聯網功能來執行 MPI 應用程式。

問:AWS ParallelCluster 軟體的費用為何?

AWS ParallelCluster 是 AWS 建立的免費開放原始碼工具。

問:HPC 叢集中 AWS 資源的費用為何?

一旦部署之後,會產生一般 AWS 基礎設施費用,其中包括主執行個體、運算節點、EBS 磁碟區及任何使用的 Amazon S3 儲存的費用。如需詳細資訊,請參閱使用的服務和成本

問:如果我的應用程式需要使用不同的基礎設施組態,該怎麼辦? 是否可輕鬆使用 AWS ParallelCluster 進行試驗?

是 – AWS ParallelCluster 特別適合用於試驗,因為叢集可按照您的需求以及隨著需求的演變輕鬆地重新設定。不僅如此,AWS ParallelCluster 組態檔可放置在版本控制下,以記錄每個試驗使用的設定。尋找最佳效能或最低成本時,AWS ParallelCluster 可讓您輕鬆測試不同叢集組態的各種方面,例如,執行個體類型、作業系統及儲存組態。