張貼日期: Aug 2, 2019
從今天開始,AWS Batch 支援將主機裝置公開給 AWS Batch 任務的能力,包括 Elastic Fabric Adapter (EFA),讓您可以使用 AWS Batch 的受管執行個體佈建和排程來執行高效能的分散式 HPC 和機器學習工作負載。
EFA 是 Amazon EC2 執行個體適用的網路界面,可讓客戶在 AWS 上大規模執行需要高層級節點內通訊的應用程式。其客製化的作業系統 (OS) 略過硬體界面,可提升執行個體間通訊的效能,對於擴充這些應用程式至關重要。有了 EFA,使用訊息傳遞界面 (MPI) 的高效能運算 (HPC) 應用程式和使用 NVIDIA Collective Communications Library (NCCL) 的機器學習 (ML) 應用程式都可以擴展至數千個 CPU 或 GPU。因此,您可以獲得現場部署 HPC 叢集的應用程式效能,還有 AWS 雲端的隨需彈性和靈活性。
AWS Batch 是一種雲端原生排程器,可管理執行個體佈建和任務排程。AWS Batch 會根據任務規格自動地佈建執行個體,搭配適當的置放群組、網路組態以及任何使用者指定的檔案系統。Batch 會自動設定其啟動之執行個體的 EFA 互連,客戶透過單一 API 參數指定該執行個體。
要進一步了解如何使用 EFA 和將主機裝置公開給 AWS Batch,請瀏覽文件。