NVIDIA GPU 時間切割功能現已適用於 Bottlerocket,以提高 AI/ML 工作負載效率
AWS 今天宣布為 Bottlerocket 推出 NVIDIA GPU 時間切割支援,這是專為託管容器而打造的 Linux 作業系統,專注於安全性、最小佔用空間和安全更新。此新功能透過為容器上執行的人工智慧/機器學習 (AI/ML) 工作負載達到更有效率的 GPU 資源共站,解決了在多租用戶和資源限制環境中最大化 GPU 使用率的挑戰。
透過將 GPU 的處理時間分為較小的間隔或「切片」,Bottlerocket 支援時間切割功能可讓多個工作同時存取單一 GPU。這讓 Bottlerocket 客戶能夠在單一 GPU 上執行多個 AI/ML 模型,進而提高 GPU 使用率,並讓其更有效地擴展工作負載。
在所有商業和 AWS GovCloud (美國) 區域現在都可以使用 Bottlerocket 上的 GPU 時間切割。若要進一步了解 Bottlerocket' 的 GPU 時間切割功能,請造訪 Bottlerocket 開發人員網站。