Amazon CloudWatch Container Insights 為 Amazon EKS 新增低於一分鐘的 GPU 指標
Amazon CloudWatch Container Insights 現在支援以低於一分鐘的頻率針對 Amazon EKS 上執行的 AI 和 ML 工作負載收集 GPU 指標。客戶能夠在幾秒鐘內設定指標採樣率,從而實現更精細的 GPU 資源使用率監控。
此增強功能使客戶能夠有效監控執行時間不到 60 秒的 GPU 密集型工作負載,例如短時間取用 GPU 資源的 ML 推論工作。透過增加採樣頻率,客戶能夠保持對短期 GPU 工作負載的詳細可見性。低於一分鐘的 GPU 指標會以每分鐘一次的頻率傳送至 CloudWatch。這項精細的監控功能可協助客戶最佳化 GPU 資源使用率、疑難排解效能問題,並確保容器化 GPU 應用程式高效運作。
Container Insights 內低於一分鐘的 GPU 指標適用於所有 AWS 商業區域和 AWS GovCloud (美國) 區域。
若要進一步了解 Container Insights 內低於一分鐘的 GPU 指標,請前往 Amazon CloudWatch 使用者指南中的 NVIDIA GPU 指標頁面。客戶無需支付額外費用即可使用 Container Insights 內低於一分鐘的 GPU 指標。如需 Container Insights 定價,請參閱 Amazon CloudWatch 定價頁面。