Amazon CloudWatch Container Insights 現在支援 Amazon EKS 上的 Neuron UltraServers
張貼日期:
2025年11月21日
Amazon CloudWatch Container Insights 現在支援 Amazon EKS 上的 Neuron UltraServers,能夠為在多個執行個體節點上執行大規模、高效能機器學習工作負載的客戶提供增強的可觀測性。這項新功能讓資料科學家和機器學習工程師得以有效地監控其容器化 ML 應用程式並進行疑難排解,提供跨 Neuron UltraServer 群組的整合指標並簡化管理作業。
Neuron UltraServers 會將多個 EC2 執行個體合併為單一邏輯伺服器單位,針對使用 AWS Trainium 和 Inferentia 加速器的機器學習工作負載進行最佳化。Container Insights 是 Amazon CloudWatch 中的一項監控和診斷功能,其會自動在容器化應用程式中收集指標。在此版本推出後,Container Insights 導入一項專門針對 EKS 環境內之 UltraServers 的新篩選器。您現在可以選取 UltraServer ID 來檢視該伺服器內所有執行個體的新彙總指標,這讓您無須單獨監控個別執行個體。除了每個執行個體的指標之外,您現在還可以檢視整個 UltraServer 群組的合併效能資料,從而簡化在 AWS Neuron 上執行之 ML 工作負載的監控作業。
Amazon CloudWatch Container Insights 適用於所有商業 AWS 區域和 AWS GovCloud (美國) 區域。
若要著手使用,請參閱 Amazon CloudWatch 使用者指南中的 AWS Trainium 和 AWS Inferentia 的 AWS Neuron 指標