Amazon CloudWatch Container Insights unterstützt jetzt Neuron UltraServers auf Amazon EKS

Veröffentlicht am: 21. Nov. 2025

Amazon CloudWatch Container Insights unterstützt jetzt Neuron UltraServers auf Amazon EKS und bietet Kunden, die umfangreiche, leistungsstarke Machine-Learning-Workloads auf Knoten mit mehreren Instances ausführen, eine verbesserte Beobachtbarkeit. Diese neue Funktion ermöglicht es Datenwissenschaftlern und ML-Engineers, ihre containerisierten ML-Anwendungen effizient zu überwachen und Fehler zu beheben. Sie bietet aggregierte Metriken und eine vereinfachte Verwaltung über Neuron-UltraServer-Gruppen hinweg.

Neuron UltraServer kombinieren mehrere EC2-Instances zu einer einzigen logischen Servereinheit, die mithilfe von AWS Trainium- und Inferentia-Beschleunigern für Machine-Learning-Workloads optimiert ist. Container Insights, ein Überwachungs- und Diagnose-Feature in Amazon CloudWatch, erfasst automatisch Metriken aus containerisierten Anwendungen. Mit diesem Launch führt Container Insights einen neuen Filter speziell für UltraServer in EKS-Umgebungen ein. Sie können jetzt eine UltraServer-ID auswählen, um neue aggregierte Metriken für alle Instances innerhalb dieses Servers anzuzeigen, sodass einzelne Instances nicht mehr separat überwacht werden müssen. Zusätzlich zu den Instance-spezifischen Metriken können Sie jetzt konsolidierte Leistungsdaten für die gesamte UltraServer-Gruppe abrufen, wodurch die Überwachung von ML-Workloads, die auf AWS Neuron ausgeführt werden, optimiert wird.

Amazon CloudWatch Container Insights ist in allen kommerziellen AWS-Regionen und in AWS GovCloud (USA) verfügbar.

Eine Einstiegshilfe finden Sie unter AWS-Neuron-Metriken für AWS Trainium und AWS Inferentia im Amazon-CloudWatch-Benutzerhandbuch.