Approfondimenti sui container Amazon CloudWatch ora supporta Neuron UltraServers su Amazon EKS
Approfondimenti sui container Amazon CloudWatch ora supporta Neuron UltraServers su Amazon EKS, fornendo una migliore osservabilità per i clienti che eseguono carichi di lavoro di machine learning su larga scala e ad alte prestazioni su nodi a istanza multipla. Questa nuova funzionalità consente ai data scientist e agli ingegneri ML di monitorare efficientemente le applicazioni ML basate su container e risolverne i problemi in modo efficace, offrendo metriche aggregate e una gestione semplificata tra i gruppi Neuron UltraServers.
Neuron UltraServers combina più istanze EC2 in un'unica unità server logica, ottimizzata per i carichi di lavoro di machine learning utilizzando gli acceleratori AWS Trainium e Inferentia. Approfondimenti sui container, una funzionalità di monitoraggio e diagnostica di Amazon CloudWatch, raccoglie automaticamente le metriche dalle applicazioni basate su container. Con questo lancio Approfondimenti sui container introduce un nuovo filtro specifico per UltraServers in ambienti EKS. Ora puoi selezionare un ID UltraServers per visualizzare nuove metriche aggregate per tutte le istanze presenti nel server, eliminando la necessità di monitorare le singole istanze separatamente. Oltre alle metriche per singola istanza, è ora possibile visualizzare dati di performance consolidati per l'intero gruppo UltraServers, semplificando il monitoraggio dei carichi di lavoro ML in esecuzione su AWS Neuron.
Approfondimenti sui container Amazon CloudWatch è disponibile in tutte le regioni AWS commerciali e nelle regioni AWS GovCloud (Stati Uniti).
Per iniziare, consulta le metriche di AWS Neuron per AWS Trainium e AWS Inferentia nella guida utente di Amazon CloudWatch