Amazon CloudWatch Container Insights agora oferece suporte ao Neuron UltraServers no Amazon EKS
O Amazon CloudWatch Container Insights agora oferece suporte ao Neuron UltraServers no Amazon EKS, fornecendo maior observabilidade para clientes que executam workloads de machine learning em grande escala e alta performance em nós de várias instâncias. Esse novo recurso permite que cientistas de dados e engenheiros de ML monitorem e solucionem problemas com eficiência em suas aplicações de ML em contêineres, oferecendo métricas agregadas e gerenciamento simplificado em todos os grupos do Neuron UltraServer.
Os Neuron UltraServers combinam várias instâncias do EC2 em uma única unidade lógica de servidor, otimizada para workloads de machine learning usando os aceleradores do AWS Trainium e Inferentia. O Container Insights, um atributo de monitoramento e diagnóstico do Amazon CloudWatch, coleta automaticamente métricas de aplicações em contêineres. Com esse lançamento, o Container Insights apresenta um novo filtro específico para UltraServers em ambientes do EKS. Agora você pode selecionar uma ID do UltraServer para visualizar novas métricas agregadas em todas as instâncias desse servidor, substituindo a necessidade de monitorar instâncias individuais separadamente. Além das métricas por instância, agora você pode visualizar dados consolidados de performance de todo o grupo do UltraServer, simplificando o monitoramento das workloads de ML executadas no AWS Neuron.
O Amazon CloudWatch Container Insights está disponível em todas as regiões comerciais da AWS e nas regiões AWS GovCloud (EUA).
Para começar a usá-lo, consulte AWS Neuron metrics for AWS Trainium and AWS Inferentia no Guia do usuário do Amazon CloudWatch