Instâncias gerenciadas do Amazon ECS já oferecem métricas de GPU da NVIDIA
Agora, o Amazon Elastic Container Service (Amazon ECS) oferece métricas de GPU da NVIDIA para workloads conteinerizadas executadas em instâncias gerenciadas do Amazon ECS. Disponíveis no Amazon CloudWatch Container Insights com observabilidade aprimorada, essas métricas oferecem aos clientes visibilidade sobre a integridade e o desempenho de GPUs para ajudar a solucionar problemas e otimizar workloads aceleradas por GPU no Amazon ECS.
Com as novas métricas de GPU, os clientes de instâncias gerenciadas do Amazon ECS já podem monitorar a capacidade, utilização, memória, integridade do hardware e condições térmicas de GPUs diretamente no CloudWatch. Usando o Container Insights com observabilidade aprimorada, os clientes têm visibilidade detalhada dessas métricas, inclusive no nível do dispositivo de GPU. Essas métricas oferecem aos clientes visibilidade da integridade operacional e do hardware de GPUs em toda a frota de instâncias gerenciadas do Amazon ECS. Dessa forma, eles podem dimensionar corretamente a capacidade das GPUs, solucionar problemas de desempenho e detectar problemas antes que eles afetem workloads aceleradas por GPU, como treinamento e inferência de IA/ML.
As métricas de GPU da NVIDIA para instâncias gerenciadas do Amazon ECS estão disponíveis por meio do Container Insights em todas as regiões comerciais da AWS. Para começar a usar, habilite o Container Insights com observabilidade aprimorada em um cluster do Amazon ECS e inicie tipos de instância acelerados por GPU do Amazon EC2 por meio de um provedor de capacidade de instâncias gerenciadas do Amazon ECS. Para obter os preços do Container Insights, consulte a página de preços do Amazon CloudWatch. Para saber mais, consulte o guia do usuário do Amazon ECS Container Insights com métricas de observabilidade aprimoradas.