Publicado en: Apr 23, 2024

La información de contenedores de Amazon CloudWatch con observabilidad mejorada para EKS ahora descubre automáticamente las métricas fundamentales de estado de sus aceleradores de AWS Trainium e Inferentia, y de los adaptadores de red de alto rendimiento de AWS (adaptadores Elastic Fabric) y de las GPU de NVIDIA. Puede visualizar estas métricas listas para usar en paneles seleccionados de información de contenedores para ayudar a monitorear su infraestructura acelerada y optimizar sus cargas de trabajo de IA para lograr la excelencia operativa. 

Con el servicio de información de contenedores mejorada, ahora puede correlacionar fácilmente las métricas de computación y memoria con las métricas de su red entre nodos para ayudar a comprender el impacto del tráfico en las tareas que se ejecutan en sus clústeres de EKS, como la supervisión de los trabajos de entrenamiento sensibles a la latencia. El servicio de información de contenedores mejorada le permite supervisar fácilmente la eficiencia del consumo de recursos mediante sus algoritmos distribuidos de aprendizaje profundo e inferencia, de modo que puede optimizar la asignación de recursos y minimizar las interrupciones prolongadas en sus aplicaciones. El servicio de información de contenedores mejorada ofrece una observabilidad de computación acelerada con visualizaciones automáticas y elimina la necesidad de crear paneles y configurar alarmas de forma manual.

Comenzar con la observabilidad de computación acelerada es fácil. Puede incorporar el servicio de información de contenedores mejorada instalando el complemento observabilidad de CloudWatch en sus clústeres o instalando manualmente el agente de CloudWatch para mejorar la observabilidad. Una vez configurado, puede acceder a la consola de información de contenedores y ver su telemetría de computación acelerada lista para usar.

La observabilidad de computación acelerada ya está disponible en el servicio de información de contenedores mejorada para EKS en todas las regiones comerciales de AWS, incluidas las regiones de AWS GovCloud (EE. UU.) y China. Las métricas de computación acelerada siguen los precios basados en la observación. Consulte la página de precios del servicio de información de contenedores para obtener más detalles. Para obtener más información, consulte la guía del usuario de información de contenedores.