Amazon SageMaker HyperPod anuncia una nueva capacidad de observabilidad

Publicado en: 10 de jul de 2025

La nueva capacidad de observación de Amazon SageMaker HyperPod permite a los clientes acelerar el desarrollo de modelos de IA generativa al proporcionar una visibilidad completa de los recursos de computación y las tareas de desarrollo de modelos. Evita el trabajo manual de recopilar cientos de métricas de toda la pila, visualizar las correlaciones entre ellas y restaurar el rendimiento de las tareas de desarrollo de modelos de IA generativa. La observabilidad de HyperPod rastrea las métricas de rendimiento de las tareas en tiempo real, alerta a los clientes cuando alguna de ellas se deteriora y corrige automáticamente la causa principal con políticas definidas por el cliente.

La observabilidad de SageMaker HyperPod transforma la manera en que los clientes supervisan y optimizan sus tareas de desarrollo de modelos de IA generativa. A través de un panel unificado preconfigurado en Amazon Managed Grafana con los datos de supervisión publicados automáticamente en un espacio de trabajo de Prometheus gestionado por Amazon, los clientes ahora pueden ver las métricas de rendimiento de las tareas de IA generativa, la utilización de los recursos y el estado del clúster en una sola vista. Esto permite que los equipos detecten rápidamente los cuellos de botella, eviten demoras costosas y optimicen los recursos de computación. Los clientes pueden definir alertas automatizadas, obtener métricas de tareas específicas para cada caso de uso y publicarlas en el panel unificado con solo unos pocos clics. Al reducir el tiempo de solución de problemas de días a minutos, esta capacidad ayuda a los clientes a acelerar su camino hacia la producción y maximizar el rendimiento de sus inversiones en IA.

La observabilidad de SageMaker HyperPod está disponible en todas las regiones de AWS en las que se admite SageMaker HyperPod, excepto en el oeste de EE. UU. (norte de California) y Asia-Pacífico (Melbourne). Para obtener más información y empezar, visite el blog, la documentación y la página web de SageMaker HyperPod.