La observabilidad de IA generativa de Amazon CloudWatch ahora es compatible con AgentCore Evaluations

Publicado en: 2 de dic de 2025

Amazon CloudWatch ahora permite la evaluación automatizada de la calidad de los agentes de IA mediante las AgentCore Evaluations. Esta nueva capacidad ayuda a los desarrolladores a supervisar y mejorar continuamente el rendimiento de los agentes en función de las interacciones del mundo real, lo que permite a los equipos identificar y abordar los problemas de calidad antes de que afecten a los clientes.

AgentCore Evaluations viene con 13 evaluadores prediseñados que cubren dimensiones de calidad esenciales como la utilidad, la selección de herramientas y la precisión de la respuesta, al tiempo que admiten sistemas de puntuación personalizados basados en modelos. Puede acceder a métricas de calidad unificadas y telemetría de agentes en los paneles de CloudWatch, con capacidades de rastreo de extremo a extremo para correlacionar las métricas de evaluación con las peticiones y los registros. La función se integra perfectamente con las capacidades existentes de CloudWatch, incluidas las señales de aplicaciones, las alarmas, la protección de datos confidenciales y la información de los registros. Esta capacidad elimina la necesidad de que los equipos creen y mantengan una infraestructura de evaluación personalizada, lo que acelera el despliegue de agentes de IA de alta calidad. Los desarrolladores pueden supervisar toda su flota de agentes a través de la sección AgentCore de la consola de observabilidad GenAI de CloudWatch.

AgentCore Evaluations ya está disponible en las regiones este de EE. UU. (Ohio y norte de Virginia), oeste de EE. UU. (Oregón), Europa (Fráncfort) y Asia Pacífico (Sídney). Para empezar, consulte la documentación y los detalles de precios. Los precios estándar de CloudWatch se aplican a los datos de telemetría subyacentes.