La observabilidad de IA generativa de Amazon CloudWatch ahora es compatible con AgentCore Evaluations
Amazon CloudWatch ahora permite la evaluación automatizada de la calidad de los agentes de IA mediante las AgentCore Evaluations. Esta nueva capacidad ayuda a los desarrolladores a supervisar y mejorar continuamente el rendimiento de los agentes en función de las interacciones del mundo real, lo que permite a los equipos identificar y abordar los problemas de calidad antes de que afecten a los clientes.
AgentCore Evaluations viene con 13 evaluadores prediseñados que cubren dimensiones de calidad esenciales como la utilidad, la selección de herramientas y la precisión de la respuesta, al tiempo que admiten sistemas de puntuación personalizados basados en modelos. Puede acceder a métricas de calidad unificadas y telemetría de agentes en los paneles de CloudWatch, con capacidades de rastreo de extremo a extremo para correlacionar las métricas de evaluación con las peticiones y los registros. La función se integra perfectamente con las capacidades existentes de CloudWatch, incluidas las señales de aplicaciones, las alarmas, la protección de datos confidenciales y la información de los registros. Esta capacidad elimina la necesidad de que los equipos creen y mantengan una infraestructura de evaluación personalizada, lo que acelera el despliegue de agentes de IA de alta calidad. Los desarrolladores pueden supervisar toda su flota de agentes a través de la sección AgentCore de la consola de observabilidad GenAI de CloudWatch.
AgentCore Evaluations ya está disponible en las regiones este de EE. UU. (Ohio y norte de Virginia), oeste de EE. UU. (Oregón), Europa (Fráncfort) y Asia Pacífico (Sídney). Para empezar, consulte la documentación y los detalles de precios. Los precios estándar de CloudWatch se aplican a los datos de telemetría subyacentes.