L'observabilité d'Amazon CloudWatch GenAI prend désormais en charge Amazon AgentCore Evaluations
Amazon CloudWatch permet désormais d'évaluer automatiquement la qualité des agents d’IA via AgentCore Evaluations. Cette nouvelle fonctionnalité aide les développeurs à surveiller et à améliorer en permanence les performances des agents sur la base d'interactions réelles, permettant aux équipes d'identifier et de résoudre les problèmes de qualité avant qu'ils n'aient un impact sur les clients.
AgentCore Evaluations est livré avec 13 évaluateurs prédéfinis, couvrant des dimensions de qualité essentielles telles que l'utilité, la sélection des outils et la précision des réponses, tout en prenant en charge des systèmes de notation personnalisés basés sur des modèles. Vous pouvez accéder à des métriques de qualité unifiées et à la télémétrie des agents dans les tableaux de bord CloudWatch, avec des fonctionnalités de suivi de bout en bout pour corréler les métriques d'évaluation avec les invites et les journaux. Cette caractéristique s'intègre parfaitement aux fonctionnalités existantes de CloudWatch, notamment la vigie applicative, les alarmes, la protection des données sensibles et Logs Insights. Cette fonctionnalité évite aux équipes de créer et de gérer une infrastructure d'évaluation personnalisée, accélérant ainsi le déploiement d'agents d'IA de haute qualité. Les développeurs peuvent surveiller l'ensemble de leur flotte d'agents via la section AgentCore de la console d'observabilité CloudWatch GenAI.
AgentCore Evaluations est disponible dans les régions suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon), Europe (Francfort) et Asie-Pacifique (Sydney). Pour commencer, consultez la documentation et les détails des prix. La tarification standard de CloudWatch s'applique aux données de télémétrie sous-jacentes.