Amazon CloudWatch GenAI 可观测性现已支持 Amazon AgentCore Evaluations
发布于:
2025年12月2日
Amazon CloudWatch 现已支持通过 AgentCore Evaluations 对人工智能代理进行自动质量评测。这项新功能可帮助开发人员根据真实世界的交互持续监控和改善代理性能,使团队能够在质量问题影响客户之前识别和解决这些问题。
AgentCore Evaluations 带有 13 个预构建的评估器,涵盖了有用性、工具选择和响应准确性等基本质量维度,同时还支持基于自定义模型的评分系统。您可以在 CloudWatch 控制面板中访问统一的质量指标和代理遥测数据,并利用端到端跟踪功能将评估指标与提示和日志关联起来。该功能与 CloudWatch 的现有功能(包括应用程序信号、警报、敏感数据保护和日志见解)无缝集成。此功能无需团队构建和维护自定义评估基础设施,从而加快了高质量人工智能代理的部署。开发人员可以通过 CloudWatch GenAI 可观测性控制台中的 AgentCore 部分监控其整个代理实例集。
AgentCore 评估已在美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、欧洲地区(法兰克福)和亚太地区(悉尼)推出。要开始使用,请访问文档和定价详情。底层遥测数据将按标准 CloudWatch 定价收费。