Amazon Bedrock AgentCore 推出代理性能优化功能(预览版)

发布于: 2026年4月30日

Amazon Bedrock AgentCore 推出了建议功能,并提供了两种性能验证方法(批量评估和 A/B 测试)。这构成了生产环境中人工智能代理的“观察、评估、改进”循环。此前,将评估结果转化为具体的、经验证的改进措施往往需要开发人员手动干预和凭直觉判断,而不是系统的方法。借助建议功能、批量评估和 A/B 测试,开发人员现在拥有了根据评估结果采取行动的工具。

随着模型的演进和用户行为的变化,代理质量会随时间的推移悄然下降。建议功能会分析 AgentCore 生成的生产跟踪记录和评估结果,针对您的具体工作负载生成经过优化的系统提示和工具说明。随后,系统会通过批量评估,利用预定义的测试用例对提供的建议进行验证。A/B 测试会针对预定义的测试集或实时生产流量进行受控 A/B 测试,进一步验证这些建议,并在任何变更上线前报告统计显著性。每项建议在发布前都需要您的批准。这些功能共同构成了代理性能改进的完整循环。代理不仅能够运行,还能根据您的需求不断优化。

您可以在提供 AgentCore Evaluations 服务的所有 AWS 区域中使用这些优化功能。要了解更多信息,请访问 AgentCore 文档