Amazon Bedrock AgentCore 推出可最佳化代理程式效能的功能 (預覽版)
張貼日期:
2026年4月30日
Amazon Bedrock AgentCore 推出建議和兩種驗證效能的方法 (批次評估和 A/B 測試)。這會完善正式作業環境中 AI 代理程式的觀察、評估和改進循環。截至目前為止,將評估調查結果轉化為具體、經過驗證的改進,會需要開發人員手動干預與直覺判斷,而不是採用系統化的方法。透過建議、批次評估和 A/B 測試,開發人員現在能夠使用工具對評估所顯示的問題採取行動。
隨著模型的演變和使用者行為變化,代理程式的品質會隨著時間推移而產生難以察覺的下滑。建議功能會分析 AgentCore 產生的生產追蹤和評估輸出,進而建立針對特定工作負載量身打造的最佳化系統提示和工具描述。然後系統會使用批次評估來針對預先定義的測試案例驗證建議。A/B 測試會透過受控的 A/B 測試,對預先定義的測試組或即時生產流量進一步驗證這些建議,並在推行任何變更之前報告統計顯著性。每個建議在發佈前都需要您的核准。結合這些功能,即可完善代理程式的效能改進週期。代理程式不僅僅會執行,還會根據你的條件持續改進。
您能夠在提供 AgentCore 評估的所有 AWS 區域中使用最佳化功能。若要進一步了解,請參閱 AgentCore 文件。