Amazon CloudWatch GenAI 可觀測性現已支援 Amazon AgentCore Evaluations
張貼日期:
2025年12月2日
Amazon CloudWatch 現可透過 AgentCore Evaluations 實現 AI 代理程式的自動化品質評估。此新功能可協助開發人員根據真實世界的互動持續監控並改善代理程式效能,讓團隊能在品質問題影響客戶之前加以識別並進行處理。
AgentCore Evaluations 提供 13 種預先建置的評估器,涵蓋協助性、工具選取與回應準確性等重要品質面向,並支援自訂的模型式評分系統。您可以在 CloudWatch 儀表板中存取統一的品質指標與代理程式遙測資料,並透過端對端追蹤功能將評估指標與提示及日誌建立關聯。此功能可與 CloudWatch 既有功能無縫整合,包括 Application Signals、警示、敏感資料保護與 Logs Insights。此功能讓團隊無須自行建置與維護自訂評估基礎結構,加速高品質 AI 代理程式的部署。開發人員可透過 CloudWatch GenAI 可觀測性主控台中的 AgentCore 區段監控整個代理程式機群。
AgentCore Evaluations 現已在美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、歐洲 (法蘭克福) 與亞太地區 (雪梨) 推出。若要開始使用,請瀏覽文件與定價詳細資訊。基礎遙測資料適用標準 CloudWatch 定價。