Amazon CloudWatch GenAI オブザーバビリティが Amazon AgentCore Evaluations 評価のサポートを開始

投稿日: 2025年12月2日

Amazon CloudWatch では、AgentCore Evaluations を通じて AI エージェントの品質評価を自動化できるようになりました。この新機能により、デベロッパーは実際の対話に基づいてエージェントのパフォーマンスを継続的に監視および改善できるため、チームはお客様に影響が及ぶ前に品質問題を特定して対処できるようになります。

AgentCore Evaluations には、有用性、ツール選択、応答精度などの重要な品質側面をカバーする 13 種類の評価機能が事前に組み込まれており、カスタムのモデルベースのスコアリングシステムもサポートしています。CloudWatch ダッシュボードで統一された品質メトリクスとエージェントテレメトリにアクセスでき、エンドツーエンドのトレース機能で評価メトリクスをプロンプトやログと関連付けて確認できます。この機能は、Application Signals、アラーム、機密データ保護、Logs Insights などの CloudWatch の既存の機能とシームレスに統合されます。この機能により、チームがカスタム評価インフラストラクチャを構築して維持する必要がなくなり、高品質の AI エージェントのデプロイが加速されます。デベロッパーは、CloudWatch GenAI オブザーバビリティコンソールの AgentCore セクションからエージェントフリート全体をモニタリングできます。

AgentCore Evaluations は、米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (フランクフルト)、アジアパシフィック (シドニー) で利用できるようになりました。使用を開始するには、ドキュメント価格の詳細をご覧ください。基礎となるテレメトリデータには、標準の CloudWatch 料金が適用されます。