As Avaliações do Amazon Bedrock AgentCore agora estão disponíveis ao público em geral
As Avaliações do Amazon Bedrock AgentCore agora estão disponíveis ao público em geral, fornecendo avaliação automatizada de qualidade para agentes de IA. As avaliações permitem que os desenvolvedores monitorem a qualidade do agente por meio da avaliação contínua do tráfego de produção, validem as mudanças por meio de testes de fluxos de trabalho e avaliem o desempenho do agente em relação às expectativas definidas. As Avaliações do AgentCore oferecem dois tipos de avaliação. A avaliação on-line monitora continuamente o desempenho do agente na produção por meio de amostragem e pontuação de traços ao vivo. A avaliação sob demanda permite que as equipes testem agentes de forma programática, apoiando testes de regressão em pipelines de CI/CD e fluxos de trabalho de desenvolvimento interativos.
As equipes podem avaliar os agentes usando 13 avaliadores integrados para qualidade de resposta, segurança, conclusão de tarefas e uso de ferramentas. Os desenvolvedores também podem usar o Ground Truth para medir o desempenho do agente em relação às expectativas, incluindo respostas de referência para validação de respostas, afirmações comportamentais para metas em nível de sessão e sequências esperadas de execução da ferramenta. Para requisitos específicos de domínio, as equipes podem configurar avaliadores personalizados usando sua escolha de prompts e modelos para avaliação baseada em LLM, ou implementar lógica personalizada em Python ou JavaScript por meio de funções hospedadas em Lambda para avaliação baseada em código. As avaliações se integram ao AgentCore Observability para monitoramento unificado e alertas em tempo real.
As Avaliações do AgentCore estão disponíveis em nove regiões da AWS: Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Europa (Frankfurt) e Europa (Irlanda).
Saiba mais sobre as Avaliações do Amazon Bedrock AgentCore por meio da documentação e comece a usar o Kit de Ferramentas de Introdução ao AgentCore