Avaliação de modelos do Amazon Bedrock já está disponível na região Europa (Zurique)

Publicado: 9 de dez de 2024

A avaliação de modelos no Amazon Bedrock permite avaliar, comparar e selecionar os melhores modelos de base para seu caso de uso. O Amazon Bedrock oferece a opção de usar um LLM como juiz, bem como avaliação programática e avaliação humana. Você pode usar um LLM como juiz para métricas como correção, integridade e coerência, bem como métricas de IA responsável, como recusa de resposta e nocividade. A avaliação programática oferece algoritmos para métricas como precisão, robustez e toxicidade. Além disso, para essas métricas ou para as métricas subjetivas e personalizadas, como simpatia ou estilo, você pode configurar um fluxo de trabalho de avaliação humana com apenas alguns cliques. A avaliação humana usa seus próprios funcionários ou uma equipe gerenciada pela AWS como revisores. A avaliação do modelo fornece conjuntos de dados selecionados integrados, ou você pode trazer seus próprios conjuntos de dados. Agora, os clientes podem avaliar modelos na região Europa (Zurique).

A avaliação de modelos no Amazon Bedrock já está disponível nessas regiões e a disponibilidade dos tipos de avaliação varia de acordo com a região.

Para saber mais sobre a avaliação de modelos no Amazon Bedrock, consulte a página de avaliações do Amazon Bedrock. Para começar a usar, faça login no Amazon Bedrock no Console de Gerenciamento da AWS ou use as APIs do Amazon Bedrock.