Avaliação de modelos do Amazon Bedrock já está disponível na região Europa (Zurique)

Publicado: 9 de dez de 2024

A avaliação de modelos no Amazon Bedrock permite avaliar, comparar e selecionar os melhores modelos de base para seu caso de uso. O Amazon Bedrock oferece a opção de usar um LLM como juiz, bem como avaliação programática e avaliação humana. Você pode usar um LLM como juiz para métricas como correção, integridade e coerência, bem como métricas de IA responsável, como recusa de resposta e nocividade. A avaliação programática oferece algoritmos para métricas como precisão, robustez e toxicidade. Além disso, para essas métricas ou para as métricas subjetivas e personalizadas, como simpatia ou estilo, você pode configurar um fluxo de trabalho de avaliação humana com apenas alguns cliques. A avaliação humana usa seus próprios funcionários ou uma equipe gerenciada pela AWS como revisores. A avaliação do modelo fornece conjuntos de dados selecionados integrados, ou você pode trazer seus próprios conjuntos de dados. Agora, os clientes podem avaliar modelos na região Europa (Zurique).

A avaliação de modelos no Amazon Bedrock já está disponível nessas regiões e a disponibilidade dos tipos de avaliação varia de acordo com a região.

Para saber mais sobre a avaliação de modelos no Amazon Bedrock, consulte a página de avaliações do Amazon Bedrock. Para começar a usar, faça login no Amazon Bedrock no Console de Gerenciamento da AWS ou use as APIs do Amazon Bedrock.

Selecione suas preferências de cookies

Avaliação de modelos do Amazon Bedrock já está disponível na região Europa (Zurique)

Encerramento do suporte para o Internet Explorer