La evaluación del modelo de Amazon Bedrock ya está disponible en Europa (Zúrich)

Publicado en: 9 de dic de 2024

La evaluación de modelos en Amazon Bedrock le permite evaluar, comparar y seleccionar los mejores modelos fundacionales para su caso de uso. Amazon Bedrock ofrece la opción de utilizar un LLM-as-a-judge (LLM como juez), una evaluación mediante programación y una evaluación humana. Puede usar este tipo de modelos para métricas como la corrección, la integridad y la coherencia, así como para métricas de IA responsables, como el rechazo de respuestas y la nocividad. La evaluación mediante programación ofrece algoritmos para métricas como la precisión, la solidez y la toxicidad. Además, para esas métricas o las métricas subjetivas y personalizadas, como la facilidad de uso o el estilo, puedes configurar un flujo de trabajo de evaluación humana con unos pocos clics. La evaluación humana utiliza a sus propios empleados o a un equipo administrado por AWS como revisores. La evaluación de modelos proporciona conjuntos de datos seleccionados integrados, aunque usted puede usar sus propios conjuntos de datos. Ahora, los clientes pueden evaluar modelos en Europa (Zúrich).

La evaluación del modelo en Amazon Bedrock ya está disponible en estas regiones y la disponibilidad de los tipos de evaluación varía según la región.

Para obtener más información sobre la evaluación del modelo en Amazon Bedrock, consulte la página de evaluaciones de Amazon Bedrock. Para empezar, inicie sesión en Amazon Bedrock en la consola de administración de AWS o utilice la API de Amazon Bedrock.