La evaluación de los modelos de Amazon Bedrock ahora admite la evaluación de modelos importados personalizados
La evaluación de modelos en Amazon Bedrock le permite evaluar, comparar y seleccionar los mejores modelos básicos para su caso de uso. Amazon Bedrock ofrece la posibilidad de elegir entre la evaluación automática y la evaluación humana. Puede utilizar la evaluación automática con algoritmos predefinidos para métricas como la precisión, la solidez y la toxicidad. Además, para esas métricas o métricas subjetivas y personalizadas, como la amabilidad, el estilo y la alineación con la voz de la marca, puede configurar un flujo de trabajo de evaluación humana con unos pocos clics. Los flujos de trabajo de evaluación humana pueden aprovechar a sus propios empleados o a un equipo administrado por AWS como revisores. La evaluación del modelo proporciona conjuntos de datos seleccionados integrados, aunque usted puede usar sus propios conjuntos de datos.
Ahora, los clientes pueden evaluar sus propios modelos que importaron a Amazon Bedrock mediante la característica de importación de modelos personalizados. Esto permite a los clientes completar el ciclo de selección de un modelo base, personalizarlo, evaluarlo y volver a personalizarlo si es necesario o continuar con la producción si están satisfechos con el resultado de la evaluación. Para evaluar un modelo importado, simplemente, seleccione el modelo personalizado de la lista de modelos para evaluar en la herramienta de selección de modelos al crear un trabajo de evaluación.
La evaluación de modelos en Amazon Bedrock ya está disponible de forma general en estas regiones comerciales y en la región AWS GovCloud (Oeste de EE. UU.).
Para conocer más sobre la evaluación de modelos en Amazon Bedrock, consulte la página web de experiencia para desarrolladores de Amazon Bedrock. Para empezar, inicie sesión en Amazon Bedrock en la consola de administración de AWS o utilice la API de Amazon Bedrock.