Amazon Bedrock ahora admite el refinamiento de los refuerzos, lo que proporciona un aumento de precisión del 66 % en promedio con respecto a los modelos básicos

Publicado en: 3 de dic de 2025

Amazon Bedrock ahora admite el refinamiento de los refuerzos, lo que le ayuda a mejorar la precisión de los modelos sin necesidad de contar con una profunda experiencia en machine learning o grandes cantidades de datos etiquetados. Amazon Bedrock automatiza el flujo de trabajo de refinamiento de los refuerzos, lo que hace que esta técnica avanzada de personalización de modelos sea accesible para los desarrolladores habituales. Los modelos aprenden a alinearse con sus requisitos específicos mediante un pequeño conjunto de peticiones en lugar de las grandes sumas de datos necesarias para los métodos tradicionales de refinamiento, lo que permite a los equipos comenzar rápidamente. Esta capacidad enseña a los modelos a través de la retroalimentación sobre múltiples respuestas posibles a la misma petición, lo que mejora su juicio sobre lo que constituye una buena respuesta. El refinamiento de los refuerzos en Amazon Bedrock ofrece, de media, un aumento de precisión del 66 % en comparación con los modelos básicos, por lo que puede utilizar variantes de modelo más pequeñas, rápidas y rentables sin perder la alta calidad.

Las organizaciones luchan por adaptar los modelos de IA a sus necesidades empresariales únicas, lo que las obliga a elegir entre modelos genéricos con un rendimiento promedio o una personalización costosa y compleja que requiere talento especializado, infraestructura y un movimiento de datos arriesgado. El refinamiento de los refuerzos en Amazon Bedrock elimina esta complejidad al hacer que la personalización avanzada de los modelos sea rápida, automatizada y segura. Puede entrenar modelos cargando los datos de entrenamiento directamente desde su ordenador o elegir entre los conjuntos de datos ya almacenados en Amazon S3, lo que elimina la necesidad de utilizar conjuntos de datos etiquetados. Puede definir las funciones de recompensa utilizando evaluadores verificables basados en reglas o jueces basados en inteligencia artificial, junto con plantillas integradas para optimizar sus modelos tanto para tareas objetivas, como la generación de código o el razonamiento matemático, como para tareas subjetivas, como el seguimiento de instrucciones o las interacciones con chatbots. Sus datos patentados nunca abandonan el entorno seguro y gobernado de AWS durante todo el proceso de personalización, lo que mitiga los problemas de seguridad y cumplimiento.

Puede empezar a refinar los refuerzos en Amazon Bedrock a través de la consola de Amazon Bedrock y de las API de Amazon Bedrock. En el momento del lanzamiento, podrá utilizar el refinamiento de los refuerzos con Amazon Nova 2 Lite y, próximamente, será compatible con otros modelos. Para obtener más información sobre el refinamiento de los refuerzos en Amazon Bedrock, lea el blog de lanzamiento, la página de precios y la documentación.