Amazon SageMaker AI ahora admite el refinamiento por refuerzos sin servidor para 12 modelos adicionales

Publicado en: 25 de mar de 2026

Amazon SageMaker AI ahora admite la personalización y el refinamiento por refuerzos de modelos sin servidor para 12 modelos de peso abierto adicionales, lo que le permite refinarlos y evaluarlos sin necesidad de aprovisionar ni administrar la infraestructura. Los nuevos modelos compatibles son: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B y DeepSeek-R1-Distill-Qwen-1.5B. Con esta expansión, puede personalizar estos modelos mediante técnicas de refinamiento monitoreado (SFT), optimización de preferencias directas (DPO) y refinamiento por refuerzo (RFT), incluido el aprendizaje por refuerzo a partir de los comentarios de la IA (RLAIF) y de las recompensas verificables (RLVR).

El refinamiento de refuerzo le permite alinear los modelos con tareas de razonamiento complejas y específicas de un dominio en las que técnicas como el SFT tradicional por sí solas no son suficientes. Con el RLVR, puede mejorar la precisión del modelo en tareas verificables como la generación de código, las matemáticas y la extracción estructurada al proporcionar señales de recompensa basadas en la exactitud. El RLAIF utiliza los comentarios generados por IA para orientar el comportamiento del modelo hacia sus preferencias de calidad y seguridad. Estas técnicas están disponibles en los modelos compatibles anteriormente y en los que se han agregado recientemente, sin necesidad de experiencia en configuración de clústeres, planificación de capacidad o entrenamiento distribuido.

Estos modelos y técnicas de refinamiento están disponibles en este de EE. UU. (norte de Virginia), oeste de EE. UU. (Oregón), Asia-Pacífico (Tokio) y UE (Irlanda). Para empezar, consulte la página del producto de personalización de modelos de Amazon SageMaker AI y visite la página de precios de Amazon SageMaker AI (pestaña Personalización de modelos) para ver la lista completa de modelos, técnicas y precios.