Amazon SageMaker AI agora oferece suporte ao ajuste fino de reforço sem servidor para 12 modelos adicionais

Publicado: 25 de mar de 2026

O Amazon SageMaker AI agora oferece suporte à personalização de modelos e ao ajuste fino de reforço em modo sem servidor para 12 modelos adicionais de peso aberto, que permitem ajustar e avaliar sem provisionar ou gerenciar a infraestrutura. Os novos modelos compatíveis são: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B e DeepSeek-R1-Distill-Qwen-1.5B. Com essa expansão, você pode personalizar esses modelos usando técnicas de ajuste fino supervisionado (SFT), otimização de preferência direta (DPO) e ajuste fino por reforço (RFT), incluindo RLVR e RLAIF, e pagar apenas pelo que usar.

O ajuste fino por reforço permite alinhar modelos a tarefas de raciocínio complexas e específicas de domínio, nas quais técnicas como o SFT tradicional por si só são insuficientes. Com o RLVR, você pode melhorar a precisão do modelo em tarefas verificáveis, como geração de código, matemática e extração estruturada, que fornecem sinais de recompensa com base na correção. O RLAIF usa feedback gerado por IA para orientar o comportamento do modelo de acordo com suas preferências de qualidade e segurança. Essas técnicas estão disponíveis tanto nos modelos já compatíveis quanto nos recém-adicionados, sem necessidade de configurar clusters, planejar capacidade ou ter conhecimento em treinamento distribuído.

Esses modelos e técnicas de ajuste fino estão disponíveis nas regiões Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Ásia-Pacífico (Tóquio) e UE (Irlanda). Para começar a usá-los, consulte a página do produto de personalização de modelos do Amazon SageMaker AI e acesse a página de preços do Amazon SageMaker AI (guia Personalização de modelos) para ver a lista completa de modelos, técnicas e preços.