Amazon Bedrock agora oferece suporte ao ajuste fino por reforço, com ganhos de precisão de 66% em média em relação aos modelos de base
O Amazon Bedrock agora oferece suporte ao ajuste fino por reforço, o que ajuda você a melhorar a precisão do modelo sem precisar de uma profunda experiência em machine learning ou grandes quantidades de dados rotulados. O Amazon Bedrock automatiza o fluxo de trabalho de ajuste fino por reforço, tornando essa técnica avançada de personalização de modelos acessível aos desenvolvedores comuns. Os modelos aprendem a se alinhar com suas necessidades específicas usando um pequeno conjunto de prompts, em vez das grandes quantidades de dados necessárias para os métodos tradicionais de ajuste fino, o que permite às equipes começar rapidamente. Essa funcionalidade ensina os modelos por meio de feedback sobre várias respostas possíveis para o mesmo prompt, o que aprimora seu julgamento sobre o que constitui uma boa resposta. O ajuste fino por reforço no Amazon Bedrock oferece ganhos de precisão de 66% em média em relação aos modelos de base, para que você possa usar variantes de modelo menores, mais rápidas e mais econômicas, com a mesma alta qualidade.
As organizações têm dificuldade em adaptar os modelos de IA às suas necessidades de negócios específicas, sendo forçadas a escolher entre modelos genéricos com performance mediana ou personalizações caras e complexas que exigem talentos especializados, infraestrutura e movimentação arriscada de dados. O ajuste fino por reforço no Amazon Bedrock elimina essa complexidade ao tornar a personalização avançada de modelos rápida, automatizada e segura. Você pode treinar modelos carregando dados de treinamento diretamente do seu computador ou escolher entre conjuntos de dados já armazenados no Amazon S3, o que elimina a necessidade de conjuntos de dados rotulados. Você pode definir funções de recompensa usando avaliadores baseados em regras verificáveis ou juízes baseados em IA, juntamente com modelos integrados, para otimizar seus modelos tanto para tarefas objetivas, como geração de código ou raciocínio matemático, quanto para tarefas subjetivas, como seguir instruções ou interagir com chatbots. Seus dados proprietários nunca saem do ambiente seguro e controlado da AWS durante todo o processo de personalização, o que mitiga as preocupações com segurança e conformidade.
Você pode começar a usar o ajuste fino por reforço no Amazon Bedrock por meio do console do Amazon Bedrock e por meio das APIs do Amazon Bedrock. No lançamento, você poderá usar o ajuste fino por reforço com o Amazon Nova 2 Lite, e o suporte para outros modelos estará disponível em breve. Para saber mais sobre o ajuste fino por reforço no Amazon Bedrock, leia o blog de lançamento, a página de preços e a documentação.