Amazon Bedrock prend désormais en charge le peaufinage des renforcements, offrant des gains de précision de 66 % en moyenne par rapport aux modèles de base

Publié le: 3 déc. 2025

Amazon Bedrock permet désormais d'affiner le renforcement, ce qui vous permet d'améliorer la précision des modèles sans avoir besoin d'une expertise approfondie en matière de machine learning ou de grandes quantités de données étiquetées. Amazon Bedrock automatise le flux de travail de peaufinage des renforcements, rendant cette technique avancée de personnalisation des modèles accessible aux développeurs ordinaires. Les modèles apprennent à s'aligner sur vos besoins spécifiques à l'aide d'un petit ensemble d'instructions plutôt que des grandes quantités de données nécessaires aux méthodes de peaufinage traditionnelles, ce qui permet aux équipes de démarrer rapidement. Cette fonctionnalité enseigne aux modèles grâce à un feedback sur les multiples réponses possibles à la même invite, améliorant ainsi leur jugement sur ce qui constitue une bonne réponse. Le peaufinage des renforcements dans Amazon Bedrock permet de gagner 66 % de précision en moyenne par rapport aux modèles de fondation, ce qui vous permet d'utiliser des variantes de modèles plus petites, plus rapides et plus économiques tout en préservant une qualité élevée.

Les entreprises ont du mal à adapter les modèles d'IA à leurs besoins métiers uniques, ce qui les oblige à choisir entre des modèles génériques aux performances moyennes ou une personnalisation complexe et coûteuse qui nécessite des talents spécialisés, une infrastructure et des mouvements de données risqués. Le peaufinage du renforcement dans Amazon Bedrock élimine cette complexité en rendant la personnalisation avancée des modèles rapide, automatisée et sécurisée. Vous pouvez entraîner des modèles en téléchargeant les données d'entraînement directement depuis votre ordinateur ou en choisissant parmi des ensembles de données déjà stockés dans Amazon S3, ce qui vous évite d'avoir à utiliser des jeux de données étiquetés. Vous pouvez définir des fonctions de récompense en utilisant des évaluateurs vérifiables basés sur des règles ou des juges basés sur l'IA, ainsi que des modèles intégrés pour optimiser vos modèles à la fois pour des tâches objectives telles que la génération de code ou le raisonnement mathématique, et pour des tâches subjectives telles que le suivi des instructions ou les interactions avec un chatbot. Vos données exclusives ne quittent jamais l'environnement sécurisé et régi d'AWS pendant tout le processus de personnalisation, ce qui atténue les problèmes de sécurité et de conformité.

Vous pouvez commencer à peaufiner le renforcement dans Amazon Bedrock via la console Amazon Bedrock et les API Amazon Bedrock. Au lancement, vous pouvez utiliser le peaufinage des renforts avec Amazon Nova 2 Lite, qui sera bientôt compatible avec d'autres modèles. Pour en savoir plus sur le peaufinage du renforcement dans Amazon Bedrock, consultez le blog de lancement, la page de tarification et la documentation.