Reinforcement Fine Tuning von Amazon Bedrock bietet Unterstützung für Open-Weight-Modelle mit OpenAI-kompatiblen APIs

Veröffentlicht am: 17. Feb. 2026

Amazon Bedrock erweitert die Unterstützung von Reinforcement Fine Tuning (RFT) auf beliebte Open-Weight-Modelle, einschließlich OpenAI-GPT-OSS- und Qwen-Modelle, und führt OpenAI-kompatible APIs zur Feinabstimmung ein. Diese Funktionen erleichtern es Entwicklern, die Genauigkeit von Open-Weight-Modellen ohne tiefgreifendes Fachwissen zu Machine Learning oder große Mengen an beschrifteten Daten zu verbessern. Reinforcement Fine Tuning in Amazon Bedrock automatisiert den gesamten Anpassungsworkflow, sodass Modelle aus dem Feedback zu mehreren möglichen Antworten lernen können, indem sie statt herkömmlicher großer Trainingsdatensätze eine kleine Anzahl von Eingabeaufforderungen verwenden. Das Reinforcement Fine Tuning ermöglicht es Kunden, kleinere, schnellere und kostengünstigere Modellvarianten zu verwenden und gleichzeitig eine hohe Qualität beizubehalten.

Unternehmen haben oft Schwierigkeiten, die Basismodelle an ihre individuellen Geschäftsanforderungen anzupassen, was Kompromisse zwischen generischen Modellen mit begrenzter Leistung und komplexen, teuren Anpassungspipelines erfordert, die eine spezielle Infrastruktur und Fachwissen erfordern. Amazon Bedrock beseitigt diese Komplexität, indem es eine vollständige verwaltete, sichere Erfahrung zum Reinforcement Fine Tuning bietet. Kunden können Belohnungsfunktionen mithilfe überprüfbarer regelbasierter Benoter oder KI-basierter Richter zusammen mit integrierten Vorlagen definieren, sowohl für objektive Aufgaben wie Codegenerierung oder mathematisches Denken als auch für subjektive Aufgaben wie das Befolgen von Anweisungen oder Gesprächsqualität. Während des Trainings können Kunden die AWS-Lambda-Funktionen für eine benutzerdefinierte Benotungslogik verwenden und auf fortgeschrittene Modell-Checkpoints zugreifen, um das Modell mit der besten Leistung zu bewerten, zu debuggen und auszuwählen, wodurch die Iterationsgeschwindigkeit und die Trainingseffizienz verbessert werden. Alle geschützten Daten verbleiben während des gesamten Anpassungsprozesses in der sicheren, kontrollierten Umgebung von AWS.

Bei diesem Launch werden folgende Modelle unterstützt: qwen.qwen3-32b und openai.gpt-oss-20b. Nach Abschluss der Feinabstimmung können Kunden sofort das daraus resultierende, fein abgestimmte Modell für On-Demand-Inferenzen über die OpenAI-kompatiblen APIs von Amazon Bedrock – Responses API und Chat Completions API – verwenden, ohne dass zusätzliche Bereitstellungsschritte erforderlich sind. Weitere Informationen finden Sie in der Amazon-Bedrock-Dokumentation.