Penyempurnaan penguatan Amazon Bedrock menambahkan dukungan untuk model bobot terbuka dengan API yang kompatibel dengan OpenAI
Amazon Bedrock sekarang memperluas dukungan penguatan penyempurnaan (RFT) ke model bobot terbuka populer, termasuk model OpenAI GPT-OSS dan Qwen, dan memperkenalkan API penyempurnaan yang kompatibel dengan OpenAI. Kemampuan ini memudahkan developer untuk meningkatkan akurasi model bobot terbuka tanpa memerlukan keahlian machine learning yang mendalam atau volume besar data berlabel. Penyempurnaan penguatan di Amazon Bedrock mengotomatiskan alur kerja kustomisasi end-to-end, memungkinkan model belajar dari umpan balik tentang beberapa kemungkinan respons menggunakan serangkaian prompt kecil, bukan set data pelatihan besar tradisional. Penyetelan penguatan memungkinkan pelanggan untuk menggunakan varian model yang lebih kecil, lebih cepat, dan lebih hemat biaya sambil mempertahankan kualitas tinggi.
Organisasi sering berjuang untuk menyesuaikan model fondasi dengan kebutuhan bisnis unik mereka, memaksa pertukaran antara model generik dengan kinerja terbatas dan jalur penyesuaian yang kompleks dan mahal yang memerlukan infrastruktur dan keahlian khusus. Amazon Bedrock menghilangkan kerumitan ini dengan memberikan pengalaman penyempurnaan penguatan yang terkelola penuh dan aman. Pelanggan menentukan fungsi penghargaan menggunakan penilaian berbasis aturan yang dapat diverifikasi atau juri berbasis AI, termasuk templat bawaan untuk tugas objektif seperti pembuatan kode dan penalaran matematika, dan tugas subjektif seperti mengikuti instruksi atau kualitas percakapan. Selama pelatihan, pelanggan dapat menggunakan fungsi AWS Lambda untuk logika penilaian khusus, dan mengakses pos pemeriksaan model menengah untuk mengevaluasi, men-debug, dan memilih model berkinerja terbaik, meningkatkan kecepatan iterasi dan efisiensi pelatihan. Semua data kepemilikan tetap berada dalam lingkungan AWS yang aman dan diatur selama proses penyesuaian.
Model yang didukung pada peluncuran ini adalah: qwen.qwen3-32b and openai.gpt-oss-20b. Setelah penyempurnaan selesai, pelanggan dapat segera menggunakan model yang disempurnakan yang dihasilkan untuk inferensi sesuai permintaan melalui API yang kompatibel dengan OpenAI Amazon Bedrock - API Tanggapan dan API Penyelesaian Obrolan, tanpa langkah deployment tambahan. Untuk mempelajari lebih lanjut, lihat dokumentasi Amazon Bedrock.