Amazon SageMaker AI kini mendukung penyempurnaan penguatan nirserver untuk 12 model tambahan

Dikirim di: 25 Mar 2026

Amazon SageMaker AI kini mendukung kustomisasi model nirserver dan penyempurnaan penguatan untuk 12 model open-weight tambahan, memungkinkan Anda untuk menyempurnakan dan mengevaluasinya tanpa perlu menyediakan atau mengelola infrastruktur. Model-model yang baru didukung adalah: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B, dan DeepSeek-R1-Distill-Qwen-1.5B. Dengan perluasan ini, Anda dapat menyesuaikan model-model ini menggunakan teknik penyempurnaan terawasi (SFT), optimasi preferensi langsung (DPO), dan penyempurnaan penguatan (RFT) termasuk RLVR dan RLAIF, dan hanya membayar untuk apa yang Anda gunakan.

Penyempurnaan penguatan memungkinkan Anda untuk menyelaraskan model dengan tugas penalaran kompleks dan spesifik domain di mana teknik seperti SFT tradisional saja tidak cukup. Dengan RLVR, Anda dapat meningkatkan akurasi model pada tugas-tugas yang dapat diverifikasi seperti pembuatan kode, matematika, dan ekstraksi terstruktur dengan memberikan sinyal penghargaan berdasarkan kebenarannya. RLAIF menggunakan umpan balik yang dihasilkan AI untuk mengarahkan perilaku model sesuai dengan preferensi kualitas dan keamanan Anda. Teknik-teknik ini tersedia pada model yang sebelumnya didukung dan model yang baru ditambahkan, tanpa memerlukan pengaturan klaster, perencanaan kapasitas, atau keahlian pelatihan terdistribusi.

Model dan teknik penyempurnaan ini tersedia di AS Timur (Virginia Utara), AS Barat (Oregon), Asia Pasifik (Tokyo), dan Uni Eropa (Irlandia). Untuk memulai, lihat halaman produk kustomisasi model Amazon SageMaker AI dan kunjungi halaman harga Amazon SageMaker AI (tab Kustomisasi Model) untuk melihat daftar lengkap model, teknik, dan harga.

Amazon SageMaker AI kini mendukung penyempurnaan penguatan nirserver untuk 12 model tambahan

Pelajari

Sumber Daya

Developer

Bantuan