ขณะนี้ Amazon SageMaker AI รองรับการปรับแต่งเพิ่มเติมแบบเสริมแรงแบบไม่ต้องใช้เซิร์ฟเวอร์สำหรับโมเดลเพิ่มเติมอีก 12 โมเดลแล้ว

โพสต์บน: 25 มี.ค. 2026

ขณะนี้ Amazon SageMaker AI รองรับการปรับแต่งโมเดลแบบไม่ต้องใช้เซิร์ฟเวอร์ และการปรับแต่งเพิ่มเติมแบบเสริมแรง สำหรับโมเดลโมเดลที่เปิดเผยค่าน้ำหนักเพิ่มเติมอีก 12 โมเดล ซึ่งช่วยให้คุณสามารถปรับแต่งและประเมินโมเดลเหล่านี้ได้โดยไม่ต้องจัดสรรหรือจัดการโครงสร้างพื้นฐาน โมเดลที่รองรับเพิ่มเติมใหม่ ได้แก่ gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B และ DeepSeek-R1-Distill-Qwen-1.5B ด้วยการขยายนี้ คุณสามารถปรับแต่งโมเดลเหล่านี้ได้โดยใช้เทคนิคการปรับแต่งเพิ่มเติมแบบมีผู้สอน (SFT), การเพิ่มประสิทธิภาพตามความชอบโดยตรง (DPO) และการปรับแต่งเพิ่มเติมแบบเสริมแรง (RFT) รวมถึง RLVR และ RLAIF และชำระค่าบริการตามการใช้งานจริง

การปรับแต่งเพิ่มเติมแบบเสริมแรงช่วยให้คุณสามารถปรับโมเดลให้สอดคล้องกับงานการให้เหตุผลที่ซับซ้อนและเฉพาะโดเมน ซึ่งเทคนิคอย่าง SFT แบบดั้งเดิมเพียงอย่างเดียวไม่เพียงพอ ด้วย RLVR จะทำให้คุณสามารถปรับปรุงความแม่นยำของโมเดลในงานที่สามารถตรวจสอบได้ เช่น การสร้างโค้ด คณิตศาสตร์ และการดึงข้อมูลแบบมีโครงสร้าง โดยการให้สัญญาณรางวัลตามความถูกต้อง RLAIF ใช้ข้อเสนอแนะที่สร้างโดย AI เพื่อกำหนดทิศทางพฤติกรรมของโมเดลให้สอดคล้องกับความต้องการด้านคุณภาพและความปลอดภัยของคุณ เทคนิคเหล่านี้พร้อมใช้งานทั้งบนโมเดลที่รองรับก่อนหน้านี้และโมเดลที่เพิ่มเข้ามาใหม่ โดยไม่ต้องมีการตั้งค่าคลัสเตอร์ การวางแผนปริมาณการประมวลผล หรือความเชี่ยวชาญด้านการฝึกแบบกระจาย

โมเดลและเทคนิคการปรับแต่งเพิ่มเติมเหล่านี้พร้อมให้ใช้งานแล้วในสหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), เอเชียแปซิฟิก (โตเกียว) และยุโรป (ไอร์แลนด์) ในการเริ่มต้นใช้งาน โปรดดูหน้าผลิตภัณฑ์การเพิ่มประสิทธิภาพโมเดลของ Amazon SageMaker AI และไปที่ Amazon SageMaker AI หน้าค่าบริการ (แท็บ Model Customization (การเพิ่มประสิทธิภาพโมเดล)) เพื่อดูรายการโมเดล เทคนิค และราคาทั้งหมด