Amazon SageMaker AI 現在支援 12 個額外模型的無伺服器強化微調

張貼日期: 2026年3月25日

Amazon SageMaker AI 現在針對 12 個額外開放權重模型支援無伺服器模型自訂和增強微調，讓您無需佈建或管理基礎架構，即可微調和評估模型。最新支援的模型包括：gpt-oss-120b、Qwen2.5 72B Instruct、DeepSeek-R1-Distill-Llama-70B、Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B、Qwen2.5 14B Instruct、DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Qwen-7B、Qwen3 4B、Meta Llama 3.2 3B Instruct、Qwen3 1.7B 和 DeepSeek-R1-Distill-Qwen-1.5B。有了這項擴充功能，您可以使用監督式微調 (SFT)、直接偏好最佳化 (DPO) 以及強化微調 (RFT) 技術 (包括 RLVR 和 RLAIF) 來自訂這些模型，並且只需按用量付費即可。

強化微調可讓您將模型與複雜的領域特定推理任務對齊，而這類任務無法僅靠傳統 SFT 等技術完成。有了 RLVR，您就能透過根據正確性提供獎勵訊號來提高可驗證任務 (例如程式碼生成、數學和結構化擷取) 的模型準確性。RLAIF 會使用 AI 產生的意見回饋，將模型行為調整為符合您在品質和安全方面的偏好。這些技術可在先前支援和新增的模型上使用，不需要叢集設定、容量規劃或分散式訓練專業知識。

這些模型和微調技術適用於美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太地區 (東京) 和歐洲 (愛爾蘭)。若要開始使用，請參閱 Amazon SageMaker AI 模型自訂產品頁面，並瀏覽 Amazon SageMaker AI 定價頁面 (「模型自訂」索引標籤) 以查看模型、技術和定價的完整清單。

Amazon SageMaker AI 現在支援 12 個額外模型的無伺服器強化微調

了解

資源

開發人員

說明