Amazon SageMaker AI 現在支援 12 個額外模型的無伺服器強化微調
Amazon SageMaker AI 現在針對 12 個額外開放權重模型支援無伺服器模型自訂和增強微調,讓您無需佈建或管理基礎架構,即可微調和評估模型。最新支援的模型包括:gpt-oss-120b、Qwen2.5 72B Instruct、DeepSeek-R1-Distill-Llama-70B、Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B、Qwen2.5 14B Instruct、DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Qwen-7B、Qwen3 4B、Meta Llama 3.2 3B Instruct、Qwen3 1.7B 和 DeepSeek-R1-Distill-Qwen-1.5B。有了這項擴充功能,您可以使用監督式微調 (SFT)、直接偏好最佳化 (DPO) 以及強化微調 (RFT) 技術 (包括 RLVR 和 RLAIF) 來自訂這些模型,並且只需按用量付費即可。
強化微調可讓您將模型與複雜的領域特定推理任務對齊,而這類任務無法僅靠傳統 SFT 等技術完成。有了 RLVR,您就能透過根據正確性提供獎勵訊號來提高可驗證任務 (例如程式碼生成、數學和結構化擷取) 的模型準確性。RLAIF 會使用 AI 產生的意見回饋,將模型行為調整為符合您在品質和安全方面的偏好。這些技術可在先前支援和新增的模型上使用,不需要叢集設定、容量規劃或分散式訓練專業知識。
這些模型和微調技術適用於美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太地區 (東京) 和歐洲 (愛爾蘭)。若要開始使用,請參閱 Amazon SageMaker AI 模型自訂產品頁面,並瀏覽 Amazon SageMaker AI 定價頁面 (「模型自訂」索引標籤) 以查看模型、技術和定價的完整清單。