Amazon Bedrock 強化微調新增具有 OpenAI 相容 API 的開放重型模型支援

張貼日期: 2026年2月17日

Amazon Bedrock 現在將強化微調 (RFT) 支援延伸至常用的開放權重模型,包括 OpenAI GPT-OSS 和 Qwen 模型,並推出與 OpenAI 相容的微調 API。這些功能可讓開發人員更輕鬆地提高開放權重模型準確度,而不需要深度的機器學習專業知識或大量經過標記的資料。Amazon Bedrock 中的強化微調能夠自動處理端對端自訂工作流程,使模型得以使用一組少量的提示 (而非傳統的大型訓練資料集),從多個可能回應的意見回饋中學習。強化微調使客戶能夠使用較小、更快、更具成本效益的模型變體,同時保持高品質。

組織通常難以根據其獨特的業務需求調整基礎模型,因此必須強迫在效能有限的通用模型和需要專業基礎架構和專業知識的複雜、昂貴的自訂管道之間做出權衡。Amazon Bedrock 透過提供完全受管、安全的強化微調體驗來消除這種複雜性。客戶能夠使用可驗證的規則型評分工具或 AI 型評判來定義獎勵函式,包括用於程式碼生成和數學推理等客觀任務以及主觀任務 (例如指令跟進或對話品質) 的內建範本。客戶能夠在訓練期間使用 AWS Lambda 函式實現自訂分級邏輯,並存取中間模型檢查點來評估、偵錯和選取效能最佳的模型,從而提高迭代速度和訓練效率。在整個自訂過程中,所有專屬資料都會保留在 AWS 的安全受管理環境中。

此版本支援的模型為:qwen.qwen3-32b 和 openai.gpt-oss-20b。完成微調後,客戶能夠立即使用產生的微調模型,透過 Amazon Bedrock 的 OpenAI 相容 API (Responses API 和 Chat Completions API) 進行隨需推論,而無需任何額外部署步驟。若要進一步了解,請參閱 Amazon Bedrock 文件