Amazon Bedrock 现在支持强化微调，与基础模型相比，其准确性平均提升 66%

发布于: 2025年12月3日

Amazon Bedrock 现在支持强化微调功能，您无需拥有深厚的机器学习专业知识或大量的标签数据，即可提高模型准确性。Amazon Bedrock 可以自动执行强化微调工作流程，这让广大普通开发者也能使用这种高级模型自定义技术。模型通过少量的提示就能满足您的特定需求，而无需像传统微调方法那样使用大量数据进行训练，这使得团队能够快速上手。此功能通过针对同一提示的多种可能响应提供反馈来训练模型，从而提升它们对何为优质响应的判断力。与基础模型相比，Amazon Bedrock 中强化微调的准确性平均提升 66%，因此您可以在保持高质量的同时，使用更小、更快、更具成本效益的模型变体。

组织很难调整人工智能模型来满足自己的独特业务需求，这使得他们面临两难选择：使用性能一般的通用模型，还是使用复杂但昂贵的自定义模型，后者需要专业人才和基础设施支持，而且伴随着高风险的数据迁移。Amazon Bedrock 中的强化微调使高级模型自定义变得快速、自动化和安全，从而消除了这种复杂性。您可以直接通过计算机上传训练数据来训练模型，也可以使用已存储在 Amazon S3 中的数据集，这样就无需任何添加标注的数据集。您可以使用基于规则的可验证评分器或基于人工智能的评判模型以及内置模板来定义奖励函数，以便针对客观任务（例如代码生成或数学推理）和主观任务（例如指令执行或聊天机器人互动）进行优化。在整个自定义过程中，您的专有数据永远不会离开 AWS 安全、受管控的环境，从而减少安全性与合规性问题。

您可以通过 Amazon Bedrock 控制台和 Amazon Bedrock API 开始使用 Amazon Bedrock 中的强化微调。在首发阶段，您可以使用 Amazon Nova 2 Lite 进行强化微调，未来将支持更多模型。要详细了解 Amazon Bedrock 中的强化微调，请参阅发布博客、定价页面和文档。

Amazon Bedrock 现在支持强化微调，与基础模型相比，其准确性平均提升 66%

了解

资源

开发人员

帮助