亚马逊AWS官方博客
推出 Amazon Nova Forge:使用 Nova 构建自己的前沿模型
各组织正在迅速将生成式人工智能的使用范围扩展到业务的各个部分。需要深厚域专业知识或特定业务上下文的应用程序,需要真正了解其专有知识、工作流程和独特要求的模型。
尽管提示工程和检索增强生成(RAG)等技术适用于许多使用案例,但在将专业知识嵌入到模型的核心理解中时,它们存在根本的局限性。监督式微调和强化学习有助于自定义模型,但它们在开发生命周期中运行得太晚,在经过全面训练的模型之上进行了分层修改,因此很难精准定位于特定的相关域。
当组织尝试仅使用其专有数据通过持续预训练(CPT)进行更深入的定制时,他们经常会遇到灾难性遗忘现象,即模型在学习新内容时会失去基础能力。同时,对于大多数组织来说,从头开始训练模型所需的数据、计算和成本仍然是一个令人望而却步的障碍。
今天,我们推出 Amazon Nova Forge,这是一项使用 Nova 构建自己的前沿模型的新服务。Nova Forge 客户可以从早期的模型检查点开始开发,将他们的数据集与 Amazon Nova 精选的训练数据进行混合,并将他们的自定义模型安全地托管在 AWS 上。Nova Forge 是构建自己的前沿模型的最简单、最具成本效益的方式。
使用案例和应用程序
Nova Forge 专为能够访问专有或行业特定数据、想要构建真正了解其域的人工智能的组织而设计。其中包括:
- 制造和自动化:构建能够理解专业流程、设备数据和行业特定工作流程的模型
- 研究与开发:创建基于专有研究数据和域特定知识训练的模型
- 内容和媒体:开发能够理解品牌调性、内容标准和特定审核要求的模型
- 专业行业:训练有关行业特定术语、法规和最佳实践的模型
根据具体使用案例,Nova Forge 可用于添加差异化功能、提高特定任务的准确性、降低成本和降低延迟。
Nova Forge 的工作原理
Nova Forge 可帮助您从训练前、训练中和训练后阶段的各个早期检查点开始模型开发,从而解决了当前自定义方法的局限性。您可以在所有训练阶段将您的专有数据与 Amazon Nova 精选的数据进行混合,使用经过验证的配方在 Amazon SageMaker AI 完全托管的基础设施上进行训练。与仅使用原始数据进行训练相比,这种数据混合方法可显著减少灾难性遗忘现象,有助于保留基础技能,包括核心智能、一般指令遵循能力和安全优势,同时融入您的专业知识。
Nova Forge 提供了在自己的环境中使用奖励功能进行强化学习(RL)的功能。这使模型能够从代表您使用案例的环境中生成的反馈中学习。除了单步评估外,您还可以使用自己的编排工具来管理多轮部署,从而为复杂的代理工作流程和顺序式决策任务启用 RL 训练。无论您是使用化学工具对分子设计进行评分,还是使用机器人模拟来奖励高效完成任务并惩罚碰撞,您都可以直接连接您的专有环境。
您还可以利用 Nova Forge 中内置的负责任的人工智能工具包来配置模型的安全和内容审核设置。您可以调整设置,以满足您在安全、安保和敏感内容处理等领域的特定业务需求。
开始使用 Nova Forge
Nova Forge 可与您现有的 AWS 工作流程无缝集成。您可以使用 Amazon SageMaker AI 中熟悉的工具和基础设施来运行训练,然后将自定义 Nova 模型作为私有模型导入到 Amazon Bedrock 上。这为您提供了与 Amazon Bedrock 中的任何模型相同的安全性、一致的 API 和更广泛的 AWS 集成。
在 Amazon SageMaker Studio 中,您现在可以使用 Amazon Nova 构建自己的前沿模型。
要开始构建模型,请选择要使用的检查点:训练前、训练中或训练后。您也可以在此处上传数据集或使用现有数据集。
您可以通过混入 Nova 提供的精选数据集来混合训练数据。这些按域分类的数据集可以帮助您的模型保持一般性能,并防止过拟合或出现灾难性遗忘。
或者,您可以选择使用强化微调(RFT)来提高事实准确性并减少特定域中的幻觉。
训练完成后,将模型导入 Amazon Bedrock 并开始在您的应用程序中使用它。
注意事项
Amazon Nova Forge 在美国东部(弗吉尼亚州北部)的 AWS 区域可用。该计划包括对多个 Nova 模型检查点的访问权限、将专有数据与 Amazon Nova 精选的训练数据混合的训练配方、经过验证的训练配方以及与 Amazon SageMaker AI 和 Amazon Bedrock 的集成。
在 Amazon Nova 用户指南中了解更多信息,并通过 Amazon SageMaker AI 控制台探索 Nova Forge。
对专家帮助感兴趣的组织也可以联系我们的生成式人工智能创新中心,为其模型开发计划寻求更多支持。
– Danilo



