Amazon SageMaker 现已推出 Cohere Command R 微调模型

亚马逊云科技宣布在 Amazon SageMaker 上推出 Cohere Command R 微调模型。这个最新加入 Amazon SageMaker 机器学习 (ML) 功能套件的模型,可以帮助企业充分利用大语言模型 (LLM) 的强大功能,在各种应用中发挥其全部潜力。

Cohere Command R 是一个可扩展的前沿大语言模型,专为轻松处理企业级工作负载而设计。Cohere Command R 针对对话交互和长上下文任务进行了优化,旨在平衡高性能与高精度,帮助公司从概念验证阶段迈向生产阶段。该模型在检索增强生成 (RAG) 和工具使用任务上具有高精度,延迟低、吞吐量高,支持长达 128000 个 token 的上下文长度,并在 10 种主要语言中表现出色。

在本文中,我们将探讨微调模型的原因,以及如何使用 Cohere Command R 完成微调过程。

微调:为特定用例定制大语言模型

微调是一种将大语言模型(如 Cohere Command R)适应到特定领域和任务中的有效技巧,从而显著提升基准模型的性能。评估显示,经过微调的 Cohere Command R 模型在金融服务、科技、零售、医疗、法律等行业的各种企业用例中,性能提升超过 20%。由于其体积较小,微调后的 Cohere Command R 模型相比同类更大的模型能够更高效地提供服务。

我们建议使用包含至少 100 个示例的数据集。

Cohere Command R 使用检索增强生成方法,从外部知识库中检索相关上下文以改进输出。然而,微调可以进一步对模型进行专业化调整。在多种场景下,对 Cohere Command R 等文本生成模型进行微调,对于最佳性能实现至关重要:

  • 特定领域适应:检索增强生成模型可能在金融、法律或医学等高度专业化的领域可能无法达到最优表现。微调可根据这些领域的细微差别对模型进行调整,从而提高准确性。
  • 数据增强:微调能够整合额外的数据源或技术,增强模型的知识库,提高稳健性,尤其是面对稀疏数据的情况。
  • 精细控制:尽管检索增强生成提供了令人印象深刻的通用能力,但微调允许对模型行为进行精细控制,使其精确地适应您的特定任务,以达到极致精度。

检索增强生成结合微调大语言模型的力量,使您能够以前所未有的多功能性和有效性应对各种挑战。随着 Cohere Command R 微调在 Amazon SageMaker 上的推出,企业现在可以根据其独有的需求定制和优化模型的性能。通过对特定领域数据的微调,企业可以提高 Cohere Command R 的准确性、相关性和有效性,以满足自然语言处理、文本生成和问答等用例的需求。

结合 Cohere Command R 的可扩展性和稳健性与在 Amazon SageMaker 上微调其性能的能力,亚马逊云科技助力企业应对人工智能采用的复杂性,并利用其变革力量推动各个行业和领域的创新与发展。

客户数据,包括提示、完成结果、定制模型以及用于微调或持续预训练的数据,都会保留在客户的亚马逊云科技账户中,且永远不会与第三方模型提供商共享。

解决方案概述

在接下来的部分中,我们将逐步介绍如何在 Amazon SageMaker 上微调 Cohere Command R 模型。这包括准备数据、部署模型、准备微调、创建推理端点以及执行推理。

准备微调数据

在开始微调作业之前,您需要上传包含训练数据和(可选)评估数据的数据集

首先,确保您的数据是 jsonl 格式,且具有以下结构:

  • messages:包含会话消息列表。每条消息包括以下部分:
  • role:指定当前讲话者的角色。您可以选择系统 (System)、用户 (User) 或聊天机器人 (Chatbot)。
  • content:包含消息的内容。

以下是训练一个聊天机器人回答问题的示例。为了便于阅读,文档跨越了多行。在您的数据集中,请确保每行包含一个完整的示例。

{
  "messages": [
    {
      "role": "System",
      "content": "You are a large language model trained by Cohere."
    },
    {
      "role": "User",
      "content": "Hi! What were Time magazines top 10 cover stories in the last 10 years?"
    },
    {
      "role": "Chatbot",
      "content": "Time magazines top 10 cover stories in the last 10 years were:\\n\\n1. Volodymyr Zelenskyy\\n2. Elon Musk\\n3. Martin Luther King Jr.\\n4. How Earth Survived\\n5. Her Lasting Impact\\n6. Nothing to See Here\\n7. Meltdown\\n8. Deal With It\\n9. The Top of America\\n10. Bitter Pill"
    },
    {
      "role": "User",
      "content": "Who is Volodymyr Zelenskyy?"
    },
    {
      "role": "Chatbot",
      "content": "Volodymyr Zelenskyy is a Ukrainian politician who was elected President of Ukraine in 2019. He previously served as the Minister of Internal Affairs in the government of Prime Minister Volodymyr Groysman."
    },
    {
      "role": "User",
      "content": "Thank you!"
    }
  ]
}

部署模型

Complete the following steps to deploy the model:

请完成以下部署模型的步骤:

1. 在 AWS Marketplace 上订阅 Cohere Command R 模型。

订阅模型后,您可以配置并创建训练作业。

2. 在 Amazon SageMaker 中选择“查看”。

3. 按照 UI 的指示创建训练作业。

或者,您可以使用以下示例笔记本创建训练作业。

准备微调

要对模型进行微调,您需要准备以下内容:

  • 产品 ARN:这将在您订阅产品后提供给您。
  • 训练数据集和评估数据集:准备用于微调的数据集。
  • Amazon S3 位置:指定存储训练和评估数据集的 Amazon Simple Storage Service (Amazon S3) 位置。
  • 超参数:微调通常涉及调整各种超参数,如学习率、批大小、迭代次数等。您需要为微调任务指定适当的超参数范围或值。

创建推理端点

微调完成后,您可以使用微调后的模型创建推理端点。请使用 create_endpoint 方法创建端点。如果端点已存在,您可以使用 connect_to_endpoint 方法连接到它。

执行推理

现在,您可以使用端点执行实时推理。以下是用于输入的示例消息:

message = "Classify the following text as either very negative, negative, neutral, positive or very positive: mr. deeds is , as comedy goes , very silly -- and in the best way."
result = co.chat(message=message)
print(result)

以下截图显示了微调模型的输出。

(可选)您还可以使用评估数据 (sample_finetune_scienceQA_eval.jsonl) 测试模型的准确性。

清理

完成笔记本运行并对 Cohere Command R 微调模型进行试验后,清理已配置的资源是至关重要的。如果不这样做,您的账户可能会产生不必要的费用。为防止这种情况发生,请使用以下代码删除资源并停止计费过程:

总结

Cohere Command R 的微调功能使您能够根据业务、领域和行业的需求自定义模型性能。除了微调模型,用户还可以受益于 Cohere Command R 在 10 种常用商业语言方面的熟练度,以及具有引文的检索增强生成功能,其可用于提供准确和经过验证的信息。通过微调,Cohere Command R 在目标用例上实现了高性能并减少了资源使用,企业无需大规模计算需求即可降低运营成本、改善延迟并提高吞吐量。

现在就开始在 Amazon SageMaker 上使用 Cohere 的微调模型吧。

新手入门

快速体验生成式 AI

无需部署,借助开箱即用的 Amazon Bedrock 一次体验多种高性能模型,包括 Claude 3, Llama 3, SDXL, Mistral 等。

快速部署管理私服游戏

一键启动所需资源,快速完成游戏私服的自动化启动,备份以及恢复。

使用生成式 AI 构建多语言问答知识库

使用多种服务,构建可汇总搜索结果的多语言知识库。

免费套餐

AWS 海外区域

拓展海外业务或个人体验
免费使用 100 余种云产品或服务, 长达 12 个月

AWS 中国区域

发展中国业务
免费使用 40 余种核心云服务产品,长达 12 个月