亚马逊AWS官方博客

Anthropic 的 Claude 3.5 Sonnet 模型现已在 Amazon Bedrock 中推出:比 Claude 3 Opus 更智能,而成本只是它的五分之一

Anthropic 推出 Claude 3 仅过去了 3 个月,Claude 3 是一系列最先进的人工智能(AI)模型,可让您根据自己的需求,从智能、速度和成本方面考虑选择最适合的组合。

今天,Anthropic 推出了 Claude 3.5 Sonnet,这是它即将推出的 Claude 3.5 模型系列中的第一个版本。我们很高兴地宣布,Claude 3.5 Sonnet 现已在 Amazon Bedrock 中推出。

Claude 3.5 Sonnet 提高了智能行业门槛,在各种评估中的表现都优于其他生成式人工智能模型,包括 Anthropic 之前最智能的模型 Claude 3 Opus。Claude 3.5 Sonnet 推出后,其速度和成本与最初的 Claude 3 Sonnet 模型的速度和成本相同。实际上,您现在以五分之一的价格就可以获得超越 Claude 3 Opus 的智能和速度,因为 Claude 3.5 Sonnet 比 Opus 便宜 80%。

Anthropic Claude 3.5 Sonnet 系列

Claude 3.5 Sonnet 所展示出的前沿智能与具有成本效益的定价相结合,使该模型成为复杂任务的理想之选,例如提供上下文敏感的客户支持、编排多步工作流程和简化代码转换。

Claude 3.5 Sonnet 为本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、代码(HumanEval)等设定了新的行业基准。正如您在下表中所见,根据 Anthropic 的数据,Claude 3.5 Sonnet 在几乎所有基准测试中的表现都超过了 OpenAI 的 GPT-4o 和 Google 的 Gemini 1.5 Pro。

Anthropic Claude 3.5 Sonnet 基准测试

Claude 3.5 Sonnet 也是 Anthropic 迄今为止最强的视觉模型,在大多数视觉基准测试中,其表现平均超过 Claude 3 Opus 10%。根据 Anthropic 的说法,Claude 3.5 Sonnet 在几乎所有类别中的表现也都优于其他生成式人工智能模型。

Anthropic Claude 3.5 Sonnet 视觉基准测试

Anthropic 的 Claude 3.5 Sonnet 关键改进
Claude 3.5 Sonnet 的发布在多个领域带来了重大改进,通过新一代生成式人工智能能力为软件开发人员和企业赋能。以下是此新模型的一些关键优势:

视觉处理和理解 – Claude 3.5 Sonnet 展示了处理图像的非凡能力,特别是在解释图表和图像方面的能力。它可以准确地转录来自不完美图像的文本,这是零售、物流和金融服务等行业的核心能力,因为从图形或插图中能够收集到比文本更多的见解。使用 Claude 3.5 Sonnet 能够自动执行可视数据处理任务、提取有价值的信息并增强数据分析管道的能力。

写作和内容生成 – Claude 3.5 Sonnet 体现了其在理解细微差别和幽默的能力上的重大飞跃。该模型以更自然、更人性化的语气生成高质量的书面内容,让人感觉更真实、更贴切。使用该模型可生成引人入胜且令人信服的内容,简化写作工作流程,并提高讲故事的能力。

客户支持和自然语言处理 – Claude 3.5 Sonnet 对上下文的理解和多步工作流程编排的能力有大幅提升,擅长处理复杂的客户查询。此功能可实现全天候支持、更快的响应时间和更自然的互动,并最终提高客户满意度。使用此模型可自动化和增强客户支持流程,为最终用户提供无缝体验。有关类似实施的示例,请参阅 DoorDash 如何通过在 Amazon Bedrock 中使用 Anthropic 的 Claude 3 模型以构建生成式人工智能自助服务联络中心解决方案

分析和见解 – Claude 3.5 Sonnet 通过轻松浏览非结构化数据并使用多种工具生成见解,增强了人类在数据科学领域的专业知识。它可以生成高质量的统计可视化和可操作的预测,涵盖了从业务策略到实时产品趋势的各种内容。使用 Claude 3.5 Sonnet 可简化数据分析工作流程,发现有价值的见解,并推动数据驱动的决策制定。

编码和软件开发 – Claude 3.5 Sonnet 在提供了相关工具的情况下,可通过其成熟的推理和故障排除功能,独立编写、编辑和执行代码。使用 Claude 3.5 Sonnet 可简化开发人员工作流程、加快编码任务的完成速度、减少手动工作并提高整体生产力。

在 Amazon Bedrock 控制台中使用 Anthropic 的 Claude 3.5 Sonnet
因为这是一个新模型,所以我进入 Amazon Bedrock 控制台,从导航窗格中选择“模型访问权限”以启用对 Claude 3.5 Sonnet 的访问权限。

控制台屏幕截图。

现在我可以访问该模型了,我想用它从 Our World in Data 网站上的下图中提取信息:

2022 年水力发电的主要能源消耗

我在导航窗格的“平台”部分选择“聊天”,然后选择 AnthropicClaude 3.5 Sonnet 作为模型。然后我选择“图片”上传按钮来上传之前的图片,键入以下提示,然后选择“运行”:

哪些国家的水力发电消耗量超过 1000 太瓦时? 逐步思考,查看所有区域。以 JSON 格式输出。

下面是结果,以及一张动画图片来总结我执行的操作。

为了确定 2022 年哪些国家的水力发电消耗量超过 1000 太瓦时,我需要仔细检查地图和颜色编码。底部的标尺显示,深蓝色表示消耗量介于 1000 太瓦时到 2000 太瓦时之间。

让我们系统地看一下每个区域:

1.北美:加拿大呈深蓝色,表示其水力发电消耗量在 1000-2000 太瓦时之间。
2.南美洲:巴西呈深蓝色,消耗量也在 1000-2000 太瓦时之间。
3.欧洲:没有一个国家呈深蓝色;所有国家都呈浅绿色或没有数据。
4.非洲:没有任何国家的数据。
5.亚洲:中国呈深蓝色,表示消耗量在 1000-2000 太瓦时之间。
6.大洋洲:没有一个国家呈深蓝色;澳大利亚呈浅绿色。

总而言之,2022 年有三个国家的水力发电消耗量超过 1000 太瓦时:
1.加拿大(北美)
2.巴西(南美)
3.中国(亚洲)

以下是 JSON 格式的响应:

```json
{
  "countries_consuming_over_1000TWh_hydropower": [
    {
      "name": "Canada",
      "region": "North America",
      "consumption_range": "1,000-2,000 TWh"
    },
    {
      "name": "Brazil",
      "region": "South America",
      "consumption_range": "1,000-2,000 TWh"
    },
    {
      "name": "China",
      "region": "Asia",
      "consumption_range": "1,000-2,000 TWh"
    }
  ]
}
```

这三个国家是水力发电的最大消耗国,在 2022 年期间,每个国家的水力发电消耗量在 1000 至 2000 太瓦时之间。

Amazon Bedrock 控制台上 Anthropic 的 Claude 3.5 Sonnet 演示。

该模型能够可靠地从图像等非结构化数据中提取信息,这开辟了一个充满新可能性的世界。

我选择平台窗口角落的三个小点,然后选择“查看 API 请求”,以查看在 AWS 命令行界面(AWS CLI)AWS SDK 中使用模型的代码示例。让我们仔细地看一下代码语法。

将 Claude 3.5 Sonnet 与 AWS SDK 配合使用
您可以使用新的 Amazon Bedrock Converse APIAnthropic Claude Messages API,将 Claude 3.5 Sonnet 与任何 AWS SDK 配合使用。

要更新已经在使用 Claude 3 模型的代码,我只需要将模型 ID 替换为:

anthropic.claude-3-5-sonnet-20240620-v1:0

以下是适用于 Python 的 Amazon SDK(Boto3)的实施示例,该示例使用与之前相同的图像,展示了如何通过 Converse API 来使用图像和文本。

import boto3
from botocore.exceptions import ClientError

MODEL_ID = "anthropic.claude-3-5-sonnet-20240620-v1:0"

IMAGE_NAME = "primary-energy-hydro.png"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-east-1")

with open(IMAGE_NAME, "rb") as f:
    image = f.read()

user_message = "Which countries consume more than 1000 TWh from hydropower? 逐步思考,查看所有区域。Output in JSON."

messages = [
    {
        "role": "user",
        "content": [
            {"image": {"format": "png", "source": {"bytes": image}}},
            {"text": user_message},
        ],
    }
]

response = bedrock_runtime.converse(
    modelId=MODEL_ID,
    messages=messages,
)
response_text = response["output"]["message"]["content"][0]["text"]
print(response_text)

当我运行它时,我得到的输出与控制台中的输出类似:

让我们逐步解决这个问题:

1.首先,我将检查地图底部的彩色标尺。最深的蓝色代表消耗 2000 太瓦时或更多。

2.现在,我将按区域逐个扫描地图:

   北美:加拿大呈深蓝色,表示超过 1000 太瓦时。
   南美洲:巴西也呈深蓝色,超过 1000 太瓦时。
   欧洲:似乎没有一个国家呈深蓝色。
   非洲:似乎没有一个国家呈深蓝色。
   亚洲:中国比较突出,呈深蓝色,表示超过 1000 太瓦时。
   大洋洲:似乎没有一个国家呈深蓝色。

3.为了能全面获取到所有信息,我将仔细检查是否有任何可能接近或超过 1000 太瓦时的中等蓝色国家,但我看不到有任何国家达到这个阈值。

4.根据这项分析,有三个国家的水力发电消耗量明显超过 1000 太瓦时。

现在,我将以 JSON 格式来展示答案:

```json
{
  "countries_consuming_over_1000TWh_hydropower": [
    "Canada",
    "Brazil",
    "China"
  ]
}
```

该 JSON 输出列出了三个国家,根据 2022 年的数据,地图中直观地展示了这三个国家的主要水力发电消耗量超过 1000 太瓦时。

因为我没有指定 JSON 语法,所以这两个答案使用了不同的格式。在您的应用程序中,您可以在提示中描述所需的 JSON 属性,或提供示例以在输出中展示标准格式。

有关更多示例,请参阅《Amazon Bedrock 用户指南》中的代码示例。有关更高级的用例,这里有一个功能齐全的工具使用演示,演示了如何将生成式人工智能模型与自定义工具或 API 连接起来

在 AWS CLI 中使用 Claude 3.5 Sonnet
有时候,没有什么能比命令行的速度更快。您可以通过以下方式将 AWS CLI 与新模型配合使用:

aws bedrock-runtime converse \
    --model-id anthropic.claude-3-5-sonnet-20240620-v1:0 \
    --messages '{"role": "user", "content": [{"text": "Alice 有 N 个兄弟,而且她有 M 个姐妹。Alice 的兄弟有几个姐妹?"}]}' \
    --region us-east-1
    --query output.message.content

在输出中,我使用查询选项以仅获取输出消息的内容:

[
    {
        "text": "让我们逐步解决这个问题:\n\n1.首先,我们需要了解这些关系:\n   - Alice 有 N 个兄弟\n   - Alice 有 M 个姐妹\n\n2.现在,让我们考虑一下 Alice 的兄弟:\n   - 他是 Alice 的 N 个兄弟之一\n   - 他与 Alice 有相同的父母\n\n3.这意味着 Alice 的兄弟有:\n   - 和 Alice 一样的姐妹\n   - 比 Alice 多一个姐妹(因为 Alice 本人是他的姐妹)\n\n4.因此,Alice 的兄弟的姐妹数量是:\n   M + 1\n\n   其中 M 是 Alice 的姐妹数量。\n\n所以,答案是:Alice 的兄弟有 M + 1 个姐妹。"
    }
]

我将文本复制到一个小型的 Python 程序中,以查看它在多行上打印的效果:

print("让我们逐步解决这个问题:\n\n1.首先,我们需要了解这些关系:\n   - Alice 有 N 个兄弟\n   - Alice 有 M 个姐妹\n\n2.现在,让我们考虑一下 Alice 的兄弟:\n   - 他是 Alice 的 N 个兄弟之一\n   - 他与 Alice 有相同的父母\n\n3.这意味着 Alice 的兄弟有:\n   - 和 Alice 一样的姐妹\n   - 比 Alice 多一个姐妹(因为 Alice 本人是他的姐妹)\n\n4.因此,Alice 的兄弟的姐妹数量是:\n   M + 1\n\n   其中 M 是 Alice 的姐妹数量。\n\n 所以,答案是:Alice 的兄弟有 M + 1 个姐妹。")
让我们逐步解决这个问题:

1.首先,我们需要了解这些关系:
   - Alice 有 N 个兄弟
   - Alice 有 M 个姐妹

2.现在,让我们考虑一下 Alice 的兄弟:
   - 他是 Alice 的 N 个兄弟之一
   - 他与 Alice 有相同的父母

3.这意味着 Alice 的兄弟有:
   - 和 Alice 一样的姐妹
   - 比 Alice 多一个姐妹(因为 Alice 本人是他的姐妹)

4.因此,Alice 的兄弟的姐妹数量是:
   M + 1

   其中 M 是 Alice 的姐妹数量。

所以,答案是:Alice 的兄弟有 M + 1 个姐妹。

即使这是一个非常微妙的问题,Claude 3.5 Sonnet 也回答正确,并描述了其分步推理的过程。

注意事项
Anthropic 的 Claude 3.5 Sonnet 现已在美国东部(弗吉尼亚州北部)AWS 区域Amazon Bedrock 中推出。有关详细信息,请参阅本文档中的 Amazon Bedrock 模型支持(按区域列出)。 查看 Amazon Bedrock 定价页面,确定特定用例的成本。

Claude 3.5 Sonnet 以更低的成本提供更快、更强大的模型,使生成式人工智能更容易和更有效地用于许多行业,例如:

医疗保健和生命科学 – 在医学领域,Claude 3.5 Sonnet 在增强成像分析、作为患者分类的诊断助手,以及以易于理解的格式总结最新研究成果等方面显示出良好的前景。

金融服务 – 该模型可有效地帮助客户识别财务趋势,并根据客户的独特情况制定个性化债务偿还计划。

法律 – 律师事务所可以使用该模型,通过快速查找出相关的先例和法规来加快法律研究进程。此外,该模型可以通过合同分析提高律师助理的效率,并协助起草标准法律文件。

媒体和娱乐 – 该模型可以加快记者的调查工作,对剧本写作和角色开发的创作过程提供支持,并提供有价值的受众情感分析。

技术 – 对于软件开发人员而言,Claude 3.5 Sonnet 为快速应用程序原型设计、旧代码迁移、创新功能构想、用户体验优化和摩擦点识别提供了机会。

教育 – 教育工作者可以使用该模型来简化拨款提案的撰写,开发融合新兴趋势的综合课程,并通过数据库查询和洞察生成来获得研究援助。

对于生成式人工智能来说,这是一个激动人心的时刻。要开始使用该新模型,请参阅《Amazon Bedrock 用户指南》的“Anthropic Claude 模型”部分。您还可以访问我们的 community.aws 网站,查找深入的技术内容,并了解我们的构建者社区如何在其解决方案中使用 Amazon Bedrock。告诉我您会用这些增强功能做什么!

Danilo


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。