亚马逊AWS官方博客

Anthropic 的 Claude 3.7 Sonnet 混合推理模型现已在 Amazon Bedrock 上线

随着生成式人工智能领域的不断发展,Amazon Bedrock 也在不断扩充其基础模型(FM)产品阵容。今日,我们很高兴地宣布,Anthropic 的 Claude 3.7 Sonnet 基础模型已在 Amazon Bedrock 上线。作为 Anthropic 迄今为止最智能的模型,Claude 3.7 Sonnet 是其首款混合推理模型,能够快速提供回复,也能进行深度思考,这意味着它可以通过细致的逐步推理来解决复杂问题。此外,今天我们将 Claude 3.7 Sonnet 添加到 Amazon Q 开发者版所使用模型的列表中。Amazon Q 基于 Bedrock 构建,借助 Amazon Q,开发者能够针对特定任务选用最合适的模型,比如在更高级的编码工作流程中使用 Claude 3.7 Sonnet,从而在整个软件开发周期内加快开发速度。

Claude 3.7 Sonnet 的主要亮点

以下是 Claude 3.7 Sonnet 在 Amazon Bedrock 中的几个显著特点和功能。

首款具备混合推理能力的 Claude 模型 — Claude 3.7 Sonnet 在模型思考方式上独树一帜。它没有使用两个独立模型(一个用于快速作答,另一个用于解决复杂问题),而是将推理作为核心能力融入单一模型之中。这种结合方式与人类大脑的运作方式更相似。毕竟,无论是回答简单问题还是解决复杂难题,我们都使用同一个大脑。

该模型有两种模式 — 标准模式和深度思考模式,可在 Amazon Bedrock 中切换。在标准模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升级版。在深度思考模式下,Claude 3.7 Sonnet 会花费更多时间详细分析问题、规划解决方案,并在给出回应前考虑多种观点,从而进一步提升性能。您可以通过选择何时启用推理功能来控制速度和成本。深度思考所产生的令牌会计入上下文窗口,并按照输出令牌计费。

Anthropic 功能最强大的编码模型 — Claude 3.7 Sonnet 是最先进的编码模型,在理解上下文和创造性解决问题方面表现卓越。据 Anthropic 称,其在标准模式下的 SWE-bench Verified 测试中,成绩达到了行业领先的 70.3%。在大多数基准测试中,Claude 3.7 Sonnet 的表现也优于 Claude 3.5 Sonnet。这些增强功能使 Claude 3.7 Sonnet 成为驱动人工智能座席和复杂工作流程的理想选择。

Claude 3.7 Sonnet 基准测试

资料来源:https://www.anthropic.com/news/claude-3-7-sonnet

输出容量的长度是之前模型的 15 倍以上 — 与 Claude 3.5 Sonnet 相比,该模型的输出长度显著增加。当您明确要求更详细的内容、多个示例,或者额外的上下文及背景信息时,这种增强的容量就显得尤为实用。要实现长输出,可以尝试要求生成详细大纲(对于写作场景,您可以将大纲细化到段落级别,并设定字数目标)。然后,要求回复内容根据大纲对段落进行索引,并重复字数要求。Claude 3.7 Sonnet 支持多达 128K 令牌的输出(一般情况下最多可输出 64K,测试版最多支持 128K)。

可调整的推理预算 — 在 Amazon Bedrock 中使用 Claude 3.7 Sonnet 时,可以控制思考的预算。这种灵活性有助于您在速度、成本和性能之间进行权衡。通过分配更多令牌以针对复杂问题进行推理,或者限制令牌数量以加快响应速度,可以针对特定使用案例优化性能。

Claude 3.7 Sonnet 的实际应用

与任何新模型一样,我需要在 Amazon Bedrock 控制台 中申请访问权限。在导航窗格中,我选择 Bedrock 配置下的模型访问权限。然后,我选择修改模型访问权限,以申请对 Claude 3.7 Sonnet 的访问权限。

Amazon Bedrock 中的模型访问权限

为了试用 Claude 3.7 Sonnet,我在导航窗格的操场下选择聊天/文本。然后,我选择选择模型,在类别下选择 Anthropic,并在模型下选择 Claude 3.7 Sonnet。为了启用深度思考模式,我在配置下切换模型推理选项。我键入以下提示,然后选择运行

You're the manager of a small restaurant facing these challenges:

Three staff members called in sick for tonight's dinner service
You're expecting a full house (80 seats)
There's a large party of 20 coming at 7 PM
Your main chef is available but two kitchen helpers are among those who called in sick
You have 2 regular servers and 1 trainee available
How would you:

Reorganize the available staff to handle the situation
Prioritize tasks and service
Determine if you need to make any adjustments to reservations
Handle the large party while maintaining service quality
Minimize negative impact on customer experience
Explain your reasoning for each decision and discuss potential trade-offs
Plain text


聊天/短信操场

以下是配有显示模型推理过程的动画图像的结果。

测试 Claude 3.7 Sonnet 推理能力

为测试图像转文本的视觉功能,我上传了一张使用 Amazon Bedrock 创建的详细建筑场地平面图。随后,我收到了对该场地平面图的详细分析和有理有据的见解。

Claude 3.7 Sonnet 也可使用 AWS SDK,通过 Amazon Bedrock API 进行访问。要详细了解 Claude 3.7 Sonnet 的特点和功能,请访问 Amazon Bedrock 中的 Anthropic Claude 产品详情页面。

立即开始使用 Claude 3.7 Sonnet

Claude 3.7 Sonnet 的增强功能可使多个行业应用场景受益。企业能够创建直接与客户互动的高级人工智能助手和座席。在医疗保健等领域,它可以辅助医学影像分析和研究总结;金融服务行业可以受益于其解决复杂金融建模问题的功能。对于开发人员而言,它就像一个编码伙伴,能够审查代码、解释技术概念,并针对不同语言提出改进建议。

Anthropic 的 Claude 3.7 Sonnet 现已在美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)区域上线。查看完整区域列表以了解将来的更新。

Claude 3.7 Sonnet 的价格具有竞争力,与 Claude 3.5 Sonnet 价格相当。有关定价的详细信息,请参阅 Amazon Bedrock 定价页面

要开始在 Amazon Bedrock 中使用 Claude 3.7 Sonnet,请访问 Amazon Bedrock 控制台Amazon Bedrock 文档

– Esra


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。