亚马逊AWS官方博客

Anthropic最新推出的基础模型Claude Opus 4.5现已上线Amazon Bedrock

Amazon Bedrock作为一项全托管服务,集成了多家顶尖AI公司的高性能基础模型,为用户提供灵活选择。Opus 4.5显著拓展了AI系统的能力边界,在编码、Agent开发、计算机使用及办公任务等领域树立了新标杆。其性能不仅超越了Sonnet 4.5和Opus 4.1,更以仅原Opus模型三分之一的价格,提供了同等的旗舰级智能体验。本文将介绍该模型的核心差异化优势,梳理其关键业务应用场景,并演示如何在Amazon Bedrock上运用Opus 4.5新增的工具调用功能,帮助您掌握如何借助该模型,实现生产级Agent的部署落地。

Claude Opus 4.5独特优势

Claude Opus 4.5是Anthropic在Opus旗舰系列中推出的最先进模型,专为开发者打造,旨在帮助他们构建功能复杂的AI Agent。这类Agent能够自主推理、规划并执行复杂任务,仅需极少人工干预。该模型在Sonnet 4.5的基础上进行了升级,不仅在现有应用场景中实现了性能提升,还新增了适配复杂工作流的全新能力。该模型在专业软件工程领域表现卓越, 在SWE-bench Verified基准测试中取得80.9%的得分,能够将原本需要数天完成的开发项目,缩短至仅需数小时即可完成。它可独立开展工作,具备更强的多语言编码能力,以及更高效的代码输出、更完善的测试覆盖、更简洁的架构选型等增强特性。在办公效率方面,该模型能够端到端处理复杂项目:可为Agent提供核心支持,助力其生成具备专业水准的PowerPoint演示文稿、Excel电子表格和Word文档,还能对合同和保密协议(NDA)等文件进行修订标注。此外, 该模型生成的React和HTML相关成果质量也显著提升。其输出能够始终保持一致与精准,这对于对精准度有严苛要求的行业至关重要,并能在大型项目中跨文件持续保留上下文内容。这是Anthropic迄今为止性能最出色的视觉模型,在MMMU基准测试中斩获80.7%的得分,专为依赖复杂视觉解读与多步骤操作的工作流打造,例如分析设计原型图、处理复杂版式文档,或实现浏览器端任务自动化——其计算机操作性能还实现了进一步提升。该模型为Agent开发者带来了两项关键改进:
  • 工具搜索:让Agent能够动态发现并仅加载所需工具,无需预先定义全部工具,从而轻松管理数百种工具的协作。
  • 支持工具调用示例功能:支持用户在工具定义中直接嵌入工具调用示例,针对包含嵌套对象或数组的复杂数据结构,这一功能可以显著提升工具调用的准确性。

Opus 4.5性能基准测试结果

业务应用场景与用例

Claude Opus 4.5在以下使用场景中表现卓越: 
  • 软件开发:助力开发者构建可跨整个项目编写与重构代码、管理全栈架构的Agent,或设计能将高级目标拆解为可执行步骤的Agent驱动系统。这一代Claude模型覆盖完整开发生命周期:Opus 4.5适用于生产级代码编写与复杂Agent开发,例如部分Agent在端到端软件工程、网络安全或财务分析等工作流中需调用10种以上工具;Sonnet 4.5适用于快速迭代与规模化用户体验的优化;Haiku 4.5适用于子Agent开发与免费产品打造。Opus 4.5能够分析技术文档、规划软件实现方案、编写所需代码,并持续进行迭代优化,全程跟踪需求与架构上下文信息。
  • 企业运营与办公任务:端到端管理复杂项目。Opus 4.5凭借其记忆能力,能够保持跨文件的上下文一致性,同时在创建电子表格、演示文稿与文档方面也实现了性能提升。该模型可处理持续推进的企业级项目,将手动工作流程自动化。
  • 财务分析:能够跨复杂信息系统(诸如监管申报文件、行业报告、内部数据等)开展工作,支持预测建模与主动合规。凭借其一致性与准确性,该模型在金融及其他对精准度有严苛要求的行业中极具实用价值。
  • 网络安全领域:为安全工作流提供专业级分析能力,关联日志数据、安全问题数据库与安全情报,实现安全事件检测与自动化事件响应。

与Amazon Bedrock AgentCore集成

Amazon Bedrock为在生产环境中部署Opus 4.5提供了企业级基础。这款全托管服务为基础模型提供了统一的API,同时具备企业级的安全性、合规性和治理能力。Opus 4.5可与Amazon Bedrock AgentCore集成,而后者为构建生产环境级Agent提供了基础设施和基础组件。Amazon Bedrock AgentCore包含以下功能:
  • 持久内存:可在不同会话间保持上下文信息。
  • Tool Gateway:可将各类API和Lambda函数转换为与Agent兼容的工具。
  • 内置身份与访问管理:用于安全访问资源。
您可以借助完整的会话隔离、长达8小时的长时间工作流支持以及可观测性功能,部署和监控Agent,让您能够专注于构建Agent,无需花费精力管理基础设施。Amazon Bedrock AgentCore还为生产环境部署提供了额外功能。其中,Tool Gateway仅需极少代码,就能将您现有的API和Lambda函数转换为与Agent兼容的工具,并结合模型的工具搜索功能,实现对数百种工具的编排调度。 通过Amazon CloudWatch实现的内置可观测性功能,您可跟踪Agent工作流中的token使用量、延迟时间和错误率。

可用性与访问方式

该模型现已通过跨区域推理功能上线Amazon Bedrock,该功能可自动将请求路由至亚马逊云科技不同区域的可用算力资源,从而在需求高峰期实现更高吞吐量。若您需要构建能够处理长时间运行任务、协调多个工具协作或在长时间会话中持续留存上下文的Agent,这款模型一定是理想之选。有关模型的可用区域、定价及规格详情,请参阅 Amazon Bedrock官方文档

总结

Amazon Bedrock上的Claude Opus 4.5模型在软件开发、企业运营等复杂且长时间运行的工作流中表现出色,其在工具调用、上下文管理与决策能力上的核心优势,使其成为构建能在生产环境中稳定运行的Agent的理想选择,尤其适用于开发软件工程、研究合成与企业工作流自动化等领域的Agent。Opus 4.5与Amazon Bedrock企业级特性的结合,为构建生产级AI Agent搭建了坚实底座。建议您基于自身业务场景开展模型实操,探索其在优化企业人工流程、支持新型自动化模式的潜力。您可通过Amazon Bedrock控制台直接试用,或参阅技术文档、Anthropic官方Claude模型详情页获取更多信息。若需大规模部署Agent,推荐您借助Amazon Bedrock AgentCore集成Opus 4.5,依托其托管式基础设施、工具编排与监控能力实现高效落地。

Amazon Bedrock控制台

Claude模型详情页

 

本篇作者

Jonathan Evans

亚马逊云科技全球生成式AI解决方案架构师,他致力于帮助客户借助Amazon Bedrock上Anthropic的Claude系列模型,运用前沿AI技术解决复杂业务挑战。Jonathan Evans拥有人工智能与机器学习工程领域的专业背景,在云上支持机器学习工作流方面积累了丰富的实践经验。他热衷于让各类规模企业都能便捷应用先进AI技术,并从中收获实际价值。