Anthropic最新推出的基础模型Claude Opus 4.5现已上线Amazon Bedrock

Amazon Bedrock作为一项全托管服务，集成了多家顶尖AI公司的高性能基础模型，为用户提供灵活选择。Opus 4.5显著拓展了AI系统的能力边界，在编码、Agent开发、计算机使用及办公任务等领域树立了新标杆。其性能不仅超越了Sonnet 4.5和Opus 4.1，更以仅原Opus模型三分之一的价格，提供了同等的旗舰级智能体验。本文将介绍该模型的核心差异化优势，梳理其关键业务应用场景，并演示如何在Amazon Bedrock上运用Opus 4.5新增的工具调用功能，帮助您掌握如何借助该模型，实现生产级Agent的部署落地。

Claude Opus 4.5独特优势

Claude Opus 4.5是Anthropic在Opus旗舰系列中推出的最先进模型，专为开发者打造，旨在帮助他们构建功能复杂的AI Agent。这类Agent能够自主推理、规划并执行复杂任务，仅需极少人工干预。该模型在Sonnet 4.5的基础上进行了升级，不仅在现有应用场景中实现了性能提升，还新增了适配复杂工作流的全新能力。该模型在专业软件工程领域表现卓越， 在SWE-bench Verified基准测试中取得80.9%的得分，能够将原本需要数天完成的开发项目，缩短至仅需数小时即可完成。它可独立开展工作，具备更强的多语言编码能力，以及更高效的代码输出、更完善的测试覆盖、更简洁的架构选型等增强特性。在办公效率方面，该模型能够端到端处理复杂项目：可为Agent提供核心支持，助力其生成具备专业水准的PowerPoint演示文稿、Excel电子表格和Word文档，还能对合同和保密协议（NDA）等文件进行修订标注。此外， 该模型生成的React和HTML相关成果质量也显著提升。其输出能够始终保持一致与精准，这对于对精准度有严苛要求的行业至关重要，并能在大型项目中跨文件持续保留上下文内容。这是Anthropic迄今为止性能最出色的视觉模型，在MMMU基准测试中斩获80.7%的得分，专为依赖复杂视觉解读与多步骤操作的工作流打造，例如分析设计原型图、处理复杂版式文档，或实现浏览器端任务自动化——其计算机操作性能还实现了进一步提升。该模型为Agent开发者带来了两项关键改进：

工具搜索：让Agent能够动态发现并仅加载所需工具，无需预先定义全部工具，从而轻松管理数百种工具的协作。
支持工具调用示例功能：支持用户在工具定义中直接嵌入工具调用示例，针对包含嵌套对象或数组的复杂数据结构，这一功能可以显著提升工具调用的准确性。

Opus 4.5性能基准测试结果

业务应用场景与用例

Claude Opus 4.5在以下使用场景中表现卓越：

软件开发：助力开发者构建可跨整个项目编写与重构代码、管理全栈架构的Agent，或设计能将高级目标拆解为可执行步骤的Agent驱动系统。这一代Claude模型覆盖完整开发生命周期：Opus 4.5适用于生产级代码编写与复杂Agent开发，例如部分Agent在端到端软件工程、网络安全或财务分析等工作流中需调用10种以上工具；Sonnet 4.5适用于快速迭代与规模化用户体验的优化；Haiku 4.5适用于子Agent开发与免费产品打造。Opus 4.5能够分析技术文档、规划软件实现方案、编写所需代码，并持续进行迭代优化，全程跟踪需求与架构上下文信息。

企业运营与办公任务：端到端管理复杂项目。Opus 4.5凭借其记忆能力，能够保持跨文件的上下文一致性，同时在创建电子表格、演示文稿与文档方面也实现了性能提升。该模型可处理持续推进的企业级项目，将手动工作流程自动化。

财务分析：能够跨复杂信息系统（诸如监管申报文件、行业报告、内部数据等）开展工作，支持预测建模与主动合规。凭借其一致性与准确性，该模型在金融及其他对精准度有严苛要求的行业中极具实用价值。

网络安全领域：为安全工作流提供专业级分析能力，关联日志数据、安全问题数据库与安全情报，实现安全事件检测与自动化事件响应。

与Amazon Bedrock AgentCore集成

Amazon Bedrock为在生产环境中部署Opus 4.5提供了企业级基础。这款全托管服务为基础模型提供了统一的API，同时具备企业级的安全性、合规性和治理能力。Opus 4.5可与Amazon Bedrock AgentCore集成，而后者为构建生产环境级Agent提供了基础设施和基础组件。Amazon Bedrock AgentCore包含以下功能：

持久内存：可在不同会话间保持上下文信息。

Tool Gateway：可将各类API和Lambda函数转换为与Agent兼容的工具。

内置身份与访问管理：用于安全访问资源。

您可以借助完整的会话隔离、长达8小时的长时间工作流支持以及可观测性功能，部署和监控Agent，让您能够专注于构建Agent，无需花费精力管理基础设施。Amazon Bedrock AgentCore还为生产环境部署提供了额外功能。其中，Tool Gateway仅需极少代码，就能将您现有的API和Lambda函数转换为与Agent兼容的工具，并结合模型的工具搜索功能，实现对数百种工具的编排调度。 通过Amazon CloudWatch实现的内置可观测性功能，您可跟踪Agent工作流中的token使用量、延迟时间和错误率。

可用性与访问方式

该模型现已通过跨区域推理功能上线Amazon Bedrock，该功能可自动将请求路由至亚马逊云科技不同区域的可用算力资源，从而在需求高峰期实现更高吞吐量。若您需要构建能够处理长时间运行任务、协调多个工具协作或在长时间会话中持续留存上下文的Agent，这款模型一定是理想之选。有关模型的可用区域、定价及规格详情，请参阅 Amazon Bedrock官方文档。

总结

Amazon Bedrock上的Claude Opus 4.5模型在软件开发、企业运营等复杂且长时间运行的工作流中表现出色，其在工具调用、上下文管理与决策能力上的核心优势，使其成为构建能在生产环境中稳定运行的Agent的理想选择，尤其适用于开发软件工程、研究合成与企业工作流自动化等领域的Agent。Opus 4.5与Amazon Bedrock企业级特性的结合，为构建生产级AI Agent搭建了坚实底座。建议您基于自身业务场景开展模型实操，探索其在优化企业人工流程、支持新型自动化模式的潜力。您可通过Amazon Bedrock控制台直接试用，或参阅技术文档、Anthropic官方Claude模型详情页获取更多信息。若需大规模部署Agent，推荐您借助Amazon Bedrock AgentCore集成Opus 4.5，依托其托管式基础设施、工具编排与监控能力实现高效落地。

Amazon Bedrock控制台

Claude模型详情页

亚马逊AWS官方博客

Anthropic最新推出的基础模型Claude Opus 4.5现已上线Amazon Bedrock

Claude Opus 4.5独特优势

业务应用场景与用例

与Amazon Bedrock AgentCore集成

可用性与访问方式

总结

本篇作者

了解

资源

开发人员

帮助