跳至主要内容

Amazon Bedrock

Amazon Bedrock AgentCore(预览版)定价

您可以根据需求定制 AgentCore,灵活组合各项服务,既可单独使用也可协同运行,并且在人工智能项目的发展过程中按实际使用量付费。

只需按实际用量付费

Amazon Bedrock AgentCore 提供灵活的按使用量计费模式,没有预先承诺或最低费用。每项服务,如 Runtime、工具(Browser、Code Interpreter)、Gateway、Identity、Memory 以及 Observability,都可以单独使用或组合使用,而且您仅需按实际用量付费。这种模块化的方法使您能够从较小的规模开始,并随着您的人工智能代理应用程序的增长而扩展。

2025 年 9 月 16 日之前,您可以免费试用 AgentCore 服务。使用 AgentCore 过程中涉及的其他 AWS 服务(例如,CloudWatch 定价适用于 AgentCore Observability)将按标准 AWS 定价收费。2025 年 9 月 17 日起,AWS 将根据本页面的说明对 AgentCore 的服务用量计费。

Bedrock AgentCore 服务

Runtime

AgentCore Runtime 是一款安全的无服务器运行时,专为部署和扩展动态人工智能代理和工具而设计。

基于使用量的定价
您只需按实际使用量付费,无需预先配置资源。对于 CPU 资源,在代理处于主动处理状态时收费(如果只是等待 LLM 响应的 I/O 等待状态,则不收费)。对于内存资源,则按代理实际使用的内存收费。 

关键细节:

  • 无需预先选择资源
  • 按秒计费,以该秒内记录的最高 CPU 和内存使用量值为基准,1 秒起计
  • 内存费用按 128MB 起计
  • 通过客户 ENI 传输的网络数据按标准 EC2 费率计费

Browser

AgentCore Browser 工具提供一种快速、安全且基于云的浏览器运行时系统,使人工智能代理能够大规模地与网站进行交互。

基于使用量的定价
您只需按实际使用量付费,无需预先配置资源。对于 CPU 资源,仅在工具处于主动处理状态时收费(如果只是等待 LLM 响应的 I/O 等待状态,则不收费)。对于内存资源,则按代理实际使用的内存收费。

关键细节:

  • 无需预先选择资源
  • 按秒计费,以该秒内 CPU 和内存使用量的最高峰值为基准,1 秒起计
  • 内存费用按 128MB 起计
  • 通过客户 ENI 传输的网络数据按标准 EC2 费率计费

Code Interpreter

AgentCore Code Interpreter 工具使人工智能代理能够在沙盒环境中安全地编写和执行代码,从而提高其准确性,并增强其解决复杂的端到端任务的能力。

基于使用量的定价
您只需按实际使用量付费,无需预先配置资源。对于 CPU 资源,仅在工具处于主动处理状态时收费(如果只是等待 LLM 响应的 I/O 等待状态,则不收费)。对于内存资源,则按代理实际使用的内存收费。

关键细节:

  • 无需预先选择资源
  • 按秒计费,以该秒内 CPU 和内存使用量的最高峰值为基准,1 秒起计
  • 内存费用按 128MB 起计
  • 通过客户 ENI 传输的网络数据按标准 EC2 费率计费 

Gateway

AgentCore Gateway 为代理提供了一种安全的方式来发现和使用工具,同时能轻松将 API、Lambda 函数及现有服务转换为兼容代理的工具。

基于使用量的定价
您只需为代理通过 Gateway 发起的 API 调用付费。根据工具操作(ListTools 和 InvokeTool)的次数、搜索查询的次数以及为语义搜索功能建立索引的工具数量收费。 

关键细节:

  • 没有前期费用,也没有最低承诺用量
  • ListTools 和 InvokeTool API 按 128KB 的数据传输增量计量

 

Identity

AgentCore Identity 简化了代理的身份与访问管理,允许您的代理代表用户,或在获得用户预先授权的情况下以自身名义安全访问 AWS 资源及第三方工具和服务。

基于使用量的定价
通过 AgentCore Runtime 或 AgentCore Gateway 使用 AgentCore Identity 的客户,无需为使用该服务支付任何额外费用。对于所有其他场景,您只需按实际使用量付费,基于代理向 AgentCore Identity 请求 OAuth 令牌或 API 密钥的次数计费。

关键细节:

  • 没有最低费用,也无需预先承诺
  • 基于为执行需要非 AWS 资源授权的任务而成功请求的 OAuth 令牌或 API 密钥数量计费
  • 客户通过 AgentCore Runtime 或 AgentCore Gateway 使用 AgentCore Identity 时,不会产生任何额外费用

Memory

AgentCore Memory 使开发人员能够轻松地构建具备情境感知能力的人工智能代理,因为它消除了复杂的内存基础设施管理环节,同时还能让开发人员完全控制人工智能代理所记忆的内容。

基于使用量的定价
您只需按实际使用量付费。我们的定价模式简单且基于使用量,与人工智能代理创造价值的效果直接挂钩:

  1. 短期记忆根据摄取的原始事件数量定价,使您的会话内上下文成本可预测。
  2. 长期记忆根据每月存储的记忆数量和检索的记忆数量定价,因此您只需在代理存储和使用持久化知识时付费。
  3. 要从原始事件中提取长期记忆,您可以选择内置记忆策略(包括自动处理功能),或者使用可选的模型和提示在您的账户中运行自定义记忆策略。

关键细节:

  • 无需预先选择资源
  • 短期记忆按创建事件请求的次数计费
  • 长期记忆存储按每日存储的记忆数量计费,并按月取平均值
  • 长期记忆检索按记忆检索请求次数计费

Observability

AgentCore Observability 让开发人员能够全面了解代理的工作流程,从而能够跟踪、调试和监控人工智能代理在生产环境中的运行表现。

基于使用量的定价
您只需按实际使用量为代理生成、存储和查询的遥测数据付费。系统会摄取遥测数据并将其存储在您的 Amazon CloudWatch 账户中。您需要为数据摄取和存储、用于检索和分析信息的查询以及在日志中屏蔽敏感/PII 数据付费。要查看定价详情,请访问 Amazon CloudWatch 定价页面。 

定价表

Service
Type
Resource
Price
Runtime

基于使用量

基于使用量

CPU

Memory

每个 vCPU 每小时 0.0895 美元

每 GB 每小时 0.00945 美元

Browser 工具

基于使用量

基于使用量

CPU

Memory

每个 vCPU 每小时 0.0895 美元

每 GB 每小时 0.00945 美元

Code Interpreter

基于使用量

基于使用量

CPU

Memory

每个 vCPU 每小时 0.0895 美元

每 GB 每小时 0.00945 美元

Gateway

基于使用量

基于使用量

基于使用量

API 调用(ListTools、InvokeTool)

Search API

工具索引

每 1000 次调用 0.005 美元

每 1000 次调用 0.025 美元

每月每 100 个索引工具 0.02 美元

Identity

基于使用量

针对非 AWS 资源的令牌或 API 密钥请求

代理每请求 1000 个令牌或 API 密钥 0.010 美元

(注:通过 AgentCore Runtime 或 AgentCore Gateway 使用 AgentCore Identity 的客户无需支付额外费用)

Memory

基于使用量

基于使用量

基于使用量

短期记忆

长期记忆存储

长期记忆检索

每 1000 个新事件 0.25 美元

使用内置记忆策略:每月每存储 1000 条记忆 0.75 美元

使用自定义记忆策略:每月每存储 1000 条记忆 0.25 美元

每 1000 次记忆检索 0.50 美元

Observability

基于使用量

日志、指标和跟踪

Amazon CloudWatch 定价收费

* 对于自定义记忆提取策略,您的账户可能会因模型使用产生额外费用

定价示例

Runtime

示例:客户支持代理部署

您计划部署一个客户支持代理来处理聊天和电子邮件中的用户咨询。该代理负责处理订单问题、账户验证及政策说明等事宜。它借助检索增强生成(RAG)获取产品政策,并通过兼容模型上下文协议(MCP)的工具来查询订单状态和更新支持工单。每个代理会话都涉及复杂的多步骤推理,包括 1 次对向量数据库的 RAG 调用、2 次 MCP 工具调用(例如调用 OrderAPI、TicketAPI)以及 2 个 LLM 推理步骤。您之所以选择在 AgentCore Runtime 上部署代理,是因为您需要完全的会话隔离以及在几秒内扩展到数百万个会话的灵活性。

每月处理 1000 万次用户请求,每个会话运行 60 秒,其中 70% 的时间处于 I/O 等待状态(即等待 LLM 响应或内部 API 的网络响应)。每个代理会话在主动处理期间使用 1 个 vCPU,且持续占用 2GB 内存。您的月度成本明细如下:

每个会话的 CPU 成本:18 秒(已根据 70% 的 I/O 等待时间调整)x 1 个 vCPU ×(0.0895 美元 / 3600 秒)= 0.0004475 美元
每个会话的内存成本:60 秒 × 2GB ×(0.00945 美元 / 3600 秒)= 0.000315 美元
每个会话的总成本:0.0007625 美元
月度总成本:1000 万个会话 × 0.0007625 美元 = 7625 美元

AgentCore Runtime 按使用量付费的定价模式意味着您只需为 CPU 的主动处理时间付费,无需为 I/O 等待时间付费,与传统计算方案相比,能显著提升成本效益。 

Browser

示例:自动旅行预订系统

您计划创建一个旅行预订人工智能代理,通过 Web 交互自动进行整个行程的规划和预订。您的实施需要借助 AgentCore Browser 安全的无服务器运行时来动态管理无头浏览器,以完成航班搜索、酒店查询、模拟点击、价格提取和提交预订表单等操作。AgentCore Browser 工具具备企业级功能,包括会话隔离的沙盒计算,以及通过实时视图和会话回放实现的全面可观测性。

该代理每月处理 10 万次请求。每个浏览器会话运行 10 分钟,其中 80% 的时间处于 I/O 等待状态,在主动处理时使用 2 个 vCPU,且持续占用 4GB 内存。您的月度成本明细如下:

每个会话的 CPU 成本:120 秒(已根据 80% 的 I/O 等待时间调整)x 2 个 vCPU ×(0.0895 美元 / 3600 秒)= 0.005967 美元
每个会话的内存成本:600 秒 × 4GB ×(0.00945 美元 / 3600 秒)= 0.0063 美元
每个会话的总成本:0.012267 美元
月度总成本:10 万个会话 × 0.012267 美元 = 1226.67 美元

Code Interpreter

示例:自然语言数据分析自动化

您计划部署一个数据分析师代理,通过自然语言为业务和产品团队提供数据集查询、可视化及统计分析服务。该代理需要为复杂请求(如网站流量与转化率的相关性分析)动态生成并执行 Python 代码。您使用 AgentCore Code Interpreter,因为它能提供符合企业安全策略的隔离沙箱环境、支持多种语言(JavaScript、TypeScript、Python)的预构建执行运行时,以及大型文件支持。

该代理每月处理 1 万次请求,每次请求包含 3 次代码执行。每次执行运行 2 分钟,其中 60% 的时间处于 I/O 等待状态,在主动处理时使用 2 个 vCPU,且持续占用 4GB 内存。您的月度成本明细如下:

每个会话的 CPU 成本:48 秒(已根据 60% 的 I/O 等待时间调整)× 2 vCPU ×(0.0895 美元 / 3600 秒)= 0.002387 美元
每个会话的内存成本:120 秒 × 4GB ×(0.00945 美元 / 3600 秒)= 0.00126 美元
每个会话的总成本:0.003647 美元
月度总成本:3 万次执行 × 0.003647 美元 = 109.40 美元

Gateway

示例:将 HR 助手代理连接到内部工具

您计划为一家中型企业构建一个 HR 助手代理,用于处理内部政策咨询、休假余额查询、福利登记和薪资查询等事宜。为响应用户请求,该代理需要访问多个内部系统(入职、福利、薪资和休假管理 API)工具。您使用 AgentCore Gateway 为 200 个内部工具创建了 MCP 服务器,使代理能从任何位置与之交互,且无需编写任何代码。为了提高工具使用的准确性,您借助搜索功能为工具元数据编制索引,使代理在调用过程中能根据交互上下文动态匹配工具。

每次代理交互需要 1 次搜索 API 调用和 4 次 InvokeTool API 调用。每月 5000 万次交互产生 5000 万次搜索调用和 2 亿次 InvokeTool 调用。您的月度成本明细如下:

SearchToolIndex 费用:200 个工具 × 0.02 美元/100 个工具 = 0.04 美元
Search API 费用:5000 万次 × 25 美元/百万次 =1250 美元
InvokeTool API 费用:2 亿次 × 5 美元/百万次 = 1000 美元
月度总成本:2250.04 美元

Identity

示例:安全的客户支持访问管理

您计划运行一个客户支持代理,通过访问多个工具(包括用于支持对话的 Slack、用于获取通话记录的 Zoom,以及用于问题跟踪和提交记录的 GitHub)为技术团队提供协助。您的实施方案使用 AgentCore Identity,以“代表”用户或支持工程师的方式提供安全的委托访问。该系统与现有身份提供者(如 Okta、Microsoft Entra ID、Amazon Cognito)兼容,并可管理从 OAuth 令牌到 IAM 角色的所有认证方式,无需构建自定义安全基础设施。

假设该代理每月有 1 万名活跃用户,平均每人进行 5 次交互,每次会话需要访问 3 个工具,您的月度成本明细如下:

请求的令牌总数:1 万名用户 × 5 次会话 × 3 个工具 = 15 万个令牌
月度总成本:15 万次请求 × 0.010 美元 / 1000 = 1.50 美元

注:使用 AgentCore Runtime 或 Gateway 时,AgentCore Identity 包含在内,不额外收费。

Memory

示例:个性化编码助手代理实施

您计划开发一个编码助手代理,帮助软件工程师在 IDE 和终端中编写、调试和重构代码。为提供个性化体验,该代理需要在会话期间保持上下文,并在多个会话中记住用户偏好。您的实施方案使用 AgentCore Memory 为代理配备短期记忆(即时对话和事件)和长期记忆(跨会话的持久知识)。

每次用户与代理交互(例如发送代码片段或提出编码问题)时,您都会向 AgentCore Memory 发送一个事件,将其存储为短期记忆。对于长期记忆,您配置了内置提取策略,以自动提取并存储跨会话的调试会话摘要和用户偏好。然后,代理可以检索这些长期记忆,为开发人员提供个性化体验。

每月有 10 万个短期记忆事件、1 万条存储的长期记忆和 2 万次记忆检索,您的成本明细如下:

短期记忆:10 万个事件 × 0.25 美元 / 1000 = 25 美元
长期记忆存储:1 万条记忆 × 0.75 美元 / 1000 = 7.50 美元
长期记忆检索:2 万次检索 × 0.50 美元 / 1000 = 10 美元
月度总成本:42.50 美元

注:使用自定义提取策略时,长期存储成本会更低,为存储每 1000 条记忆 0.25 美元,但您的账户可能会因模型使用产生额外费用。

Observability

有关 AgentCore Observability 定价示例,请参阅此处的 CloudWatch 定价。

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。