Amazon Bedrock AgentCore

Amazon Bedrock AgentCore 定价

您可以根据需求定制 AgentCore，灵活组合各项服务，既可单独使用也可协同运行，并且在人工智能项目的发展过程中按实际使用量付费。

只需按实际用量付费

Amazon Bedrock AgentCore 提供灵活的按使用量计费模式，没有预先承诺或最低费用。每项服务和功能（运行时、网关、策略（预览版）、身份、内存、可观测性、评估（预览版）、浏览器、代码解释器）都可以单独使用，也可以一起使用，您只需按实际使用量付费。这种模块化的方法使您能够从较小的规模开始，并随着您的代理应用程序的增长而扩展。

免费开始使用 AgentCore — 新 AWS 客户可获得最高 200 美元的免费套餐服务抵扣金。了解 AWS Free Tier 权益并立即开始构建。

注意：AgentCore 和 AgentCore 评估中的策略在预览版中免费提供。

AgentCore 服务和功能

运行时

AgentCore 运行时是一款安全的无服务器运行时，专为部署和扩展代理和工具而设计。您可以选择直接部署代码以实现快速迭代，也可以选择基于容器的部署以实现最大程度的控制。

您只需为消耗的活跃资源付费
与按预分配资源收费（即固定实例大小，且在托管代理期间按秒计费）的传统计算服务不同，AgentCore 运行时仅按消耗的活跃资源收费。这可以为代理式工作负载节省大量成本，这类工作负载通常有 30%-70% 的时间处于 I/O 等待状态（等待 LLM 响应、工具/API 调用或数据库查询）。使用预分配定价时，您需要为等待期间的空闲 CPU 付费。在 AgentCore 运行时按活跃资源付费的模式下，如果没有其他后台进程正在运行，I/O 等待与空闲时间是免费的。

计费基于会话生命周期内的 CPU 和内存消耗，以每秒为增量计算。对于 CPU 资源，按实际消耗量向您收费。如果代理在 I/O 等待期间未占用 CPU，则不收取 CPU 费用。对于内存资源，您需要按该秒之前消耗的峰值内存付费。

关键细节：

无需预先选择资源
计费按秒计算，基于实际 CPU 消耗量与截至该秒的峰值内存，最低计费时长为 1 秒
您只需为会话期间的实际资源消耗量付费，涵盖从 microVM 启动、初始化、活跃处理、空闲期，直至会话终止/ microVM 关闭的整个过程
计费包含系统开销与应用程序的资源使用量
内存费用按 128MB 起计
存储费用：容器化部署需使用 ECR 存储（单独计费）。从 2026 年 2 月 27 日起，直接代码部署将按照 S3 Standard 费率为您部署的代码构件计费。
网络数据传输费用按标准 EC2 费率收取

浏览器

AgentCore 浏览器提供一种快速、安全且基于云的浏览器运行时系统，使代理能够大规模地与网站进行交互。

您只需为消耗的活跃资源付费
与按预分配资源收费（即固定实例大小，且在托管代理期间按秒计费）的传统计算服务不同，AgentCore 浏览器仅按消耗的活跃资源收费。这可以为代理式工作负载节省大量成本，这类工作负载通常有 30%-70% 的时间处于 I/O 等待状态（等待 LLM 响应、工具/API 调用或数据库查询）。使用预分配定价时，您需要为等待期间的空闲 CPU 付费。在 AgentCore 浏览器按活跃资源付费的模式下，如果没有其他后台进程正在运行，I/O 等待与空闲时间是免费的。

关键细节：

无需预先选择资源
计费按秒计算，基于实际 CPU 消耗量与截至该秒的峰值内存，最低计费时长为 1 秒
您只需为会话期间的实际资源消耗量付费，涵盖从 microVM 启动、初始化、活跃处理、空闲期，直至会话终止/ microVM 关闭的整个过程
计费包含系统开销与应用程序的资源使用量
内存费用按 128MB 起计
网络数据传输费用按标准 EC2 费率收取

代码解释器

AgentCore 代码解释器使代理能够在沙盒环境中安全地执行代码，从而提高其准确性，并增强其解决复杂的端到端任务的能力。

您只需为消耗的活跃资源付费
与按预分配资源收费（即固定实例大小，且在托管代理期间按秒计费）的传统计算服务不同，AgentCore 代码解释器仅按消耗的活跃资源收费。这可以为代理式工作负载节省大量成本，这类工作负载通常有 30%-70% 的时间处于 I/O 等待状态（等待 LLM 响应、工具/API 调用或数据库查询）。使用预分配定价时，您需要为等待期间的空闲 CPU 付费。在 AgentCore 代码解释器按活跃资源付费的模式下，如果没有其他后台进程正在运行，I/O 等待与空闲时间是免费的。

关键细节：

无需预先选择资源
计费按秒计算，基于实际 CPU 消耗量与截至该秒的峰值内存，最低计费时长为 1 秒
您只需为会话期间的实际资源消耗量付费，涵盖从 microVM 启动、初始化、活跃处理、空闲期，直至会话终止/ microVM 关闭的整个过程
计费包含系统开销与应用程序的资源使用量
内存费用按 128MB 起计
网络数据传输费用按标准 EC2 费率收取

网关

Amazon Bedrock AgentCore 网关通过将 API 和 Lambda 函数转换为与代理兼容的工具并连接到现有的 MCP 服务器，使代理能够安全地访问工具。

基于使用量的定价
您只需为代理通过网关发起的 API 调用付费。计费依据包括 MCP 操作数（如 ListTools、CallTool、Ping）、搜索查询量，以及为语义搜索功能索引的工具数量。

关键细节：

没有前期费用，也没有最低承诺用量
网络数据传输费用按标准 EC2 费率收取

策略（预览版）

Amazon Bedrock AgentCore 中的策略功能让您能够全面控制代理执行的操作，帮助确保代理在定义的边界内运行，而不会放慢速度。

基于使用量的定价

您只需为代理执行期间发起的授权请求付费。每次代理通过 AgentCore 网关调用工具时，策略都会根据您的规则检查该操作，以确定该操作是否允许。

此外，策略还提供自然语言策略编写功能，支持您用简单的自然语言描述创建 Cedar 策略。将自然语言转换为 Cedar 策略语句，按“每处理 1000 个用户输入令牌”为单位向您收费。

身份

AgentCore 身份简化了代理的身份与访问管理，允许您的代理代表用户，或在获得用户预先授权的情况下以自身名义安全访问 AWS 资源及第三方工具和服务。

基于使用量的定价
通过 AgentCore Runtime 或 AgentCore Gateway 使用 AgentCore Identity 的客户，无需为使用该服务支付任何额外费用。对于所有其他场景，您只需按实际使用量付费，基于代理向 AgentCore Identity 请求 OAuth 令牌或 API 密钥的次数计费。

关键细节：

没有最低费用，也无需预先承诺
基于为执行需要非 AWS 资源授权的任务而成功请求的 OAuth 令牌或 API 密钥数量计费
客户通过 AgentCore 运行时或 AgentCore 网关使用 AgentCore 身份时，不会产生任何额外费用

内存

AgentCore 内存使开发人员能够轻松地构建具备情境感知能力的人工智能代理，因为它消除了复杂的内存基础设施管理环节，同时还能让开发人员完全控制代理所记忆的内容。

基于使用量的定价
您只需按实际使用量付费。我们的定价模式简单且基于使用量，与代理创造价值的效果直接挂钩：

短期记忆根据创建的原始事件数量定价，使您的会话内上下文成本可预测。
长期记忆记录根据每月处理和存储的记忆数量，以及记忆记录的检索调用次数来定价，因此您只需在代理存储和使用已处理的知识时付费。
要从原始事件中提取长期记忆，您可以选择内置记忆策略（包括自动处理功能），或者使用所选的模型和提示在您的账户中运行更多可配置的记忆策略。

关键细节：

无需预先选择资源
短期记忆按创建事件请求的次数计费
长期记忆存储按每日存储的记忆记录数量计费，并按月取平均值
长期记忆检索按记忆检索请求次数计费

可观测性

AgentCore 可观测性使开发人员能够全面了解代理的工作流程，从而能够跟踪、调试和监控代理在生产环境中的运行表现。

基于使用量的定价
您只需按实际使用量为代理生成、存储和查询的遥测数据付费。系统会摄取遥测数据并将其存储在您的 Amazon CloudWatch 账户中。您需要为数据摄取和存储、用于检索和分析信息的查询以及在日志中屏蔽敏感/个人身份信息（PII）数据付费。要查看定价详情，请访问 Amazon CloudWatch 定价页面。

评估（预览版）

AgentCore 评估有助于根据实际行为持续检查代理质量。团队可以使用 13 种内置评估器，针对常见质量维度进行代理评估，也可以针对特定业务需求创建自定义评估器。评估结果会集成到由 Amazon CloudWatch 提供支持的 AgentCore 可观测性中，以便统一监控。

基于使用量的定价
您只需按实际使用量付费。对于内置评估器，AgentCore 会根据评估过程中处理的输入/输出令牌数量计算价格。对于使用自己的 LLM 基础设施进行的自定义评估，您需要按执行的评估次数付费，并根据所使用的模型单独支付推理费用。

关键细节：

无需预先承诺或最低费用
包括具有可配置质量阈值的 CI/CD 集成
使用采样规则和控制面板聚合进行生产监控
通过基于百分比的采样、条件采样和选择性指标监控来控制成本
内置评估器已包含模型使用费用，无额外模型费用
自定义评估会在您的账户中产生额外的模型使用费用

定价表

Service/Capability

Type

Resource

Price

运行时

基于活跃消费

CPU

内存

每个 vCPU 每小时 0.0895 美元

每 GB 每小时 0.00945 美元

浏览器工具

基于活跃消费

CPU

内存

每个 vCPU 每小时 0.0895 美元

每 GB 每小时 0.00945 美元

代码解释器

基于活跃消费

CPU

内存

每个 vCPU 每小时 0.0895 美元

每 GB 每小时 0.00945 美元

Gateway

基于使用量

API 调用（ListTools、InvokeTool、Ping）

Search API

工具索引

每 1000 次调用 0.005 美元

每 1000 次调用 0.025 美元

每月每 100 个索引工具 0.02 美元

Identity

基于使用量

针对非 AWS 资源的令牌或 API 密钥请求

代理每请求 1000 个令牌或 API 密钥 0.010 美元

（注：通过 AgentCore Runtime 或 AgentCore Gateway 使用 AgentCore Identity 的客户无需支付额外费用）

Memory

基于使用量

短期记忆

长期记忆存储

长期记忆检索

每 1000 个新事件 0.25 美元

使用内置记忆策略：每月每存储 1000 条记忆记录 0.75 美元

使用内置覆盖型或自我管理型记忆策略：每月每存储 1000 条记忆记录 0.25 美元*

每 1000 次记忆记录检索 0.50 美元

可观测性

基于使用量

跨度、日志和指标

按 Amazon CloudWatch 定价收费

评估（预览版）

基于使用量

内置评估器

自定义评估器

每 1000 个输入令牌 0.0024 USD
每 1000 个输出令牌 0.012 USD

每 1000 次评估 1.50 美元（模型使用费单独计费）

策略（预览版）

基于使用量

授权请求

已处理的输入令牌

每个授权请求 0.000025 USD

每 1000 个输入令牌 0.13 USD

* 对于内置覆盖型和自我管理型策略，您的账户可能会因模型使用而产生额外费用

定价示例

运行时

示例：客户支持代理部署

您计划部署一个客户支持代理来处理聊天和电子邮件中的用户咨询。该代理负责处理订单问题、账户验证及政策说明等事宜。它借助检索增强生成（RAG）获取产品政策，并通过兼容模型上下文协议（MCP）的工具来查询订单状态和更新支持工单。每个代理会话都涉及复杂的多步骤推理，包括 1 次对向量数据库的 RAG 调用、2 次 MCP 工具调用（例如调用 OrderAPI、TicketAPI）以及 2 个 LLM 推理步骤。您之所以选择在 AgentCore 运行时上部署代理，是因为您需要完全的会话隔离以及在几秒内扩展到数千个会话的灵活性。

每月处理 1000 万次用户请求，每个会话时长 60 秒，其中 70% 为 I/O 等待时间（等待 LLM 响应及 API 调用），且等待期间没有其他后台进程运行。每个代理会话在活跃处理期间使用 1 个 vCPU。内存使用情况如下：初始化阶段为 1GB，RAG 处理阶段增至 2GB，会话后续的复杂工具调用阶段达到峰值 2.5GB。您的月度成本明细如下：

每个会话 CPU 成本：18 秒（仅活跃处理时间）× 1 个vCPU ×（0.0895 美元/3600）= 0.0004475 美元
每个会话的内存成本：10 秒 × 1GB ×（0.00945 美元/3600） + 20 秒 × 2GB ×（0.00945 美元/3600 秒） + 30 秒 × 2.5GB×（0.00945 美元/3600）= 0.000026 美元 + 0.000053 美元 + 0.000197 美元 = 0.000276 美元
每个会话的总成本：0.0007235 美元

月度总成本：1000 万个会话 × 0.0007235 美元 = 7235 美元

存储成本：使用基于容器的部署，您需要单独管理 ECR 存储，费用按公布的 ECR 费率计算。如果您改用直接代码部署，自 2026 年 2 月 27 日起，代码构件将适用 S3 Standard 存储定价，对于 100MB 的代理，月存储成本合计仅 0.0023 美元。

与预分配定价模式的对比：如果该工作负载在按预分配资源计费的服务上运行，则您需要为整个 60 秒会话时长预留峰值资源（2.5GB 内存、1 个 vCPU），最终导致 CPU 成本最高增至 3.3 倍，内存成本最高增至 1.4 倍。在上面的示例中，由于 CPU 消耗占工作负载总成本的 62%，因此 CPU 成本的节省效果尤为显著。AgentCore 运行时的按使用量计费模式可自动实现“I/O 等待免费”的优势，且仅按内存纵向扩展后的实际使用量收费。与传统计算方案相比，成本效益极高。

Browser

示例：自动旅行预订系统

您计划创建一个旅行预订代理，通过 Web 交互自动进行整个行程的规划和预订。您的实施需要借助 AgentCore 浏览器安全的无服务器运行时来动态管理无外设浏览器，以完成航班搜索、酒店查询、模拟点击、价格提取和提交预订表单等操作。AgentCore Browser 工具具备企业级功能，包括会话隔离的沙盒计算，以及通过实时视图和会话回放实现的全面可观测性。

该代理每月处理 10 万个请求。每个浏览器会话运行 10 分钟，其中 I/O 等待时间为 80%。在活跃处理期间，它将持续使用 2 个 vCPU 和 4GB 内存，并在 I/O 等待期间使用 0.4 个 vCPU 和 5GB 内存。您的月度成本明细如下：

每个会话的 CPU 成本：120 秒（已根据 80% 的 I/O 等待时间调整）x 2 个 vCPU ×（0.0895 美元 / 3600 秒）= 0.005967 美元
每个会话的内存成本：600 秒 × 4GB ×（0.00945 美元 / 3600 秒）= 0.0063 美元
每个会话的总成本：0.012267 美元
月度总成本：10 万个会话 × 0.012267 美元 = 1226.67 美元

Code Interpreter

示例：自然语言数据分析自动化

您计划部署一个数据分析师代理，通过自然语言为业务和产品团队提供数据集查询、可视化及统计分析服务。该代理需要为复杂请求（如网站流量与转化率的相关性分析）动态生成并执行 Python 代码。您使用 AgentCore Code Interpreter，因为它能提供符合企业安全策略的隔离沙箱环境、支持多种语言（JavaScript、TypeScript、Python）的预构建执行运行时，以及大型文件支持。

该代理每月处理 1 万次请求，每次请求包含 3 次代码执行。每次执行运行 2 分钟，其中 60% 的时间处于 I/O 等待状态，在主动处理时使用 2 个 vCPU，且持续占用 4GB 内存。您的月度成本明细如下：

每个会话的 CPU 成本：48 秒（已根据 60% 的 I/O 等待时间调整）× 2 vCPU ×（0.0895 美元 / 3600 秒）= 0.002387 美元
每个会话的内存成本：120 秒 × 4GB ×（0.00945 美元 / 3600 秒）= 0.00126 美元
每个会话的总成本：0.003647 美元
月度总成本：3 万次执行 × 0.003647 美元 = 109.40 美元

网关

示例：将 HR 助手代理连接到内部工具

您计划为一家中型企业构建一个 HR 助手代理，用于处理内部政策咨询、休假余额查询、福利登记和薪资查询等事宜。为响应用户请求，该代理需要访问多个内部系统（入职、福利、薪资和休假管理 API）工具。您使用 AgentCore Gateway 为 200 个内部工具创建了 MCP 服务器，使代理能从任何位置与之交互，且无需编写任何代码。为了提高工具使用的准确性，您借助搜索功能为工具元数据编制索引，使代理在调用过程中能根据交互上下文动态匹配工具。

每次代理交互需要 1 次搜索 API 调用和 4 次 InvokeTool API 调用。每月 5000 万次交互产生 5000 万次搜索调用和 2 亿次 InvokeTool 调用。您的月度成本明细如下：

SearchToolIndex 费用：200 个工具 × 0.02 美元/100 个工具 = 0.04 美元
Search API 费用：5000 万次 × 25 美元/百万次 =1250 美元
InvokeTool API 费用：2 亿次 × 5 美元/百万次 = 1000 美元
月度总成本：2250.04 美元

策略（预览版）

示例：

您计划开发一款采购自动化代理，帮助运营团队管理供应商选择、采购订单创建和发票审批。为确保操作符合定义的业务规则，您将策略功能与 AgentCore 网关工具结合，在每个操作执行前根据定义的策略自动对其进行验证。每次代理尝试执行某项操作（例如，发送采购审批或发起付款），网关都会拦截该工具调用请求，以检查操作是否允许。假设该代理每月处理 10 万个会话，每个会话平均包含 5 次工具调用。如果您为每次工具调用实施一个授权请求，则每月会发出 500 万次授权请求，费用明细如下：

授权请求数 = 10 万个会话 × 5 次工具调用/会话 × 1 次策略执行/工具调用 = 50 万次授权请求
月度总成本：50 万次请求 × 0.000025 = 12.50 美元

在部署之前，您的团队可以通过自然语言编写来简化入门流程和策略配置。无需手动编写 Cedar 策略，只需用通俗语言描述规则，AgentCore 会自动将其转换为 Cedar 策略语句。此费用按策略编写过程中处理的用户输入令牌数量一次性收取。如果您的团队使用一万个令牌编写多项策略，则费用如下：

策略编写 = 2 万个令牌 × 每 1000 输入令牌 0.13 美元 = 2.60 美元

注意：如果启用了可观测性，则适用标准 CloudWatch 费率。

Identity

示例：安全的客户支持访问管理

您计划运行一个客户支持代理，通过访问多个工具（包括用于支持对话的 Slack、用于获取通话记录的 Zoom，以及用于问题跟踪和提交记录的 GitHub）为技术团队提供协助。您的实施方案使用 AgentCore 身份，为用户或支持工程师提供安全的委托访问权限。该系统与现有身份提供者（如 Amazon Cognito、Okta、Microsoft Entra ID、Amazon Cognito）兼容，并可管理从 OAuth 令牌到 API 密钥的所有认证方式，无需构建自定义安全基础设施。

假设该代理每月有 1 万名活跃用户，平均每人进行 5 次交互，每次会话需要访问 3 个工具，您的月度成本明细如下：

请求的令牌总数：1 万名用户 × 5 次会话 × 3 个工具 = 15 万个令牌
月度总成本：15 万次请求 × 0.010 美元 / 1000 = 1.50 美元

注：使用 AgentCore 运行时或网关时，AgentCore 身份包含在内，不额外收费。

内存

示例：个性化编码助手代理实施

您计划开发一个编码助手代理，帮助软件工程师在 IDE 和终端中编写、调试和重构代码。为提供个性化体验，该代理需要在会话期间保持上下文，并在多个会话中记住用户偏好。您的实施方案使用 AgentCore Memory 为代理配备短期记忆（即时对话和事件）和长期记忆（跨会话的持久知识）。

每次用户与代理交互（例如发送代码片段或提出编码问题）时，您都会向 AgentCore Memory 发送一个事件，将其存储为短期记忆。对于长期记忆，您配置了内置提取策略，以自动提取并存储跨会话的调试会话摘要和用户偏好。然后，代理可以检索这些长期记忆，为开发人员提供个性化体验。

每月有 10 万个短期记忆事件、1 万条存储的长期记忆记录和 2 万次记忆记录检索调用，您的成本明细如下：

短期记忆：10 万个事件 × 0.25 美元 / 1000 = 25 美元
长期记忆存储：1 万条记忆 × 0.75 美元 / 1000 = 7.50 美元
长期记忆检索：2 万次检索 × 0.50 美元 / 1000 = 10 美元
月度总成本：42.50 美元

注意：使用内置覆盖提取策略，长期记忆存储成本会更低，仅为每 1000 条存储记忆 0.25 美元。但是，您的账户可能会因使用模型而产生额外费用。

可观测性

示例：多代理财务咨询平台

您计划部署一个综合财务咨询平台，包含多个专业代理，分别负责投资研究、投资组合分析和合规检查。每个代理都需要执行复杂的多步骤推理，涉及数据库和 Web 搜索查询、金融数据提供商 API 调用和文档分析。该平台每月处理数百万笔交易，并生成大量遥测数据，包括所有代理交互的跟踪、指标和日志。您通过 AgentCore 可观测性来监控性能、调试问题，并借助全面的审计跟踪记录确保符合金融监管要求。

该平台每月从代理交互、API 调用和系统事件中生成 10TB 可观测性数据。假设 30% 的跨度数据为事件日志（模型调用、工具调用），每条日志数据约 2KB，则约有 6TB 数据会写入 CloudWatch 标准日志。您的月度成本明细如下：

月度跨度数据摄取费用：10TB × 1000GB/TB × 0.35 美元/GB = 3500 美元
月度事件日志记录费用：6TB × 1000GB/TB × 0.50 美元/GB = 3000 美元
月度总成本：3500 美元 + 3000 美元 = 6500 美元

* 发送至 CloudWatch 的所有指标及非遥测（标准）日志数据，均按 CloudWatch 标准费率计费。

评估（预览版）

示例：电商客户支持代理质量监控

您计划为电商平台部署一款客户支持代理，用于处理订单咨询、退货处理和产品推荐。为确保稳定的服务质量，您使用 AgentCore 评估在开发和生产环境中全面监控代理性能。实施过程采用 3 种内置跟踪级评估器（准确性、实用性、目标达成率），并针对特定于业务的质量指标配置 1 种自定义评估器。

在开发过程中，CI/CD 管道每月评估 5000 次测试交互。在生产环境中，您可以通过采样规则监控 2% 的实时互动，每月评估 10000 次客户对话。每次内置评估平均处理 15000 个输入令牌（包含对话历史记录、产品目录、订单详情），并生成 300 个输出令牌用于评分。

您的月度成本明细如下：
内置评估器：

评估交互总数：15000 次（开发环境 5000 次 + 生产环境 10000 次）
每次交互的内置评估器数量：3 个（准确性、实用性、目标达成率）
总评估次数：15000 次交互 × 3 个评估器 = 45000 次
输入令牌数：45000 次评估 × 15000 个令牌 = 6.75 亿个令牌
输出令牌总量：45000 次评估 × 300 个令牌 = 1350 万个令牌
输入成本：6.75 亿个令牌 × 2.40 美元/百万个令牌 = 1620 美元
输出成本：1350 万个代币 × 1200 万美元/百万个令牌 = 162 美元
内置评估器小计：1782 美元

自定义评估：

自定义评估总数：15000 次交互 × 1 个自定义评估器 = 15000 次评估
自定义评估成本：15000 次评估 × 150 美元/1000 次评估 = 22.50 美元

每月总计：1804.50 美元

注意：内置评估器已包含模型使用费用。自定义评估会在您的账户中产生额外的模型使用费用。

我希望

开始使用 AgentCore 进行构建

找到今天要查找的内容了吗？

请提供您的意见，以便我们改进网页内容的质量

Amazon Bedrock AgentCore 定价

只需按实际用量付费

AgentCore 服务和功能

运行时

浏览器

代码解释器

网关

策略（预览版）

身份

内存

可观测性

评估（预览版）

定价表

定价示例

运行时

Browser

Code Interpreter

网关

策略（预览版）

Identity

内存

可观测性

评估（预览版）

我希望 开始使用 AgentCore 进行构建

找到今天要查找的内容了吗？

了解

资源

开发人员

帮助

我希望

开始使用 AgentCore 进行构建