Saltar al contenido principal

Precios de Amazon Bedrock AgentCore (versión preliminar)

Adapte AgentCore a sus necesidades: combine los servicios, utilícelos de forma independiente o conjunta y pague por lo que utilice a medida que crecen sus iniciativas de IA.

Pague solo por lo que utilice

Amazon Bedrock AgentCore ofrece precios flexibles y basados en el consumo, sin compromisos iniciales ni tarifas mínimas. Cada servicio, ya sea Runtime, las herramientas (Browser, Code Interpreter), Gateway, Identity, Memory y Observability, se puede usar de forma independiente o en conjunto, y solo pagará por lo que utilice. Este enfoque modular le permite empezar con poco y escalar a medida que crecen sus aplicaciones de agentes de IA.

Puede probar los servicios de AgentCore de forma gratuita hasta el 16 de septiembre de 2025. Los precios estándar de AWS se aplican a cualquier servicio de AWS adicional que se utilice como parte del uso de AgentCore (por ejemplo, los precios de CloudWatch se aplicarán a AgentCore Observability). A partir del 17 de septiembre de 2025, AWS le facturará por el uso del servicio AgentCore en función de esta página.

Servicios de Bedrock AgentCore

Runtime

AgentCore Runtime es una versión ejecutable segura y sin servidor diseñada específicamente para implementar y escalar agentes y herramientas de IA dinámicos.

Precios basados en el consumo
Solo paga por lo que utilice, sin necesidad de configurar previamente los recursos. En el caso de los recursos de CPU, se le cobra cuando su agente está procesando de forma activa (no durante los períodos de espera de E/S si solo está esperando las respuestas de LLM). En el caso de los recursos de memoria, solo se le cobra por la memoria que consume su agente. 

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • La facturación se calcula por segundo, mediante los valores de uso de CPU y memoria más altos registrados durante ese segundo, con un mínimo de 1 segundo
  • Se aplica una facturación de memoria mínima de 128 MB
  • La transferencia de datos de red a través de los ENI del cliente se factura según las tarifas estándar de EC2.

Browser

La herramienta Browser de AgentCore proporciona una versión ejecutable de navegador rápido, seguro y basado en la nube para permitir que los agentes de IA interactúen con los sitios web a escala.

Precios basados en el consumo
Solo paga por lo que utilice, sin necesidad de configurar previamente los recursos. En el caso de los recursos de CPU, se le cobra solo cuando su herramienta está procesando de forma activa (no durante los períodos de espera de E/S si solo está esperando las respuestas de LLM). En el caso de los recursos de memoria, solo se le cobra por la memoria que consume su agente.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • La facturación se calcula por segundo, mediante los valores de uso de CPU y memoria más altos registrados durante ese segundo, con un mínimo de 1 segundo
  • Se aplica una facturación de memoria mínima de 128 MB
  • La transferencia de datos de red a través de los ENI del cliente se factura según las tarifas estándar de EC2.

Code Interpreter

La herramienta Code Interpreter de AgentCore permite a los agentes de IA escribir y ejecutar código de forma segura en entornos de prueba, lo que mejora su precisión y amplía su capacidad para resolver tareas complejas integrales.

Precios basados en el consumo
Solo paga por lo que utilice, sin necesidad de configurar previamente los recursos. En el caso de los recursos de CPU, se le cobra solo cuando su herramienta está procesando de forma activa (no durante los períodos de espera de E/S si solo está esperando las respuestas de LLM). En el caso de los recursos de memoria, solo se le cobra por la memoria que consume su agente.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • La facturación se calcula por segundo, mediante los valores de uso de CPU y memoria más altos registrados durante ese segundo, con un mínimo de 1 segundo
  • Se aplica una facturación de memoria mínima de 128 MB
  • La transferencia de datos de red a través de los ENI del cliente se factura según las tarifas estándar de EC2. 

Gateway

AgentCore Gateway proporciona una forma segura para que los agentes detecten y usen las herramientas, además de transformar con facilidad las API, las funciones de Lambda y los servicios existentes en herramientas compatibles con los agentes.

Precios basados en el consumo
Solo paga por las llamadas a la API que realizan sus agentes a través de Gateway. Se le cobra en función del número de operaciones de herramientas (ListTools e InvokeTool), consultas de búsqueda y herramientas indexadas para la funcionalidad de búsqueda semántica. 

Detalles clave:

  • No se requieren costos iniciales ni compromisos mínimos
  • Las API ListTools e InvokeTool se miden en incrementos de transferencia de datos de 128 KB

 

Identity

AgentCore Identity simplifica la administración de la identidad y el acceso de los agentes, y permite a sus agentes acceder de forma segura a los recursos de AWS y a las herramientas y servicios de terceros, ya sea en nombre de los usuarios o por sí mismos con el consentimiento preautorizado de los usuarios.

Precios basados en el consumo
Los clientes que utilizan AgentCore Identity a través de AgentCore Runtime o AgentCore Gateway no incurren en ningún cargo adicional por el uso de AgentCore Identity. En todos los demás escenarios, paga solo por lo que usa y se le cobra en función del número de solicitudes del agente a AgentCore Identity para obtener un token de OAuth o una clave de API.

Detalles clave:

  • Sin pagos mínimos ni compromisos iniciales
  • La facturación se calcula por cada token de OAuth o clave de API solicitada correctamente para realizar una tarea que requiera autorización para un recurso que no es de AWS
  • No se incurre en cargos adicionales cuando los clientes utilizan AgentCore Identity a través de AgentCore Runtime o AgentCore Gateway

Memory

AgentCore Memory facilita a los desarrolladores la creación de agentes sensibles al contexto, ya que les permite prescindir de la compleja administración de la infraestructura de memoria y, al mismo tiempo, proporciona un control total sobre lo que recuerda el agente de IA.

Precios basados en el consumo
Solo paga por lo que utilice. Nuestros precios son sencillos y se basan en el uso; además, se alinean directamente con la forma en que sus agentes de IA crean valor:

  1. El precio de la memoria a corto plazo se basa en la cantidad de eventos sin procesar ingeridos, lo que le brinda costos predecibles para el contexto de la sesión.
  2. El precio de la memoria a largo plazo se basa en la cantidad de memorias almacenadas cada mes y en la cantidad de memorias recuperadas, por lo que solo paga cuando sus agentes almacenan y utilizan información duradera.
  3. Si desea extraer la memoria a largo plazo de los eventos sin procesar, puede elegir entre estrategias de memoria integradas, que incluyen el procesamiento automático, o estrategias de memoria personalizadas que se ejecutan en su cuenta mediante la elección de peticiones y mensajes.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • Para la memoria a corto plazo, la facturación se calcula por solicitud de creación de eventos
  • Para el almacenamiento de memoria a largo plazo, la facturación se calcula por memoria almacenada por día y se promedia a lo largo del mes
  • Para la recuperación de memoria a largo plazo, la facturación se calcula por solicitud de recuperación de memoria

Observability

AgentCore Observability brinda a los desarrolladores una visibilidad completa de los flujos de trabajo de los agentes para rastrear, depurar y supervisar el rendimiento de los agentes de IA en los entornos de producción.

Precios basados en el consumo
Paga por uso según la telemetría generada, almacenada y consultada por sus agentes. Los datos de telemetría se ingieren y almacenan en su cuenta de Amazon CloudWatch. Se le cobra por la ingesta y el almacenamiento de datos, las consultas para recuperar y analizar información y el enmascaramiento de datos confidenciales o de identificación personal en los registros. Si desea consultar más información sobre los precios, visite la página de precios de Amazon CloudWatch. 

Tabla de precios

Service
Type
Resource
Price
Runtime

Basado en el consumo

Basado en el consumo

CPU

Memory

0,0895 USD por hora de CPU virtual

0,00945 USD por GB por hora

Herramienta Browser

Basado en el consumo

Basado en el consumo

CPU

Memory

0,0895 USD por hora de CPU virtual

0,00945 USD por GB por hora

Code Interpreter

Basado en el consumo

Basado en el consumo

CPU

Memory

0,0895 USD por hora de CPU virtual

0,00945 USD por GB por hora

Gateway

Basado en el consumo

Basado en el consumo

Basado en el consumo

Invocaciones de API (ListTools, InvokeTool)

API de búsqueda

Indexación de herramientas

0,005 USD por cada 1000 invocaciones

0,025 USD por cada 1000 invocaciones

0,02 USD por cada 100 herramientas indexadas al mes

Identity

Basado en el consumo

Solicitudes de claves de API o token para recursos que no son de AWS

0,010 USD por cada 1000 claves de API o token solicitadas por el agente

(Nota: AgentCore Identity está disponible sin costo adicional para los clientes cuando lo usan a través de AgentCore Runtime o AgentCore Gateway)

Memory

Basado en el consumo

Basado en el consumo

Basado en el consumo

Memoria a corto plazo

Almacenamiento de memoria a largo plazo

Recuperación de memoria a largo plazo

0,25 USD por cada 1000 eventos nuevos

Uso de estrategias de memoria integradas: 0,75 USD por cada 1000 memorias almacenadas al mes

Uso de estrategias de memoria personalizadas: 0,25 USD por cada 1000 memorias almacenadas al mes

0,50 USD por cada 1000 recuperaciones de memoria

Observability

Basado en el consumo

Registros, métricas y seguimientos

Se cobra según los precios de Amazon CloudWatch

*En el caso de las estrategias de extracción de memoria personalizadas, puede incurrir en cargos adicionales por el uso del modelo en su cuenta

Ejemplos de precios

Runtime

Ejemplo: Implementación de un agente de atención al cliente

Planea implementar un agente de atención al cliente que resuelva las consultas de los usuarios a través del chat y el correo electrónico. El agente se encarga de problemas con los pedidos, la verificación de la cuenta y las aclaraciones de políticas. Utiliza la generación aumentada por recuperación (RAG) para obtener las políticas de los productos y herramientas compatibles con el protocolo de contexto de modelos (MCP), con el objetivo de consultar el estado de los pedidos y actualizar los tickets de asistencia. Cada sesión de agente implica un razonamiento sofisticado de varios pasos con 1 llamada RAG a un almacén de vectores, 2 llamadas a herramientas del MCP (por ejemplo, OrderAPI, TicketAPI) y 2 pasos de razonamiento de LLM. Ha implementado su agente en AgentCore Runtime porque necesita un aislamiento completo de la sesión y la flexibilidad de escalar a millones de sesiones en segundos.

Al procesar 10 millones de solicitudes de usuarios al mes, cada sesión dura 60 segundos con un 70 % de tiempo de espera de E/S (es decir, la espera de respuestas de LLM o respuestas de red de las API internas). Cada sesión de agente utiliza 1 vCPU durante el procesamiento activo y 2 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:

Costo de CPU por sesión: 18 segundos (ajustado para tener en cuenta el 70 % del tiempo de espera de E/S) × 1 vCPU × (0,0895 USD/3600) = 0,0004475 USD
Costo de memoria por sesión: 60 segundos × 2 GB × (0,00945 USD/3600) = 0,000315 USD
Costo total por sesión: 0,0007625 USD
Total mensual: 10 millones de sesiones × 0,0007625 USD = 7,625 USD

Los precios de AgentCore Runtime basados en el consumo significan que solo paga por el tiempo de procesamiento activo de la CPU, no por los períodos de espera de E/S, lo que se traduce en una alta rentabilidad en comparación con las opciones de procesamiento tradicionales. 

Browser

Ejemplo: Sistema automatizado de reservas de viajes

Planea crear un agente de IA para reservas de viajes que automatice el proceso completo de planificación y reserva del viaje a través de interacciones web. Su implementación requiere la versión ejecutable segura y sin servidor de Browser de AgentCore para administrar de forma dinámica los navegadores sin interfaz, a fin de buscar vuelos y hoteles, simular clics, extraer precios y enviar formularios de reserva. La herramienta Browser de AgentCore ofrece capacidades de nivel empresarial que incluyen computación en entornos de pruebas aislados de sesiones y una observabilidad integral a través de Live View y Session Replay.

El agente procesa 100 000 solicitudes mensuales. Cada sesión del navegador dura 10 minutos con un tiempo de espera de E/S del 80 %, y se utilizan 2 vCPU durante el procesamiento activo y 4 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:

Costo de CPU por sesión: 120 segundos (ajustado para tener en cuenta el 80 % del tiempo de espera de E/S) × 2 vCPU × (0,0895 USD/3600) = 0,005967 USD
Costo de memoria por sesión: 600 segundos × 4 GB × (0,00945/3600 USD) = 0,0063 USD
Costo total por sesión: 0,012267 USD
Total mensual: 100 000 sesiones × 0,012267 USD = 1226,67 USD

Code Interpreter

Ejemplo: Automatización del análisis de datos en lenguaje natural

Planea implementar un agente de análisis de datos que ayude a los equipos empresariales y de productos a realizar consultas de conjuntos de datos, visualizaciones y análisis estadísticos, todo ello a través de lenguaje natural. Su agente genera y ejecuta código Python de forma dinámica para solicitudes complejas, como el análisis de correlación entre el tráfico del sitio y las tasas de conversión. Utiliza Code Interpreter AgentCore porque proporciona entornos de pruebas aislados que cumplen con las políticas de seguridad empresarial, versiones ejecutables prediseñadas para varios lenguajes (JavaScript, TypeScript, Python) y compatibilidad con archivos de gran tamaño.

El agente procesa 10 000 solicitudes mensuales con 3 ejecuciones de código por solicitud. Cada ejecución dura 2 minutos con un tiempo de espera de E/S del 60 %, y se utilizan 2 vCPU durante el procesamiento activo y 4 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:

Costo de CPU por sesión: 48 segundos (ajustado para tener en cuenta el 60 % del tiempo de espera de E/S) × 2 vCPU × (0,0895 USD/3600) = 0,002387 USD
Costo de memoria por sesión: 120 segundos × 4 GB × (0,00945/3600 USD) = 0,00126 USD
Costo total por sesión: 0,003647 USD
Total mensual: 30 000 ejecuciones × 0,003647 USD = 109,40 USD

Gateway

Ejemplo: Conexión de un agente asistente para Recursos Humanos con herramientas internas

Planea crear un agente asistente para el departamento de Recursos Humanos de una empresa de tamaño mediano, que se encargue de cuestiones sobre políticas internas, saldos de días libres, inscripción en beneficios consultas y sobre nóminas. Para atender las solicitudes de los usuarios, el agente debe acceder a varios sistemas internos (las API de incorporación, beneficios, salarios y gestión de ausencias) como a herramientas. Utilizó AgentCore Gateway para crear servidores MCP para 200 herramientas internas con las que su agente puede interactuar desde cualquier lugar, sin escribir ningún código. A fin de mejorar la precisión en el uso de las herramientas, ha utilizado la capacidad de búsqueda para indexar los metadatos de las herramientas y la coincidencia dinámica de las herramientas durante la invocación del agente en función del contexto de interacción.

Cada interacción del agente requiere 1 invocación a la API de búsqueda y 4 a la API de InvokeTool. 50 millones de interacciones mensuales dan como resultado 50 millones de llamadas de búsqueda y 200 millones de llamadas de InvokeTool. Sus costos mensuales se desglosan de la siguiente manera:

Cargos de SearchToolIndex: 200 herramientas × 0,02 USD por cada 100 herramientas = 0,04 USD
Cargos de la API de búsqueda: 50 millones × 25 USD por cada millón = 1250 USD
Cargos de la API de InvokeTool: 200 millones × 5 USD por cada millón = 1000 USD
Total mensual: 2250,04 USD

Identity

Ejemplo: Administración segura del acceso al servicio de atención al cliente

Planea tener un agente de atención al cliente que ayude a los equipos técnicos a acceder a varias herramientas: Slack para las conversaciones de asistencia, Zoom para buscar los registros de llamadas y GitHub para el seguimiento de problemas y los registros de confirmaciones. Su implementación usa AgentCore Identity para un acceso delegado y seguro “en nombre de” los usuarios o ingenieros de asistencia. El sistema es compatible con los proveedores de identidad existentes (por ejemplo, Okta, Microsoft Entra ID, Amazon Cognito) y administra todos los métodos de autenticación, desde los tokens de OAuth hasta los roles de IAM, lo que elimina la necesidad de contar con una infraestructura de seguridad personalizada.

Supongamos que 10 000 usuarios activos al mes utilizan el agente con un promedio de 5 interacciones cada uno, lo que requiere 3 accesos a la herramienta por sesión para cada usuario al mes. En ese caso, sus costos mensuales se desglosarían de la siguiente manera:

Total de tokens solicitados: 10 000 usuarios × 5 sesiones × 3 herramientas = 150 000 tokens
Total mensual: 150 000 solicitudes × 0,010 USD por cada 1000 solicitudes = 1,50 USD

Nota: AgentCore Identity se incluye sin costo adicional al usar AgentCore Runtime o Gateway.

Memory

Ejemplo: Implementación de un agente asistente de codificación personalizado

Planea desarrollar un agente asistente de codificación que ayude a los ingenieros de software a escribir, depurar y refactorizar código en IDE y terminales. Para ofrecer una experiencia personalizada, el agente debe mantener el contexto durante una sesión y recordar las preferencias del usuario a lo largo de varias sesiones. Su implementación usa AgentCore Memory para equipar al agente con memoria a corto plazo (conversaciones y eventos inmediatos) y memoria a largo plazo (conocimiento persistente entre sesiones).

Cada vez que un usuario interactúa con el agente (por ejemplo, al enviar un fragmento de código o hacer una pregunta de codificación), usted envía un evento a AgentCore Memory para almacenarlo como memoria a corto plazo. En el caso de la memoria a largo plazo, configuró estrategias de extracción integradas para extraer y almacenar de manera automática el resumen de las sesiones de depuración y las preferencias de los usuarios entre sesiones. A continuación, el agente puede recuperar estas memorias a largo plazo para ofrecer una experiencia personalizada a los desarrolladores.

Con 100 000 eventos mensuales de memoria a corto plazo, 10 000 memorias almacenadas a largo plazo y 20 000 recuperaciones de memoria mensuales, sus costos se desglosarían de la siguiente manera:

Memoria a corto plazo: 100 000 eventos × 0,25 USD por cada 1000 eventos = 25 USD
Almacenamiento de memoria a largo plazo:10 000 memorias × 0,75 USD por cada 1000 memorias = 7,50 USD
Recuperación de memoria a largo plazo: 20 000 recuperaciones × 0,50 USD por cada 1000 recuperaciones = 10 USD
Total mensual: 42,50 USD

Nota: Con las estrategias de extracción personalizadas, el costo del almacenamiento a largo plazo sería inferior, de 0,25 USD por cada 1000 memorias almacenadas, ya que puede incurrir en cargos adicionales por el uso del modelo en su cuenta.

Observability

Para ver ejemplos de precios de AgentCore Observability, consulte los precios de CloudWatch aquí.