Precios de Amazon Bedrock AgentCore (versión preliminar)
Adapte AgentCore a sus necesidades: combine los servicios, utilícelos de forma independiente o conjunta y pague por lo que utilice a medida que crecen sus iniciativas de IA.
Pague solo por lo que utilice
Amazon Bedrock AgentCore ofrece precios flexibles y basados en el consumo, sin compromisos iniciales ni tarifas mínimas. Cada servicio, ya sea Runtime, las herramientas (Browser, Code Interpreter), Gateway, Identity, Memory y Observability, se puede usar de forma independiente o en conjunto, y solo pagará por lo que utilice. Este enfoque modular le permite empezar con poco y escalar a medida que crecen sus aplicaciones de agentes de IA.
Puede probar los servicios de AgentCore de forma gratuita hasta el 16 de septiembre de 2025. Los precios estándar de AWS se aplican a cualquier servicio de AWS adicional que se utilice como parte del uso de AgentCore (por ejemplo, los precios de CloudWatch se aplicarán a AgentCore Observability). A partir del 17 de septiembre de 2025, AWS le facturará por el uso del servicio AgentCore en función de esta página.
Servicios de Bedrock AgentCore
Runtime
AgentCore Runtime es una versión ejecutable segura y sin servidor diseñada específicamente para implementar y escalar agentes y herramientas de IA dinámicos.
Precios basados en el consumo
Solo paga por lo que utilice, sin necesidad de configurar previamente los recursos. En el caso de los recursos de CPU, se le cobra cuando su agente está procesando de forma activa (no durante los períodos de espera de E/S si solo está esperando las respuestas de LLM). En el caso de los recursos de memoria, solo se le cobra por la memoria que consume su agente.
Detalles clave:
- No se requiere una selección de recursos por adelantado
- La facturación se calcula por segundo, mediante los valores de uso de CPU y memoria más altos registrados durante ese segundo, con un mínimo de 1 segundo
- Se aplica una facturación de memoria mínima de 128 MB
- La transferencia de datos de red a través de los ENI del cliente se factura según las tarifas estándar de EC2.
Browser
La herramienta Browser de AgentCore proporciona una versión ejecutable de navegador rápido, seguro y basado en la nube para permitir que los agentes de IA interactúen con los sitios web a escala.
Precios basados en el consumo
Solo paga por lo que utilice, sin necesidad de configurar previamente los recursos. En el caso de los recursos de CPU, se le cobra solo cuando su herramienta está procesando de forma activa (no durante los períodos de espera de E/S si solo está esperando las respuestas de LLM). En el caso de los recursos de memoria, solo se le cobra por la memoria que consume su agente.
Detalles clave:
- No se requiere una selección de recursos por adelantado
- La facturación se calcula por segundo, mediante los valores de uso de CPU y memoria más altos registrados durante ese segundo, con un mínimo de 1 segundo
- Se aplica una facturación de memoria mínima de 128 MB
- La transferencia de datos de red a través de los ENI del cliente se factura según las tarifas estándar de EC2.
Code Interpreter
La herramienta Code Interpreter de AgentCore permite a los agentes de IA escribir y ejecutar código de forma segura en entornos de prueba, lo que mejora su precisión y amplía su capacidad para resolver tareas complejas integrales.
Precios basados en el consumo
Solo paga por lo que utilice, sin necesidad de configurar previamente los recursos. En el caso de los recursos de CPU, se le cobra solo cuando su herramienta está procesando de forma activa (no durante los períodos de espera de E/S si solo está esperando las respuestas de LLM). En el caso de los recursos de memoria, solo se le cobra por la memoria que consume su agente.
Detalles clave:
- No se requiere una selección de recursos por adelantado
- La facturación se calcula por segundo, mediante los valores de uso de CPU y memoria más altos registrados durante ese segundo, con un mínimo de 1 segundo
- Se aplica una facturación de memoria mínima de 128 MB
- La transferencia de datos de red a través de los ENI del cliente se factura según las tarifas estándar de EC2.
Gateway
AgentCore Gateway proporciona una forma segura para que los agentes detecten y usen las herramientas, además de transformar con facilidad las API, las funciones de Lambda y los servicios existentes en herramientas compatibles con los agentes.
Precios basados en el consumo
Solo paga por las llamadas a la API que realizan sus agentes a través de Gateway. Se le cobra en función del número de operaciones de herramientas (ListTools e InvokeTool), consultas de búsqueda y herramientas indexadas para la funcionalidad de búsqueda semántica.
Detalles clave:
- No se requieren costos iniciales ni compromisos mínimos
- Las API ListTools e InvokeTool se miden en incrementos de transferencia de datos de 128 KB
Identity
AgentCore Identity simplifica la administración de la identidad y el acceso de los agentes, y permite a sus agentes acceder de forma segura a los recursos de AWS y a las herramientas y servicios de terceros, ya sea en nombre de los usuarios o por sí mismos con el consentimiento preautorizado de los usuarios.
Precios basados en el consumo
Los clientes que utilizan AgentCore Identity a través de AgentCore Runtime o AgentCore Gateway no incurren en ningún cargo adicional por el uso de AgentCore Identity. En todos los demás escenarios, paga solo por lo que usa y se le cobra en función del número de solicitudes del agente a AgentCore Identity para obtener un token de OAuth o una clave de API.
Detalles clave:
- Sin pagos mínimos ni compromisos iniciales
- La facturación se calcula por cada token de OAuth o clave de API solicitada correctamente para realizar una tarea que requiera autorización para un recurso que no es de AWS
- No se incurre en cargos adicionales cuando los clientes utilizan AgentCore Identity a través de AgentCore Runtime o AgentCore Gateway
Memory
AgentCore Memory facilita a los desarrolladores la creación de agentes sensibles al contexto, ya que les permite prescindir de la compleja administración de la infraestructura de memoria y, al mismo tiempo, proporciona un control total sobre lo que recuerda el agente de IA.
Precios basados en el consumo
Solo paga por lo que utilice. Nuestros precios son sencillos y se basan en el uso; además, se alinean directamente con la forma en que sus agentes de IA crean valor:
- El precio de la memoria a corto plazo se basa en la cantidad de eventos sin procesar ingeridos, lo que le brinda costos predecibles para el contexto de la sesión.
- El precio de la memoria a largo plazo se basa en la cantidad de memorias almacenadas cada mes y en la cantidad de memorias recuperadas, por lo que solo paga cuando sus agentes almacenan y utilizan información duradera.
- Si desea extraer la memoria a largo plazo de los eventos sin procesar, puede elegir entre estrategias de memoria integradas, que incluyen el procesamiento automático, o estrategias de memoria personalizadas que se ejecutan en su cuenta mediante la elección de peticiones y mensajes.
Detalles clave:
- No se requiere una selección de recursos por adelantado
- Para la memoria a corto plazo, la facturación se calcula por solicitud de creación de eventos
- Para el almacenamiento de memoria a largo plazo, la facturación se calcula por memoria almacenada por día y se promedia a lo largo del mes
- Para la recuperación de memoria a largo plazo, la facturación se calcula por solicitud de recuperación de memoria
Observability
AgentCore Observability brinda a los desarrolladores una visibilidad completa de los flujos de trabajo de los agentes para rastrear, depurar y supervisar el rendimiento de los agentes de IA en los entornos de producción.
Precios basados en el consumo
Paga por uso según la telemetría generada, almacenada y consultada por sus agentes. Los datos de telemetría se ingieren y almacenan en su cuenta de Amazon CloudWatch. Se le cobra por la ingesta y el almacenamiento de datos, las consultas para recuperar y analizar información y el enmascaramiento de datos confidenciales o de identificación personal en los registros. Si desea consultar más información sobre los precios, visite la página de precios de Amazon CloudWatch.
Tabla de precios
Service
|
Type
|
Resource
|
Price
|
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Runtime
|
|
|
|
|||||||||
Herramienta Browser
|
|
|
|
|||||||||
Code Interpreter
|
|
|
|
|||||||||
Gateway
|
|
|
|
|||||||||
Identity
|
Basado en el consumo |
Solicitudes de claves de API o token para recursos que no son de AWS |
0,010 USD por cada 1000 claves de API o token solicitadas por el agente (Nota: AgentCore Identity está disponible sin costo adicional para los clientes cuando lo usan a través de AgentCore Runtime o AgentCore Gateway) |
|||||||||
Memory
|
|
|
|
|||||||||
Observability
|
Basado en el consumo |
Registros, métricas y seguimientos |
Se cobra según los precios de Amazon CloudWatch |
*En el caso de las estrategias de extracción de memoria personalizadas, puede incurrir en cargos adicionales por el uso del modelo en su cuenta
Ejemplos de precios
Runtime
Ejemplo: Implementación de un agente de atención al cliente
Planea implementar un agente de atención al cliente que resuelva las consultas de los usuarios a través del chat y el correo electrónico. El agente se encarga de problemas con los pedidos, la verificación de la cuenta y las aclaraciones de políticas. Utiliza la generación aumentada por recuperación (RAG) para obtener las políticas de los productos y herramientas compatibles con el protocolo de contexto de modelos (MCP), con el objetivo de consultar el estado de los pedidos y actualizar los tickets de asistencia. Cada sesión de agente implica un razonamiento sofisticado de varios pasos con 1 llamada RAG a un almacén de vectores, 2 llamadas a herramientas del MCP (por ejemplo, OrderAPI, TicketAPI) y 2 pasos de razonamiento de LLM. Ha implementado su agente en AgentCore Runtime porque necesita un aislamiento completo de la sesión y la flexibilidad de escalar a millones de sesiones en segundos.
Al procesar 10 millones de solicitudes de usuarios al mes, cada sesión dura 60 segundos con un 70 % de tiempo de espera de E/S (es decir, la espera de respuestas de LLM o respuestas de red de las API internas). Cada sesión de agente utiliza 1 vCPU durante el procesamiento activo y 2 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:
Costo de CPU por sesión: 18 segundos (ajustado para tener en cuenta el 70 % del tiempo de espera de E/S) × 1 vCPU × (0,0895 USD/3600) = 0,0004475 USD
Costo de memoria por sesión: 60 segundos × 2 GB × (0,00945 USD/3600) = 0,000315 USD
Costo total por sesión: 0,0007625 USD
Total mensual: 10 millones de sesiones × 0,0007625 USD = 7,625 USD
Los precios de AgentCore Runtime basados en el consumo significan que solo paga por el tiempo de procesamiento activo de la CPU, no por los períodos de espera de E/S, lo que se traduce en una alta rentabilidad en comparación con las opciones de procesamiento tradicionales.
Browser
Ejemplo: Sistema automatizado de reservas de viajes
Planea crear un agente de IA para reservas de viajes que automatice el proceso completo de planificación y reserva del viaje a través de interacciones web. Su implementación requiere la versión ejecutable segura y sin servidor de Browser de AgentCore para administrar de forma dinámica los navegadores sin interfaz, a fin de buscar vuelos y hoteles, simular clics, extraer precios y enviar formularios de reserva. La herramienta Browser de AgentCore ofrece capacidades de nivel empresarial que incluyen computación en entornos de pruebas aislados de sesiones y una observabilidad integral a través de Live View y Session Replay.
El agente procesa 100 000 solicitudes mensuales. Cada sesión del navegador dura 10 minutos con un tiempo de espera de E/S del 80 %, y se utilizan 2 vCPU durante el procesamiento activo y 4 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:
Costo de CPU por sesión: 120 segundos (ajustado para tener en cuenta el 80 % del tiempo de espera de E/S) × 2 vCPU × (0,0895 USD/3600) = 0,005967 USD
Costo de memoria por sesión: 600 segundos × 4 GB × (0,00945/3600 USD) = 0,0063 USD
Costo total por sesión: 0,012267 USD
Total mensual: 100 000 sesiones × 0,012267 USD = 1226,67 USD
Code Interpreter
Ejemplo: Automatización del análisis de datos en lenguaje natural
Planea implementar un agente de análisis de datos que ayude a los equipos empresariales y de productos a realizar consultas de conjuntos de datos, visualizaciones y análisis estadísticos, todo ello a través de lenguaje natural. Su agente genera y ejecuta código Python de forma dinámica para solicitudes complejas, como el análisis de correlación entre el tráfico del sitio y las tasas de conversión. Utiliza Code Interpreter AgentCore porque proporciona entornos de pruebas aislados que cumplen con las políticas de seguridad empresarial, versiones ejecutables prediseñadas para varios lenguajes (JavaScript, TypeScript, Python) y compatibilidad con archivos de gran tamaño.
El agente procesa 10 000 solicitudes mensuales con 3 ejecuciones de código por solicitud. Cada ejecución dura 2 minutos con un tiempo de espera de E/S del 60 %, y se utilizan 2 vCPU durante el procesamiento activo y 4 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:
Costo de CPU por sesión: 48 segundos (ajustado para tener en cuenta el 60 % del tiempo de espera de E/S) × 2 vCPU × (0,0895 USD/3600) = 0,002387 USD
Costo de memoria por sesión: 120 segundos × 4 GB × (0,00945/3600 USD) = 0,00126 USD
Costo total por sesión: 0,003647 USD
Total mensual: 30 000 ejecuciones × 0,003647 USD = 109,40 USD
Gateway
Ejemplo: Conexión de un agente asistente para Recursos Humanos con herramientas internas
Planea crear un agente asistente para el departamento de Recursos Humanos de una empresa de tamaño mediano, que se encargue de cuestiones sobre políticas internas, saldos de días libres, inscripción en beneficios consultas y sobre nóminas. Para atender las solicitudes de los usuarios, el agente debe acceder a varios sistemas internos (las API de incorporación, beneficios, salarios y gestión de ausencias) como a herramientas. Utilizó AgentCore Gateway para crear servidores MCP para 200 herramientas internas con las que su agente puede interactuar desde cualquier lugar, sin escribir ningún código. A fin de mejorar la precisión en el uso de las herramientas, ha utilizado la capacidad de búsqueda para indexar los metadatos de las herramientas y la coincidencia dinámica de las herramientas durante la invocación del agente en función del contexto de interacción.
Cada interacción del agente requiere 1 invocación a la API de búsqueda y 4 a la API de InvokeTool. 50 millones de interacciones mensuales dan como resultado 50 millones de llamadas de búsqueda y 200 millones de llamadas de InvokeTool. Sus costos mensuales se desglosan de la siguiente manera:
Cargos de SearchToolIndex: 200 herramientas × 0,02 USD por cada 100 herramientas = 0,04 USD
Cargos de la API de búsqueda: 50 millones × 25 USD por cada millón = 1250 USD
Cargos de la API de InvokeTool: 200 millones × 5 USD por cada millón = 1000 USD
Total mensual: 2250,04 USD
Identity
Ejemplo: Administración segura del acceso al servicio de atención al cliente
Planea tener un agente de atención al cliente que ayude a los equipos técnicos a acceder a varias herramientas: Slack para las conversaciones de asistencia, Zoom para buscar los registros de llamadas y GitHub para el seguimiento de problemas y los registros de confirmaciones. Su implementación usa AgentCore Identity para un acceso delegado y seguro “en nombre de” los usuarios o ingenieros de asistencia. El sistema es compatible con los proveedores de identidad existentes (por ejemplo, Okta, Microsoft Entra ID, Amazon Cognito) y administra todos los métodos de autenticación, desde los tokens de OAuth hasta los roles de IAM, lo que elimina la necesidad de contar con una infraestructura de seguridad personalizada.
Supongamos que 10 000 usuarios activos al mes utilizan el agente con un promedio de 5 interacciones cada uno, lo que requiere 3 accesos a la herramienta por sesión para cada usuario al mes. En ese caso, sus costos mensuales se desglosarían de la siguiente manera:
Total de tokens solicitados: 10 000 usuarios × 5 sesiones × 3 herramientas = 150 000 tokens
Total mensual: 150 000 solicitudes × 0,010 USD por cada 1000 solicitudes = 1,50 USD
Nota: AgentCore Identity se incluye sin costo adicional al usar AgentCore Runtime o Gateway.
Memory
Ejemplo: Implementación de un agente asistente de codificación personalizado
Planea desarrollar un agente asistente de codificación que ayude a los ingenieros de software a escribir, depurar y refactorizar código en IDE y terminales. Para ofrecer una experiencia personalizada, el agente debe mantener el contexto durante una sesión y recordar las preferencias del usuario a lo largo de varias sesiones. Su implementación usa AgentCore Memory para equipar al agente con memoria a corto plazo (conversaciones y eventos inmediatos) y memoria a largo plazo (conocimiento persistente entre sesiones).
Cada vez que un usuario interactúa con el agente (por ejemplo, al enviar un fragmento de código o hacer una pregunta de codificación), usted envía un evento a AgentCore Memory para almacenarlo como memoria a corto plazo. En el caso de la memoria a largo plazo, configuró estrategias de extracción integradas para extraer y almacenar de manera automática el resumen de las sesiones de depuración y las preferencias de los usuarios entre sesiones. A continuación, el agente puede recuperar estas memorias a largo plazo para ofrecer una experiencia personalizada a los desarrolladores.
Con 100 000 eventos mensuales de memoria a corto plazo, 10 000 memorias almacenadas a largo plazo y 20 000 recuperaciones de memoria mensuales, sus costos se desglosarían de la siguiente manera:
Memoria a corto plazo: 100 000 eventos × 0,25 USD por cada 1000 eventos = 25 USD
Almacenamiento de memoria a largo plazo:10 000 memorias × 0,75 USD por cada 1000 memorias = 7,50 USD
Recuperación de memoria a largo plazo: 20 000 recuperaciones × 0,50 USD por cada 1000 recuperaciones = 10 USD
Total mensual: 42,50 USD
Nota: Con las estrategias de extracción personalizadas, el costo del almacenamiento a largo plazo sería inferior, de 0,25 USD por cada 1000 memorias almacenadas, ya que puede incurrir en cargos adicionales por el uso del modelo en su cuenta.
Observability
Para ver ejemplos de precios de AgentCore Observability, consulte los precios de CloudWatch aquí.
¿Ha encontrado lo que buscaba hoy?
Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios