Saltar al contenido principal

Precios de Amazon Bedrock AgentCore

Adapte AgentCore a sus necesidades: combine los servicios, utilícelos de forma independiente o conjunta y pague por lo que utilice a medida que crecen sus iniciativas de IA.

Pague solo por lo que utilice

Amazon Bedrock AgentCore ofrece precios flexibles y basados en el consumo, sin compromisos iniciales ni tarifas mínimas. Cada servicio y capacidad (Runtime, Gateway, Policy (versión preliminar), Identity, Memory, Observability, Evaluations (versión preliminar), Browser y Code Interpreter) se puede usar de forma independiente o en conjunto, y solo paga por lo que usa. Este enfoque modular le permite empezar con poco y escalar a medida que crecen sus aplicaciones de agentes. 

Comience a utilizar AgentCore sin coste alguno: los nuevos clientes de AWS reciben hasta 200 USD en créditos del nivel gratuito. Explore las ventajas del nivel gratuito de AWS y comience a crear hoy mismo.

Nota: La política y las evaluaciones de AgentCore se ofrecen de forma gratuita en versión preliminar.

Servicios y capacidades de AgentCore

Runtime

AgentCore Runtime es una versión ejecutable segura y sin servidor diseñada específicamente para implementar y escalar agentes y herramientas. Elija entre la implementación directa de código para una iteración rápida o la implementación basada en contenedores para obtener el máximo control.

Solo paga por los recursos activos que consume  
A diferencia de los servicios informáticos tradicionales que cobran por los recursos preasignados (es decir, el tamaño fijo de la instancia y el coste por segundo mientras se aloja el agente), con AgentCore Runtime solo se paga por el consumo de recursos activos. Esto supone un ahorro de costes sustancial para las cargas de trabajo de las agencias, que normalmente dedican entre el 30 y el 70 % del tiempo a esperar a que se produzcan respuestas de LLM, llamadas a herramientas o API o consultas a bases de datos. Con los precios preasignados, pagaría por la CPU inactiva durante estos períodos de espera. Con los precios activos basados en el consumo de recursos de AgentCore Runtime, los tiempos de espera e inactividad de E/S son gratuitos si no se está ejecutando ningún otro proceso en segundo plano.

La facturación se basa en el consumo de CPU y memoria durante la duración de la sesión, calculado en incrementos por segundo. En el caso de los recursos de CPU, se le cobra en función del consumo real; si su agente no consume CPU durante la espera de E/S, no se le cobrará nada por la CPU. En el caso de los recursos de memoria, se le cobra por la cantidad máxima de memoria consumida hasta ese segundo.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • La facturación se calcula por segundo, utilizando el consumo real de CPU y el consumo máximo de memoria hasta ese segundo, con un mínimo de 1 segundo
  • Solo paga por el consumo real de recursos durante la sesión, que abarca desde el arranque de la microVM, la inicialización, el procesamiento activo y los períodos de inactividad hasta la finalización de la sesión (cierre de la microVM)
  • La facturación incluye los gastos generales del sistema además del uso de recursos de la aplicación
  • Se aplica una facturación de memoria mínima de 128 MB
  • Costes de almacenamiento: la implementación de contenedores requiere almacenamiento ECR (se factura por separado). Direct Code Deployment le facturará el tamaño de los artefactos de código que haya implementado a las tarifas estándar de S3, a partir del 27 de febrero de 2026.
  • Los cargos por transferencia de datos de red se aplican a las tarifas EC2 estándar


Browser

El AgentCore Browser proporciona una versión ejecutable de navegador rápido, seguro y basado en la nube para permitir que los agentes interactúen con los sitios web a escala. 

Solo paga por los recursos activos que consume
A diferencia de los servicios informáticos tradicionales que cobran por los recursos preasignados (es decir, el tamaño fijo de la instancia y el coste por segundo mientras se aloja el agente), con AgentCore Browser solo se paga por el consumo de recursos activos. Esto supone un ahorro de costes sustancial para las cargas de trabajo de las agencias, que normalmente dedican entre el 30 y el 70 % del tiempo a esperar a que se produzcan respuestas de LLM, llamadas a herramientas o API o consultas a bases de datos. Con los precios preasignados, pagaría por la CPU inactiva durante estos períodos de espera. Con los precios activos basados en el consumo de recursos de AgentCore Browser, los tiempos de espera e inactividad de E/S son gratuitos si no se está ejecutando ningún otro proceso en segundo plano.

La facturación se basa en el consumo de CPU y memoria durante la duración de la sesión, calculado en incrementos por segundo. En el caso de los recursos de CPU, se le cobra en función del consumo real; si su agente no consume CPU durante la espera de E/S, no se le cobrará nada por la CPU. En el caso de los recursos de memoria, se le cobra por la cantidad máxima de memoria consumida hasta ese segundo.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • La facturación se calcula por segundo, utilizando el consumo real de CPU y el consumo máximo de memoria hasta ese segundo, con un mínimo de 1 segundo
  • Solo paga por el consumo real de recursos durante la sesión, que abarca desde el arranque de la microVM, la inicialización, el procesamiento activo y los períodos de inactividad hasta la finalización de la sesión (cierre de la microVM)
  • La facturación incluye los gastos generales del sistema además del uso de recursos de la aplicación
  • Se aplica una facturación de memoria mínima de 128 MB
  • Los cargos por transferencia de datos de red se aplican a las tarifas EC2 estándar

Code Interpreter

AgentCore Code Interpreter permite a los agentes ejecutar código de forma segura en entornos de prueba, lo que mejora su precisión y amplía su capacidad para resolver tareas integrales complejas. 

Solo paga por los recursos activos que consume
A diferencia de los servicios informáticos tradicionales que cobran por los recursos preasignados (es decir, el tamaño fijo de la instancia y el coste por segundo mientras se aloja el agente), con AgentCore Code Interpreter solo se paga por el consumo de recursos activos. Esto supone un ahorro de costes sustancial para las cargas de trabajo de las agencias, que normalmente dedican entre el 30 y el 70 % del tiempo a esperar a que se produzcan respuestas de LLM, llamadas a herramientas o API o consultas a bases de datos. Con los precios preasignados, pagaría por la CPU inactiva durante estos períodos de espera. Con los precios activos basados en el consumo de recursos de AgentCore Code Interpreter, los tiempos de espera e inactividad de E/S son gratuitos si no se está ejecutando ningún otro proceso en segundo plano.

La facturación se basa en el consumo de CPU y memoria durante la duración de la sesión, calculado en incrementos por segundo. En el caso de los recursos de CPU, se le cobra en función del consumo real; si su agente no consume CPU durante la espera de E/S, no se le cobrará nada por la CPU. En el caso de los recursos de memoria, se le cobra por la cantidad máxima de memoria consumida hasta ese segundo.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • La facturación se calcula por segundo, utilizando el consumo real de CPU y el consumo máximo de memoria hasta ese segundo, con un mínimo de 1 segundo
  • Solo paga por el consumo real de recursos durante la sesión, que abarca desde el arranque de la microVM, la inicialización, el procesamiento activo y los períodos de inactividad hasta la finalización de la sesión (cierre de la microVM)
  • La facturación incluye los gastos generales del sistema además del uso de recursos de la aplicación
  • Se aplica una facturación de memoria mínima de 128 MB
  • Los cargos por transferencia de datos de red se aplican a las tarifas EC2 estándar

Gateway

Amazon Bedrock AgentCore Gateway permite a los agentes acceder de forma segura a las herramientas mediante la transformación de las API y las funciones de Lambda en herramientas compatibles con los agentes y la conexión a los servidores MCP existentes.

Precios basados en el consumo
Solo paga por las llamadas a la API que realizan sus agentes a través de Gateway. Se le cobra en función del número de operaciones de MCP (por ejemplo, ListTools, CallTool y Ping), consultas de búsqueda y herramientas indexadas para la funcionalidad de búsqueda semántica.

Detalles clave:

  • No se requieren costes iniciales ni compromisos mínimos
  • Los cargos por transferencia de datos de red se aplican a las tarifas EC2 estándar

 

Policy (versión preliminar)

 

La política de Amazon Bedrock AgentCore le brinda un control integral sobre las acciones que toman los agentes, lo que ayuda a garantizar que los agentes se mantengan dentro de los límites definidos sin ralentizarse.

Precios basados en el consumo

Solo paga por las solicitudes de autorización realizadas durante la ejecución del agente. Cada vez que un agente llama a una herramienta a través de AgentCore Gateway, Policy comprueba que la acción cumple con sus reglas para determinar si está permitida o se deniega.

Además, Policy ofrece la creación de políticas en lenguaje natural, lo que le permite crear políticas de Cedar utilizando descripciones sencillas en lenguaje natural. Se le cobrará por cada 1000 tokens de entrada de usuario procesados al convertir el lenguaje natural en declaraciones de políticas de Cedar.

Identity

AgentCore Identity simplifica la administración de la identidad y el acceso de los agentes, y permite a sus agentes acceder de forma segura a los recursos de AWS y a las herramientas y servicios de terceros, ya sea en nombre de los usuarios o por sí mismos con el consentimiento preautorizado de los usuarios.

Precios basados en el consumo
Los clientes que utilizan AgentCore Identity a través de AgentCore Runtime o AgentCore Gateway no incurren en ningún cargo adicional por el uso de AgentCore Identity. En todos los demás escenarios, paga solo por lo que usa y se le cobra en función del número de solicitudes del agente a AgentCore Identity para obtener un token de OAuth o una clave de API.

Detalles clave:

  • Sin pagos mínimos ni compromisos iniciales
  • La facturación se calcula por cada token de OAuth o clave de API solicitada correctamente para realizar una tarea que requiera autorización para un recurso que no es de AWS
  • No se incurre en cargos adicionales cuando los clientes utilizan AgentCore Identity a través de AgentCore Runtime o AgentCore Gateway 

Memory

AgentCore Memory facilita a los desarrolladores la creación de agentes sensibles al contexto, ya que les permite prescindir de la compleja administración de la infraestructura de memoria y, al mismo tiempo, proporciona un control total sobre lo que recuerda el agente.

Precios basados en el consumo
Solo paga por lo que utilice. Nuestros precios son sencillos y se basan en el uso; además, se alinean directamente con la forma en que sus agentes crean valor:

  1. El precio de la memoria a corto plazo se basa en la cantidad de eventos sin procesar creados, lo que le brinda costes predecibles para el contexto de la sesión.
  2. El precio de los registros de memoria a largo plazo se basa en la cantidad de memorias procesadas y almacenadas cada mes y en la cantidad de llamadas de recuperación de registros de memoria, por lo que solo paga cuando sus agentes almacenan y utilizan el conocimiento procesado.
  3. Si desea extraer la memoria a largo plazo de los eventos sin procesar, puede elegir entre estrategias de memoria integradas, que incluyen el procesamiento automático, o estrategias de memoria más configurables que se ejecutan en su cuenta mediante la elección de peticiones y mensajes.

Detalles clave:

  • No se requiere una selección de recursos por adelantado
  • Para la memoria a corto plazo, la facturación se calcula por solicitud de creación de eventos
  • Para el almacenamiento de memoria a largo plazo, la facturación se calcula por registro de memoria almacenado por día y se promedia a lo largo del mes
  • Para la recuperación de memoria a largo plazo, la facturación se calcula por solicitud de recuperación de memoria

Observability

AgentCore Observability brinda a los desarrolladores una visibilidad completa de los flujos de trabajo de los agentes para rastrear, depurar y supervisar el rendimiento de los agentes en los entornos de producción.

Precios basados en el consumo
Paga por uso según la telemetría generada, almacenada y consultada por sus agentes. Los datos de telemetría se ingieren y almacenan en su cuenta de Amazon CloudWatch. Se le cobra por la ingesta y el almacenamiento de datos, las consultas para recuperar y analizar información y el enmascaramiento de datos confidenciales o información de identificación personal (PII) en los registros. Si desea consultar más información sobre los precios, visite la página de precios de Amazon CloudWatch. 

Evaluations (versión preliminar)

Las evaluaciones de AgentCore ayudan a inspeccionar continuamente la calidad de los agentes en función del comportamiento en el mundo real. Los equipos pueden realizar evaluaciones de agencias utilizando 13 evaluadores integrados en dimensiones de calidad comunes o crear evaluadores personalizados para requisitos empresariales específicos. Los resultados se integran en AgentCore Observability con tecnología de Amazon CloudWatch para una supervisión unificada.

Precios basados en el consumo
Paga en función del uso. En el caso de los evaluadores integrados, AgentCore cobra los precios en función de los tokens de entrada y salida procesados durante la evaluación. Para las evaluaciones personalizadas que utilizan su propia infraestructura de LLM, paga por evaluación realizada, con costes de inferencia independientes según el modelo utilizado.

Detalles clave:

  • No se requieren compromisos iniciales ni cargos mínimos
  • Incluye integración de CI/CD con umbrales de calidad configurables
  • Supervisión de la producción con reglas de muestreo y agregación de paneles
  • Control de costes mediante muestreo porcentual, muestreo condicional y monitoreo métrico selectivo
  • Los costes de uso del modelo están incluidos para los evaluadores integrados, sin cargos por modelo por separado
  • Las evaluaciones personalizadas generan cargos adicionales por el uso del modelo en su cuenta

Tabla de precios

Service/Capability
Type
Resource
Price
Runtime

Basado en el consumo activo

Basado en el consumo activo

CPU

Memory

0,0895 USD por hora de CPU virtual

0,00945 USD por GB por hora

Herramienta Browser

Basado en el consumo activo

Basado en el consumo activo

CPU

Memory

0,0895 USD por hora de CPU virtual

0,00945 USD por GB por hora

Code Interpreter

Basado en el consumo activo

Basado en el consumo activo

CPU

Memory

0,0895 USD por hora de CPU virtual

0,00945 USD por GB por hora

Gateway

Basado en el consumo

Basado en el consumo

Basado en el consumo

Invocaciones de API (ListTools, InvokeTool, Ping)

API de búsqueda

Indexación de herramientas

0,005 USD por cada 1000 invocaciones

0,025 USD por cada 1000 invocaciones

0,02 USD por cada 100 herramientas indexadas al mes

Identity

Basado en el consumo

Solicitudes de claves de API o token para recursos que no son de AWS

0,010 USD por cada 1000 claves de API o token solicitadas por el agente

(Nota: AgentCore Identity está disponible sin costo adicional para los clientes cuando lo usan a través de AgentCore Runtime o AgentCore Gateway)

Memory

Basado en el consumo

Basado en el consumo

Basado en el consumo

Memoria a corto plazo

Almacenamiento de memoria a largo plazo

Recuperación de memoria a largo plazo

0,25 USD por cada 1000 eventos nuevos

Uso de estrategias de memoria integradas: 0,75 USD por cada 1000 registros de memoria almacenados al mes

Uso de estrategias de memoria integrada con anulación o autogestionada: 0,25 USD por cada 1000 registros de memoria almacenados al mes*

0,50 USD por cada 1000 recuperaciones de registros de memoria

Observability

Basado en el consumo





 

Intervalos, registros y métricas

Se cobra según los precios de Amazon CloudWatch

Evaluations (versión preliminar)

Basado en el consumo
 

Basado en el consumo
 

Evaluadores integrados
 

Evaluadores personalizados

0,0024 USD por 1000 tokens de entrada
0,012 USD por 1000 tokens de salida

1,50 USD por cada 1000 evaluaciones (los cargos por uso del modelo se facturan por separado)

Policy (versión preliminar)

Basado en el consumo

Basado en el consumo

Solicitud de autorización

Tokens de entrada procesados

0,000025 USD por solicitud de autorización

0,13 USD por 1000 tokens de entrada

*En el caso de las estrategias integradas con anulación y autogestión, puede incurrir en cargos adicionales por el uso del modelo en su cuenta

Ejemplos de precios

Runtime

Ejemplo: Implementación de un agente de atención al cliente

Planea implementar un agente de atención al cliente que resuelva las consultas de los usuarios a través del chat y el correo electrónico. El agente se encarga de problemas con los pedidos, la verificación de la cuenta y las aclaraciones de políticas. Utiliza la generación aumentada por recuperación (RAG) para obtener las políticas de los productos y herramientas compatibles con el protocolo de contexto de modelos (MCP), con el objetivo de consultar el estado de los pedidos y actualizar los tickets de asistencia. Cada sesión de agente implica un razonamiento sofisticado de varios pasos con 1 llamada RAG a un almacén de vectores, 2 llamadas a herramientas del MCP (por ejemplo, OrderAPI, TicketAPI) y 2 pasos de razonamiento de LLM. Ha implementado su agente en AgentCore Runtime porque necesita un aislamiento completo de la sesión y la flexibilidad de escalar a miles de sesiones en segundos.

Al procesar 10 millones de solicitudes de usuarios al mes, cada sesión dura 60 segundos con un 70 % de tiempo de espera de E/S (esperando las respuestas de LLM y las llamadas a la API) y no se ejecuta ningún otro proceso en segundo plano durante la E/S. Cada sesión de agente utiliza 1 vCPU durante el procesamiento activo. El uso de la memoria comienza en 1 GB durante la inicialización, aumenta a 2 GB durante el procesamiento RAG y alcanza un máximo de 2,5 GB durante las llamadas complejas a herramientas durante el resto de la sesión. Sus costes mensuales se desglosan de la siguiente manera:

Coste de CPU por sesión: 18 segundos (solo tiempo de procesamiento activo) × 1 vCPU × (0,0895/3600 USD) = 0,0004475 USD
Coste de memoria por sesión: 10 segundos × 1 GB × (0,00945/3600 USD) + 20 segundos × 2 GB × (0,00945/3600 USD) + 30 segundos × 2,5 GB × (0,00945/3600 USD) = 0,000026 USD + 0,000053 USD + 0,000197 USD = 0,000276 USD
Coste total por sesión: 0,0007235 USD

Total mensual: 10 millones de sesiones × 0,0007235 USD = 7,235 USD

Costes de almacenamiento: con la implementación basada en contenedores, usted administra el almacenamiento de ECR por separado en función de las tasas de ECR publicadas. Si, en su lugar, utilizara la implementación directa de código, se aplicarían los precios de S3 Standard (a partir del 27 de febrero de 2026) a sus artefactos de código; para un agente de 100 MB, esto supone un coste de almacenamiento de 0,0023 USD al mes.

Comparación con los precios preasignados: si esta carga de trabajo dependiera de un servicio que cobrara por los recursos preasignados, tendría que hacer provisiones para un uso máximo (2,5 GB de memoria, 1 vCPU) durante 60 segundos, lo que se traduciría en costes de CPU hasta 3,3 veces más altos y de memoria 1,4 veces mayores. En el ejemplo anterior, el ahorro de costes de CPU es significativo, dado que el consumo de CPU representó el 62 % del coste total de la carga de trabajo. Los precios de AgentCore Runtime basados en el consumo capturan automáticamente el beneficio de «la espera de E/S es gratuita» y solo cobra por el uso real de la memoria a medida que se amplía, lo que ofrece una rentabilidad sustancial en comparación con las opciones de procesamiento tradicionales.

Browser

Ejemplo: Sistema automatizado de reservas de viajes

Planea crear un agente para reservas de viajes que automatice el proceso completo de planificación y reserva del viaje a través de interacciones web. Su implementación requiere la versión ejecutable segura y sin servidor de AgentCore Browser para administrar de forma dinámica los navegadores sin interfaz, a fin de buscar vuelos y hoteles, simular clics, extraer precios y enviar formularios de reserva. La herramienta Browser de AgentCore ofrece capacidades de nivel empresarial que incluyen computación en entornos de pruebas aislados de sesiones y una observabilidad integral a través de Live View y Session Replay.

El agente procesa 100 000 solicitudes mensuales. Cada sesión del navegador dura 10 minutos con un tiempo de espera de E/S del 80%. Durante el procesamiento activo, utiliza 2 vCPU y 4 GB de memoria de forma continua, y durante la E/S utiliza 0,4 vCPU y 5 GB de memoria. Sus costes mensuales se desglosan de la siguiente manera:

Costo de CPU por sesión: 120 segundos (ajustado para tener en cuenta el 80 % del tiempo de espera de E/S) × 2 vCPU × (0,0895 USD/3600) = 0,005967 USD
Costo de memoria por sesión: 600 segundos × 4 GB × (0,00945/3600 USD) = 0,0063 USD
Costo total por sesión: 0,012267 USD
Total mensual: 100 000 sesiones × 0,012267 USD = 1226,67 USD

Code Interpreter

Ejemplo: Automatización del análisis de datos en lenguaje natural

Planea implementar un agente de análisis de datos que ayude a los equipos empresariales y de productos a realizar consultas de conjuntos de datos, visualizaciones y análisis estadísticos, todo ello a través de lenguaje natural. Su agente genera y ejecuta código Python de forma dinámica para solicitudes complejas, como el análisis de correlación entre el tráfico del sitio y las tasas de conversión. Utiliza Code Interpreter AgentCore porque proporciona entornos de pruebas aislados que cumplen con las políticas de seguridad empresarial, versiones ejecutables prediseñadas para varios lenguajes (JavaScript, TypeScript, Python) y compatibilidad con archivos de gran tamaño.

El agente procesa 10 000 solicitudes mensuales con 3 ejecuciones de código por solicitud. Cada ejecución dura 2 minutos con un tiempo de espera de E/S del 60 %, y se utilizan 2 vCPU durante el procesamiento activo y 4 GB de memoria de forma continua. Sus costos mensuales se desglosan de la siguiente manera:

Costo de CPU por sesión: 48 segundos (ajustado para tener en cuenta el 60 % del tiempo de espera de E/S) × 2 vCPU × (0,0895 USD/3600) = 0,002387 USD
Costo de memoria por sesión: 120 segundos × 4 GB × (0,00945/3600 USD) = 0,00126 USD
Costo total por sesión: 0,003647 USD
Total mensual: 30 000 ejecuciones × 0,003647 USD = 109,40 USD

Gateway

Ejemplo: Conexión de un agente asistente para Recursos Humanos con herramientas internas

Planea crear un agente asistente para el departamento de Recursos Humanos de una empresa de tamaño mediano, que se encargue de cuestiones sobre políticas internas, saldos de días libres, inscripción en beneficios consultas y sobre nóminas. Para atender las solicitudes de los usuarios, el agente debe acceder a varios sistemas internos (las API de incorporación, beneficios, salarios y gestión de ausencias) como a herramientas. Utilizó AgentCore Gateway para crear servidores MCP para 200 herramientas internas con las que su agente puede interactuar desde cualquier lugar, sin escribir ningún código. A fin de mejorar la precisión en el uso de las herramientas, ha utilizado la capacidad de búsqueda para indexar los metadatos de las herramientas y la coincidencia dinámica de las herramientas durante la invocación del agente en función del contexto de interacción.

Cada interacción del agente requiere 1 invocación a la API de búsqueda y 4 a la API de InvokeTool. 50 millones de interacciones mensuales dan como resultado 50 millones de llamadas de búsqueda y 200 millones de llamadas de InvokeTool. Sus costos mensuales se desglosan de la siguiente manera:

Cargos de SearchToolIndex: 200 herramientas × 0,02 USD por cada 100 herramientas = 0,04 USD
Cargos de la API de búsqueda: 50 millones × 25 USD por cada millón = 1250 USD
Cargos de la API de InvokeTool: 200 millones × 5 USD por cada millón = 1000 USD
Total mensual: 2250,04 USD

Policy (versión preliminar)

Ejemplo:

Planea desarrollar un agente de automatización de compras que ayude a los equipos de operaciones a gestionar la selección de proveedores, la creación de órdenes de compra y la aprobación de facturas. Para garantizar que las acciones sigan las reglas empresariales definidas, utiliza las herramientas Policy con AgentCore Gateway para verificar automáticamente cada acción antes de que se ejecute en función de las políticas definidas. Cada vez que el agente intenta realizar una acción (por ejemplo, enviar una aprobación de compra o iniciar un pago), Gateway intercepta la llamada a la herramienta para comprobar si la acción está permitida o se deniega. Supongamos que el agente atiende 100 000 sesiones en un mes y, en promedio, realiza 5 llamadas a herramientas en cada sesión. Si implementa una solicitud de autorización para cada llamada a la herramienta, realiza 500 000 solicitudes de autorización al mes con un desglose de costes de la siguiente manera:


Solicitudes de autorización = 100 000 sesiones x 5 llamadas a herramientas por sesión x 1 política aplicada/llamada a herramienta = 500 000 solicitudes de autorización
Total mensual: 500 000 solicitudes x 0,000025 = 12,50 USD


Antes de la implementación, su equipo utiliza opcionalmente la creación de políticas en lenguaje natural para simplificar la incorporación y la configuración de políticas. En lugar de escribir las políticas de Cedar manualmente, describen las reglas en un lenguaje sencillo y AgentCore las convierte en declaraciones de políticas de Cedar. Se le cobrará una tarifa única basada en la cantidad de tokens de entrada de usuario procesados durante este paso de creación. Si su equipo utilizara 10 000 tokens para crear varias políticas, sus costes serían los siguientes:

Creación de políticas = 20 000 fichas × 0,13 USD por cada 1000 fichas de entrada = 2,60 USD

Nota: Se aplican las tarifas estándar de CloudWatch si Observability está habilitada.

Identity

Ejemplo: Administración segura del acceso al servicio de atención al cliente

Planea tener un agente de atención al cliente que ayude a los equipos técnicos a acceder a varias herramientas: Slack para las conversaciones de asistencia, Zoom para buscar los registros de llamadas y GitHub para el seguimiento de problemas y los registros de confirmaciones. Su implementación usa AgentCore Identity para un acceso delegado y seguro para los usuarios o ingenieros de asistencia. El sistema es compatible con los proveedores de identidad existentes (por ejemplo, Amazon Cognito, Okta, Microsoft Entra ID, Amazon Cognito) y administra todos los métodos de autenticación, desde los tokens de OAuth hasta las claves de la API, lo que elimina la necesidad de contar con una infraestructura de seguridad personalizada. 

Supongamos que 10 000 usuarios activos al mes utilizan el agente con un promedio de 5 interacciones cada uno, lo que requiere 3 accesos a la herramienta por sesión para cada usuario al mes. En ese caso, sus costes mensuales se desglosarían de la siguiente manera:

Total de tokens solicitados: 10 000 usuarios × 5 sesiones × 3 herramientas = 150 000 tokens
Total mensual: 150 000 solicitudes × 0,010 USD por cada 1000 solicitudes = 1,50 USD

Nota: AgentCore Identity se incluye sin coste adicional al usar AgentCore Runtime o Gateway.

Memory

Ejemplo: Implementación de un agente asistente de codificación personalizado

Planea desarrollar un agente asistente de codificación que ayude a los ingenieros de software a escribir, depurar y refactorizar código en IDE y terminales. Para ofrecer una experiencia personalizada, el agente debe mantener el contexto durante una sesión y recordar las preferencias del usuario a lo largo de varias sesiones. Su implementación usa AgentCore Memory para equipar al agente con memoria a corto plazo (conversaciones y eventos inmediatos) y memoria a largo plazo (conocimiento persistente entre sesiones).

Cada vez que un usuario interactúa con el agente (por ejemplo, al enviar un fragmento de código o hacer una pregunta de codificación), usted envía un evento a AgentCore Memory para almacenarlo como memoria a corto plazo. En el caso de la memoria a largo plazo, configuró estrategias de extracción integradas para extraer y almacenar de manera automática el resumen de las sesiones de depuración y las preferencias de los usuarios entre sesiones. A continuación, el agente puede recuperar estas memorias a largo plazo para ofrecer una experiencia personalizada a los desarrolladores.

Con 100 000 eventos mensuales de memoria a corto plazo, 10 000 registros de memoria almacenados a largo plazo y 20 000 llamadas de recuperación de registros de memoria mensuales, sus costes se desglosarían de la siguiente manera:

Memoria a corto plazo: 100 000 eventos × 0,25 USD por cada 1000 eventos = 25 USD
Almacenamiento de memoria a largo plazo:10 000 memorias × 0,75 USD por cada 1000 memorias = 7,50 USD
Recuperación de memoria a largo plazo: 20 000 recuperaciones × 0,50 USD por cada 1000 recuperaciones = 10 USD
Total mensual: 42,50 USD

Nota: Con estrategias de extracción de anulación integradas, el coste del almacenamiento a largo plazo sería inferior, de 0,25 USD por cada 1000 memorias almacenadas. Sin embargo, puede incurrir en cargos adicionales por el uso del modelo en su cuenta.

Observability

Ejemplo: Plataforma de asesoramiento financiero multiagente

Planea implementar una plataforma integral de asesoramiento financiero con varios agentes especializados que se encarguen de la investigación de inversiones, el análisis de carteras y las comprobaciones de cumplimiento normativo. Cada agente lleva a cabo un razonamiento complejo de varios pasos con consultas de bases de datos y búsquedas en la web, llamadas a la API a proveedores de datos financieros y análisis de documentos. La plataforma procesa millones de transacciones y genera una gran cantidad de datos de telemetría, incluidos seguimientos, métricas y registros de todas las interacciones de los agentes. Utiliza AgentCore Observability para supervisar el rendimiento, solucionar problemas y garantizar el cumplimiento de las normas financieras mediante pistas de auditoría exhaustivas.

Su plataforma genera 10 TB de datos de observabilidad al mes a partir de las interacciones de los agentes, las llamadas a la API y los eventos del sistema. Suponiendo que el 30 % de los intervalos son registros de eventos (invocación del modelo, llamada a la herramienta), se escriben aproximadamente 6 TB (suponiendo 2 KB de datos de registro por evento de intervalo) en los registros estándar de CloudWatch. Sus costes mensuales se desglosan de la siguiente manera:

Cargos mensuales por consumo de espacio: 10 TB × 1000 GB/TB × 0,35 USD por GB = 3500 USD
Cargos mensuales por registro de eventos: 6 TB × 1000 GB/TB × 0,50 USD por GB = 3000 USD
Total mensual: 3500 USD + 3000 USD = 6500 USD

* Se aplicarán las tarifas estándar de CloudWatch a todas las métricas y datos de registro no telemétricos (estándar) que se envíen a CloudWatch.

Evaluations (versión preliminar)

Ejemplo: Supervisión de la calidad de los agentes de servicio al cliente de comercio electrónico

Planea implementar un agente de servicio al cliente que se encargue de las consultas de pedidos, el procesamiento de devoluciones y las recomendaciones de productos para una plataforma de comercio electrónico. Para garantizar una calidad de servicio uniforme, utiliza las evaluaciones de AgentCore para supervisar el rendimiento de los agentes en los entornos de desarrollo y producción. Su implementación utiliza 3 evaluadores a nivel de seguimiento integrados (corrección, utilidad y tasa de éxito de los objetivos) más 1 evaluador personalizado para las métricas de calidad específicas de la empresa.

Durante el desarrollo, su canal de CI/CD evalúa 5000 interacciones de prueba al mes. En producción, supervisa el 2 % de las interacciones en vivo mediante reglas de muestreo y evalúa 10 000 conversaciones con los clientes al mes. Cada evaluación integrada procesa un promedio de 15 000 tokens de entrada (incluido el historial de conversaciones, los catálogos de productos y los detalles de los pedidos) y genera 300 tokens de salida para la puntuación.

Sus costes mensuales se desglosan de la siguiente manera:
Evaluadores integrados:

  • Total de interacciones evaluadas: 15 000 (5000 de desarrollo + 10 000 de producción)
  • Evaluadores integrados por interacción: 3 (corrección, utilidad, tasa de éxito de los objetivos)
  • Evaluación total: 15 000 interacciones × 3 evaluadores = 45 000 evaluaciones
  • Tokens de entrada: 45 000 evaluaciones × 15 000 tokens = 675 millones de tokens
  • Tokens de salida: 45 000 evaluaciones × 300 tokens = 13,5 millones de tokens
  • Coste de entrada: 675 millones de tokens × 2,40 USD/1 millón = 1.620 USD
  • Coste de producción: 13,5 millones de tokens × 12,00 USD/1 millón = 162 USD
  • Subtotal de evaluadores incorporados: 1782 USD

Evaluaciones personalizadas:

  • Total de evaluaciones personalizadas: 15 000 interacciones × 1 evaluador personalizado = 15 000 evaluaciones
  • Coste de evaluación personalizada: 15 000 evaluaciones × 1,50 USD = 22,50 USD

Total mensual: 1804,5 USD

Nota: Los costes de uso del modelo están incluidos para los evaluadores integrados. Las evaluaciones personalizadas conllevan cargos adicionales por el uso del modelo en su cuenta.

I want to

¿Ha encontrado lo que buscaba hoy?

Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios