- Amazon Bedrock›
- AgentCore›
- Preços
Preços do Amazon Bedrock AgentCore
Adapte o AgentCore às suas necessidades: combine serviços, use-os de maneira independente ou em conjunto e pague pelo que usar à medida que suas iniciativas de IA forem crescendo.
Pague somente pelo que usar
O Amazon Bedrock AgentCore oferece preços flexíveis, baseados no consumo, sem compromissos iniciais ou taxas mínimas. Cada serviço e recurso — Runtime, Gateway, Política (prévia), Identity, Memory, Observability, Avaliações (prévia), Navegador e Interpretador de Código — pode ser usado de forma independente ou em conjunto, e você paga somente pelo que usa. Com essa abordagem modular, você pode começar com pouco e escalar à medida que suas aplicações de agentes aumentam.
Comece a usar o AgentCore sem nenhum custo: novos clientes da AWS recebem até USD 200 em créditos de nível gratuito. Explore os benefícios do nível gratuito da AWS e comece a criar hoje mesmo.
Observação: a Política nas Avaliações do AgentCore e no AgentCore é oferecida gratuitamente na versão prévia.
Serviços e capacidades do AgentCore
Runtime
O AgentCore Runtime é um runtime seguro e com tecnologia sem servidor, desenvolvido especificamente para implantar e escalar agentes e ferramentas. Escolha entre a implantação de código direto para rápida iteração ou a implantação baseada em contêiner para obter o máximo controle.
Você paga apenas pelos recursos ativos que consome
Ao contrário dos serviços de computação tradicionais que cobram por recursos pré-alocados (ou seja, tamanho fixo da instância e custo por segundo enquanto hospedam o agente), você paga apenas pelo consumo ativo de recursos com o AgentCore Runtime. Isso proporciona uma economia substancial de custos para workloads agênticas, que normalmente passam de 30 a 70% do tempo em espera de E/S (aguardando respostas do LLM, chamadas de ferramentas/API ou consultas ao banco de dados). Com preços pré-alocados, você pagaria pela CPU ociosa durante esses períodos de espera. Com o preço baseado no consumo de recursos ativos no AgentCore Runtime, a espera de E/S e o tempo de inatividade são gratuitos, se nenhum outro processo em segundo plano estiver em execução.
O faturamento é baseado no consumo de CPU e memória durante a vida útil da sessão, calculado em incrementos por segundo. Para recursos de CPU, a cobrança é feita com base no consumo real. Se seu agente não consumir CPU durante a espera de E/S, não haverá cobranças de CPU. Para recursos de memória, a cobrança é feita pelo pico de memória consumido até aquele segundo.
Detalhes importantes:
- Não requer a seleção prévia de recursos
- O faturamento é calculado por segundo, usando o consumo real da CPU e o pico de memória consumido até esse segundo, com um mínimo de 1 segundo
- Você paga apenas pelo consumo real de recursos durante sua sessão, que abrange desde o início da microVM, a inicialização, o processamento ativo, os períodos de inatividade até o término da sessão (desligamento da microVM)
- O faturamento inclui a sobrecarga do sistema, além do uso de recursos da sua aplicação
- A cobrança mínima de memória de 128 MB se aplica à memória
- Custos de armazenamento: a implantação de contêineres exige armazenamento ECR (cobrado separadamente). A implantação de código direto resultará em cobranças pelo tamanho dos artefatos de código que você implantou de acordo com as taxas do S3 Standard, a partir de 27 de fevereiro de 2026.
- As taxas de transferência de dados de rede se aplicam às taxas padrão do EC2
Navegador
O Navegador do AgentCore fornece um runtime de navegador rápido, seguro e baseado em nuvem para permitir que agentes interajam com sites em grande escala.
Você paga apenas pelos recursos ativos que consome
Ao contrário dos serviços de computação tradicionais que cobram por recursos pré-alocados (ou seja, tamanho fixo da instância e custo por segundo enquanto hospedam o agente), você paga apenas pelo consumo ativo de recursos com o Navegador do AgentCore. Isso proporciona uma economia substancial de custos para workloads agênticas, que normalmente passam de 30 a 70% do tempo em espera de E/S (aguardando respostas do LLM, chamadas de ferramentas/API ou consultas ao banco de dados). Com preços pré-alocados, você pagaria pela CPU ociosa durante esses períodos de espera. Com o preço baseado no consumo de recursos ativos no Navegador do AgentCore, a espera de E/S e o tempo de inatividade são gratuitos, se nenhum outro processo em segundo plano estiver em execução.
O faturamento é baseado no consumo de CPU e memória durante a vida útil da sessão, calculado em incrementos por segundo. Para recursos de CPU, a cobrança é feita com base no consumo real. Se seu agente não consumir CPU durante a espera de E/S, não haverá cobranças de CPU. Para recursos de memória, a cobrança é feita pelo pico de memória consumido até aquele segundo.
Detalhes importantes:
- Não requer a seleção prévia de recursos
- O faturamento é calculado por segundo, usando o consumo real da CPU e o pico de memória consumido até esse segundo, com um mínimo de 1 segundo
- Você paga apenas pelo consumo real de recursos durante sua sessão, que abrange desde o início da microVM, a inicialização, o processamento ativo, os períodos de inatividade até o término da sessão (desligamento da microVM)
- O faturamento inclui a sobrecarga do sistema, além do uso de recursos da sua aplicação
- A cobrança mínima de memória de 128 MB se aplica à memória
- As taxas de transferência de dados de rede se aplicam às taxas padrão do EC2
Interpretador de Código
O Interpretador de Código do AgentCore permite que os agentes executem códigos com segurança em ambientes de sandbox, aprimorando sua precisão e expandindo sua capacidade de resolver tarefas complexas de ponta a ponta.
Você paga apenas pelos recursos ativos que consome
Ao contrário dos serviços de computação tradicionais que cobram por recursos pré-alocados (ou seja, tamanho fixo da instância e custo por segundo enquanto hospedam o agente), você paga apenas pelo consumo ativo de recursos com o Interpretador de Código do AgentCore. Isso proporciona uma economia substancial de custos para workloads agênticas, que normalmente passam de 30 a 70% do tempo em espera de E/S (aguardando respostas do LLM, chamadas de ferramentas/API ou consultas ao banco de dados). Com preços pré-alocados, você pagaria pela CPU ociosa durante esses períodos de espera. Com o preço baseado no consumo de recursos ativos no Interpretador de Código do AgentCore, a espera de E/S e o tempo de inatividade são gratuitos, se nenhum outro processo em segundo plano estiver em execução.
O faturamento é baseado no consumo de CPU e memória durante a vida útil da sessão, calculado em incrementos por segundo. Para recursos de CPU, a cobrança é feita com base no consumo real. Se seu agente não consumir CPU durante a espera de E/S, não haverá cobranças de CPU. Para recursos de memória, a cobrança é feita pelo pico de memória consumido até aquele segundo.
Detalhes importantes:
- Não requer a seleção prévia de recursos
- O faturamento é calculado por segundo, usando o consumo real da CPU e o pico de memória consumido até esse segundo, com um mínimo de 1 segundo
- Você paga apenas pelo consumo real de recursos durante sua sessão, que abrange desde o início da microVM, a inicialização, o processamento ativo, os períodos de inatividade até o término da sessão (desligamento da microVM)
- O faturamento inclui a sobrecarga do sistema, além do uso de recursos da sua aplicação
- A cobrança mínima de memória de 128 MB se aplica à memória
- As taxas de transferência de dados de rede se aplicam às taxas padrão do EC2
Gateway
O Amazon Bedrock AgentCore Gateway permite que os agentes acessem ferramentas com segurança transformando APIs e funções do Lambda em ferramentas compatíveis com agentes e conectando-se aos servidores MCP existentes.
Preços com base no consumo
Você paga somente pelas chamadas de API que seus agentes fazem por meio do Gateway. A cobrança é feita com base no número de operações de MCP (como ListTools, CallTool e Ping), consultas de pesquisa e ferramentas indexadas para a funcionalidade de pesquisa semântica.
Detalhes importantes:
- Sem custos iniciais ou compromissos mínimos necessários
- As taxas de transferência de dados de rede se aplicam às taxas padrão do EC2
Política (Prévia)
A Política no Amazon Bedrock AgentCore oferece controle abrangente sobre as ações tomadas pelos agentes, ajudando a garantir que eles permaneçam dentro dos limites definidos sem diminuir a velocidade.
Preços com base no consumo
Você paga somente pelas solicitações de autorização realizadas durante a execução do agente. Sempre que um agente chama uma ferramenta por meio do AgentCore Gateway, a política verifica a ação em relação às suas regras para determinar se ela é permitida ou negada.
Além disso, a política oferece criação de políticas em linguagem natural, o que permite criar políticas de Cedar usando descrições simples em linguagem natural. A cobrança é feita por 1.000 tokens de entrada de usuário processados ao converter linguagem natural em declarações de política da Cedar.
Identity
O AgentCore Identity simplifica o gerenciamento de identidade e acesso dos agentes e permite que eles acessem com segurança os recursos da AWS e ferramentas e serviços de terceiros em nome dos usuários ou sozinhos, com o consentimento pré-autorizado do usuário.
Preços baseados no consumo
Clientes que usam o AgentCore Identity por meio do AgentCore Runtime ou do AgentCore Gateway não incorrem em nenhuma cobrança adicional pelo uso do AgentCore Identity. Para todos os outros cenários, você paga somente pelo que usa e é cobrado com base no número de solicitações do agente à AgentCore Identity para obter um token OAuth ou uma chave de API.
Detalhes principais:
- Não há taxas mínimas nem compromissos antecipados.
- O faturamento é calculado por token OAuth ou chave de API bem-sucedida solicitada para realizar uma tarefa que exige autorização para um recurso que não seja da AWS
- Não há cobranças adicionais quando os clientes usam o AgentCore Identity por meio do AgentCore Runtime ou do AgentCore Gateway
Memory
O AgentCore Memory facilita para os desenvolvedores a criação de agentes sensíveis ao contexto, eliminando o gerenciamento complexo da infraestrutura de memória e fornecendo controle total sobre o que o agente lembra.
Preços com base no consumo
Pague somente pelo que usar. Nossos preços são simples e baseados no uso, alinhando-se diretamente com a forma como seus agentes criam valor:
- O preço da memória de curto prazo é baseado no número de eventos brutos criados, oferecendo custos previsíveis para o contexto da sessão.
- O preço dos registros de memória de longo prazo é baseado no número de memórias processadas e armazenadas a cada mês e no número de chamadas de recuperação de registros de memória; portanto, você paga somente quando seus agentes armazenam e usam o conhecimento processado.
- Para extrair memória de longo prazo de eventos brutos, você pode escolher entre estratégias de memória incorporadas, que incluem processamento automático, ou estratégias de memória mais configuráveis que são executadas em sua conta usando o modelo e o prompt de sua escolha.
Detalhes importantes:
- Não requer a seleção prévia de recursos
- Para memória de curto prazo, o faturamento é calculado por solicitação de criação de evento
- Para armazenamento de memória de longo prazo, o faturamento é calculado por registro de memória armazenada por dia e calculado em média ao longo do mês
- Para recuperação de memória de longo prazo, o faturamento é calculado por solicitação de recuperação de memória
Observability
O AgentCore Observability oferece aos desenvolvedores visibilidade completa dos fluxos de trabalho dos agentes para rastrear, depurar e monitorar o desempenho dos agentes em ambientes de produção.
Preços baseados no consumo
Você paga conforme o uso pela telemetria gerada, armazenada e consultada para seus agentes. Os dados de telemetria são ingeridos e armazenados em sua conta do Amazon CloudWatch. A cobrança é feita pela ingestão e armazenamento de dados, pelas consultas para recuperar e analisar informações e pelo mascaramento de dados confidenciais/de informações de identificação pessoal (PII) nos logs. Para conferir os detalhes de preços, acesse a página de preços do Amazon CloudWatch.
Avaliações (prévia)
O AgentCore Evaluations ajuda a inspecionar continuamente a qualidade do agente com base no comportamento do mundo real. As equipes podem realizar avaliações de agentes usando 13 avaliadores integrados em dimensões de qualidade comuns ou criar avaliadores personalizados para requisitos comerciais específicos. Os resultados são integrados ao AgentCore Observability com tecnologia do pelo Amazon CloudWatch para monitoramento unificado.
Preços baseados no consumo
Você paga pelo que usar. Para avaliadores integrados, o preço é cobrado pelo AgentCore com base nos tokens de entrada e saída processados durante a avaliação. Para avaliações personalizadas usando sua própria infraestrutura LLM, você paga por avaliação realizada, com custos de inferência separados com base no modelo usado.
Detalhes importantes:
- Sem compromissos iniciais ou taxas mínimas exigidas
- Inclui integração de CI/CD com limites de qualidade configuráveis
- Monitoramento da produção com regras de amostragem e agregação de painéis
- Controle de custos por meio de amostragem baseada em porcentagem, amostragem condicional e monitoramento seletivo de métricas
- Os custos de uso do modelo estão incluídos para avaliadores integrados, sem cobranças extras do modelo
- As avaliações personalizadas geram cobranças adicionais de uso do modelo em sua conta
Tabela de preços
|
Service/Capability
|
Type
|
Resource
|
Price
|
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Runtime
|
|
|
|
|||||||||
|
Ferramenta Navegador
|
|
|
|
|||||||||
|
Interpretador de Código
|
|
|
|
|||||||||
|
Gateway
|
|
|
|
|||||||||
|
Identidade
|
Baseado no consumo |
Solicitações de token ou chave de API para recursos que não são da AWS |
USD 0,010 por 1.000 tokens ou chaves de API solicitadas pelo agente (Observação: o AgentCore Identity está disponível sem custo adicional para os clientes quando eles o usam por meio do AgentCore Runtime ou do AgentCore Gateway) |
|||||||||
|
Memória
|
|
|
|
|||||||||
|
Observability
|
Baseado no consumo
|
Abrangência, logs e métricas
|
Cobrado de acordo com os preços do Amazon CloudWatch |
|||||||||
|
Avaliações (prévia)
|
|
|
|
|||||||||
|
Política (Prévia)
|
|
|
|
*Para estratégias integradas com substituição e autogerenciadas, você pode incorrer em cobranças adicionais pelo uso do modelo em sua conta
Exemplos de preço
Runtime
Exemplo: implantação do agente de suporte ao cliente
Você planeja implantar um agente de suporte ao cliente que resolva as dúvidas dos usuários por chat e e-mail. O agente lida com problemas de pedidos, verificação de contas e esclarecimentos de políticas. Ele usa geração aumentada de recuperação (RAG) para buscar políticas de produtos e ferramentas compatíveis com o Model Context Protocol (MCP) para consultar o status do pedido e atualizar os tíquetes de suporte. Cada sessão do agente envolve um raciocínio sofisticado de várias etapas com 1 chamada RAG para um armazenamento vetorial, 2 chamadas de ferramentas MCP (por exemplo, OrderAPI, TicketAPI) e 2 etapas de raciocínio LLM. Você implantou seu agente no AgentCore Runtime porque precisa de isolamento completo da sessão e da flexibilidade de escalar para milhares de sessões em segundos.
Processando 10 milhões de solicitações de usuários mensalmente, cada sessão é executada por 60 segundos com 70% de tempo de espera de E/S (aguardando respostas do LLM e chamadas de API), e nenhum outro processo em segundo plano é executado durante a E/S. Cada sessão do agente utiliza 1vCPU durante o processamento ativo. O uso da memória começa em 1 GB durante a inicialização, aumenta para 2 GB durante o processamento RAG e atinge o pico de 2.5 GB durante chamadas de ferramentas complexas durante o restante da sessão. Seus custos mensais são divididos da seguinte forma:
Custo de CPU por sessão: 18 segundos (somente tempo de processamento ativo) × 1vCPU × (USD 0,0895/3600) = USD 0,0004475
Custo de memória por sessão: 10 segundos × 1 GB × (USD 0,00945/3600) + 20 segundos × 2 GB × (USD 0,00945/3600) + 30 segundos × 2.5 GB × (USD 0,00945/3600) = USD 0,000026 + USD 0,000053 + USD 0,000197 = USD 0,000276
Custo total por sessão:USD 0,0007235
Total mensal: 10 milhões de sessões × USD 0,0007235 = USD 7.235
Custos de armazenamento: com a implantação baseada em contêiner, você gerencia o armazenamento de ECR separadamente com base nas taxas de ECR publicadas. Se, em vez disso, você usasse a implantação direta de código, os preços do S3 Standard (a partir de 27 de fevereiro de 2026) se aplicariam aos seus artefatos de código. Para um agente de 100 MB, isso representa USD 0,0023 por mês em custos de armazenamento.
Comparação com preços pré-alocados: se essa workload fosse executada com um serviço cobrando por recursos pré-alocados, você precisaria provisionar o pico de uso (2.5 GB de memória, 1 vCPU) por toda a duração de 60 segundos, resultando em custos de CPU até 3,3 vezes maiores e custos de memória até 1,4 vezes maiores. No exemplo acima, a economia de custos de CPU é significativa, uma vez que o consumo de CPU representou 62% do custo total da workload. Os preços baseados no consumo do AgentCore Runtime capturam automaticamente o benefício de a espera de E/S ser gratuita e cobra apenas pelo uso real da memória à medida que aumenta a escala verticalmente, oferecendo uma economia substancial em comparação com as opções de computação tradicionais.
Navegador
Exemplo: sistema automatizado de reserva de viagens
Você planeja criar um agente de reserva de viagens que automatize o planejamento e a reserva completos de viagens por meio de interações na web. Sua implementação requer runtime seguro e com tecnologia sem servidor do Navegador do AgentCore para gerenciar dinamicamente os navegadores sem periféricos/sem interface gráfica para pesquisar voos, hotéis, simular cliques, extrair preços e enviar formulários de reserva. A ferramenta AgentCore Browser fornece recursos de nível corporativo, incluindo computação em sandbox isolada por sessão e observabilidade abrangente por meio do Live View e do Session Replay.
O agente processa 100 mil solicitações mensais. Cada sessão do navegador é executada por 10 minutos com 80% de tempo de espera de E/S. Durante o processamento ativo, ele utiliza 2 vCPUs e 4 GB de memória continuamente e, durante a E/S, utiliza 0.4 vCPU e 5 GB de memória. Seus custos mensais são divididos da seguinte forma:
Custo de CPU por sessão: 120 segundos (ajuste para 80% de espera de E/S) × 2 vCPUs × (USD 0,0895/3600) = USD 0,005967
Custo de memória por sessão: 600 segundos × 4 GB × (USD 0,00945/3600) = USD 0,0063
Custo total por sessão: USD 0,012267
Total mensal: 100 mil sessões × 0,012267 USD = USD 1.226,67
Intérprete de código
Exemplo: Automação de análise de dados em linguagem natural
Você planeja implantar um agente analista de dados que ofereça suporte às equipes de negócios e produtos com consultas de conjuntos de dados, visualizações e análises estatísticas, tudo por meio de linguagem natural. Seu agente gera e executa dinamicamente o código Python para solicitações complexas, como análise de correlação entre o tráfego do site e as taxas de conversão. Você aproveita o AgentCore Code Interpreter porque ele fornece ambientes de sandbox isolados compatíveis com políticas de segurança corporativa, tempos de execução predefinidos para várias linguagens (JavaScript, TypeScript, Python) e suporte para arquivos grandes.
O agente processa 10 mil solicitações mensais com 3 execuções de código por solicitação. Cada execução é executada por 2 minutos com 60% de tempo de espera de E/S, utilizando 2 vCPUs durante o processamento ativo e 4 GB de memória continuamente. Seus custos mensais são divididos da seguinte forma:
Custo de CPU por sessão: 48 segundos (ajuste para 60% de espera de E/S) × 2 vCPUs × (USD 0,0895/3600) = USD 0,002387
Custo de memória por sessão: 120 segundos × 4 GB × (USD 0,00945/3600) = USD 0,00126
Custo total por sessão:USD 0,003647
Total mensal: 30 mil execuções × 0,003647 USD = 109,40 USD
Gateway
Exemplo: conectar o agente do HR Assistant às ferramentas internas
Você planeja criar um agente assistente de RH para uma empresa de médio porte, lidando com questões políticas internas, saldos de licenças, inscrição em benefícios e consultas sobre folha de pagamento. Para atender às solicitações do usuário, o agente precisa acessar vários sistemas internos (APIs de integração, benefícios, folha de pagamento e gerenciamento de licenças) como ferramentas. Você usou o AgentCore Gateway para criar servidores MCP para 200 ferramentas internas com as quais seu agente pode interagir de qualquer lugar, tudo sem escrever nenhum código. Para melhorar a precisão do uso da ferramenta, você aproveitou o recurso de pesquisa para indexar os metadados da ferramenta e permitir a correspondência dinâmica de ferramentas durante a invocação do agente com base no contexto da interação.
Cada interação com o agente exige 1 API de pesquisa e 4 invocações da API InvokeTool. 50 milhões de interações mensais resultam em 50 milhões de pesquisas e 200 milhões de chamadas do InvokeTool. Seus custos mensais são divididos da seguinte forma:
Cobrança do SearchToolIndex: 200 ferramentas × USD 0,02 por 100 ferramentas = USD 0,04
Cobranças da API de pesquisa: 50 milhões × USD 25/milhão = USD 1.250
Cobranças da API InvokeTool: 200 milhões × USD 5/milhão = USD 1.000
Total mensal: USD 2.250,04
Política (Prévia)
Exemplo:
Você planeja desenvolver um agente de automação de compras que ajude as equipes de operações a gerenciar a seleção de fornecedores, a criação de pedidos de compra e as aprovações de faturas. Para garantir que as ações sigam as regras de negócios definidas, você usa as ferramentas de Política com o AgentCore Gateway para verificar automaticamente cada ação antes que ela seja executada em relação às políticas definidas. Sempre que o agente tenta realizar uma ação (por exemplo, enviar a aprovação da compra ou iniciar um pagamento), o Gateway intercepta a chamada da ferramenta para verificar se a ação é permitida ou negada. Vamos supor que o agente atenda a 100 mil sessões em um mês e faça, em média, 5 chamadas de ferramentas em cada sessão. Se você implementar uma solicitação de autorização para cada chamada de ferramenta, fará 500 mil solicitações de autorização por mês com uma divisão de custos da seguinte forma:
Solicitações de autorização = 100 mil sessões x 5 chamadas de ferramenta/sessão x 1 política aplicada/chamada de ferramenta = 500 mil solicitações de autorização
Total mensal: 500 mil solicitações x 0,000025 = USD 12,50
Antes da implantação, sua equipe pode usar a criação de políticas em linguagem natural para simplificar a integração e a configuração de políticas. Em vez de escrever as políticas do Cedar manualmente, ela descreve as regras em linguagem simples e o AgentCore as converte em declarações de políticas do Cedar. É cobrada uma taxa única com base no número de tokens de entrada do usuário processados durante essa etapa de criação. Se sua equipe usasse 10.000 tokens para criar várias políticas, seus custos seriam:
Criação de políticas = 20 mil tokens × USD 0,13 por 1.000 tokens de entrada = USD 2,60
Observação: as taxas padrão do CloudWatch se aplicam se o Observability estiver ativado.
Identidade
Exemplo: gerenciamento seguro de acesso ao suporte ao cliente
Você planeja operar um agente de suporte ao cliente que auxilia as equipes técnicas acessando várias ferramentas: Slack para conversas de suporte, Zoom para buscar logs de chamadas e GitHub para rastreamento de problemas e logs de confirmação. Sua implementação usa o AgentCore Identity para acesso seguro e delegado para usuários ou engenheiros de suporte. O sistema é compatível com os provedores de identidade existentes (por exemplo, Amazon Cognito, Okta, Microsoft Entra ID) e gerencia todos os métodos de autenticação, desde tokens OAuth até chaves de API, eliminando a necessidade de uma infraestrutura de segurança personalizada.
Vamos supor que o agente esteja sendo usado por 10 mil usuários ativos mensais, com média de 5 interações cada, exigindo 3 acessos à ferramenta por sessão para cada usuário por mês. Seus custos mensais são divididos da seguinte forma:
Total de tokens solicitados: 10 mil usuários × 5 sessões × 3 ferramentas = 150 mil tokens
Total mensal: 150 mil solicitações × 0,010/1.000 USD = 1,50 USD
Observação: o AgentCore Identity é incluído sem custo adicional ao usar o AgentCore Runtime ou o Gateway.
Memory
Exemplo: implementação personalizada do agente assistente de codificação
Você planeja desenvolver um agente assistente de codificação que ajude os engenheiros de software a escrever, depurar e refatorar códigos em IDEs e terminais. Para oferecer uma experiência personalizada, o agente precisa manter o contexto durante uma sessão e lembrar as preferências do usuário em várias sessões. Sua implementação usa a memória AgentCore para equipar o agente com memória de curto prazo (conversas e eventos imediatos) e memória de longo prazo (conhecimento persistente em todas as sessões).
Cada vez que um usuário interage com o agente (por exemplo, enviando um trecho de código ou fazendo uma pergunta de codificação), você envia um evento à Memória AgentCore para armazená-lo como memória de curto prazo. Para memória de longo prazo, você configurou estratégias de extração integradas para extrair e armazenar automaticamente o resumo das sessões de depuração e das preferências do usuário em todas as sessões. O agente pode então recuperar essas memórias de longo prazo para oferecer uma experiência personalizada aos desenvolvedores.
Com 100.000 eventos mensais de memória de curto prazo, 10.000 registros de memória de longo prazo armazenados e 20.000 chamadas mensais de recuperação de registros de memória, seus custos são divididos da seguinte forma:
Memória de curto prazo: 100.000 eventos × USD 0,25/1.000 = USD 25
Armazenamento de memória de longo prazo: 10.000 memórias × USD 0,75/1.000 = USD 7,50
Recuperação de memória de longo prazo: 20.000 recuperações × USD 0,50/1.000 = USD 10
Total mensal: USD 42,50
Observação: com estratégias de extração integradas com substituição, o custo de armazenamento de longo prazo seria menor, a USD 0,25 por 1.000 memórias armazenadas. No entanto, você pode incorrer em cobranças adicionais pelo uso do modelo em sua conta.
Observability
Exemplo: plataforma de consultoria financeira multiagente
Você planeja implantar uma plataforma abrangente de consultoria financeira com vários agentes especializados que lidam com pesquisas de investimento, análise de portfólio e verificações de conformidade regulatória. Cada agente realiza um raciocínio complexo em várias etapas com consultas de banco de dados e pesquisa na Web, chamadas de API para provedores de dados financeiros e análise de documentos. A plataforma processa milhões de transações e gera dados de telemetria abrangentes, incluindo rastreamentos, métricas e logs em todas as interações dos agentes. Você usa o AgentCore Observability para monitorar o desempenho, depurar problemas e garantir a conformidade com as regulamentações financeiras por meio de trilhas de auditoria abrangentes.
Sua plataforma gera 10 TB de dados de observabilidade mensalmente a partir de interações com agentes, chamadas de API e eventos do sistema. Supondo que 30% da abrangência sejam logs de eventos (invocação de modelo, chamada de ferramenta), aproximadamente 6 TB (presumindo 2 KB de dados de log por evento de abrangência) são gravados nos logs padrão do CloudWatch. Seus custos mensais são divididos da seguinte forma:
Cobranças mensais de ingestão de Span: 10 TB × 1.000 GB/TB × USD 0,35/GB = USD 3.500
Cobranças mensais de registro em log de eventos: 6 TB × 1.000 GB/TB × USD 0,50/GB = USD 3.000
Total mensal: USD 3.500 + USD 3.000 = USD 6.500
*As taxas padrão do CloudWatch serão aplicadas a quaisquer métricas e dados de logs não telemétricos (padrão) enviados ao CloudWatch.
Avaliações (prévia)
Exemplo: monitoramento da qualidade do agente de atendimento ao cliente de comércio eletrônico
Você planeja implantar um agente de atendimento ao cliente que lida com consultas de pedidos, processamento de devoluções e recomendações de produtos para uma plataforma de comércio eletrônico. Para garantir uma qualidade de serviço consistente, você usa o AgentCore Evaluations para monitorar o desempenho dos agentes em ambientes de desenvolvimento e produção. Sua implementação usa 3 avaliadores integrados em nível de rastreamento (exatidão, utilidade e taxa de sucesso da meta), além de 1 avaliador personalizado para métricas de qualidade específicas do negócio.
Durante o desenvolvimento, seu pipeline de CI/CD avalia 5.000 interações de teste mensalmente. Na produção, você monitora 2% das interações ao vivo por meio de regras de amostragem, avaliando 10.000 conversas com clientes mensalmente. Cada avaliação integrada processa uma média de 15.000 tokens de entrada (incluindo histórico de conversas, catálogos de produtos e detalhes do pedido) e gera 300 tokens de saída para pontuação.
Seus custos mensais são divididos da seguinte forma:
Avaliadores integrados:
- Total de interações avaliadas: 15.000 (5.000 em desenvolvimento +10.000 em produção)
- Avaliadores integrados por interação: 3 (correção, utilidade, taxa de sucesso da meta)
- Avaliação total: 15.000 interações × 3 avaliadores = 45.000 avaliações
- Tokens de entrada: 45.000 avaliações × 15.000 tokens = 675 milhões de tokens
- Tokens de saída: 45.000 avaliações × 300 tokens = 13,5 milhões de tokens
- Custo de entrada: 675 milhões de tokens × USD 2,40/1 milhão = USD 1.620
- Custo de saída: 13,5 milhões de tokens × USD 12,00/1 milhão = USD 162
- Subtotal de avaliadores integrados: USD 1.782
Avaliações personalizadas:
- Total de avaliações personalizadas: 15.000 interações × 1 avaliador personalizado = 15.000 avaliações
- Custo de avaliação personalizada: 15.000 avaliações × USD 1,50/1.000 = USD 22,50
Total mensal: USD 1.804,50
Observação: os custos de uso do modelo estão incluídos para avaliadores integrados. As avaliações personalizadas geram cobranças adicionais de uso do modelo em sua conta.
I want to
start building with AgentCore
Você encontrou o que estava procurando hoje?
Informe-nos para que possamos melhorar a qualidade do conteúdo em nossas páginas