Pular para o conteúdo principal

Amazon Bedrock

Preços do Amazon Bedrock AgentCore (versão preliminar)

Adapte o AgentCore às suas necessidades: combine serviços, use-os de maneira independente ou em conjunto e pague pelo que utilizar à medida que suas iniciativas de IA forem crescendo.

Pague somente pelo que usar

O Amazon Bedrock AgentCore oferece preços flexíveis, baseados no consumo, sem compromissos iniciais ou taxas mínimas. Cada serviço (Runtime, Gateway, Identity, Memory e Observability) e ferramenta (Browser e Code Interpreter) pode ser usado de maneira independente ou em conjunto, e você paga apenas pelo que usa. Com essa abordagem modular, você pode começar com pouco e escalar à medida que suas aplicações de agentes de IA aumentam.

Você pode experimentar os serviços do AgentCore gratuitamente até 16 de setembro de 2025. Os preços padrão da AWS se aplicam a quaisquer serviços adicionais da AWS utilizados como parte do uso do AgentCore (por exemplo, os preços do CloudWatch serão aplicáveis ao AgentCore Observability). A partir de 17 de setembro de 2025, a AWS cobrará pelo uso dos serviços do AgentCore com base no conteúdo desta página.

Serviços do Bedrock AgentCore

Tempo de execução

O AgentCore Runtime é um runtime seguro e sem servidor, desenvolvido especificamente para implantar e escalar agentes e ferramentas de IA dinâmicos.

Preços com base no consumo
Você paga apenas pelo que usa, sem precisar pré-configurar recursos. Para recursos de CPU, a cobrança é feita quando o agente está em processamento ativo (e não durante períodos de espera de E/S, caso você esteja apenas aguardando respostas do LLM). Para recursos de memória, apenas será cobrada a memória que o seu agente estiver consumindo. 

Detalhes principais:

  • Não requer a seleção prévia de recursos
  • O faturamento é calculado por segundo, usando os maiores valores de uso de CPU e memória registrados durante esse segundo, com um mínimo de 1 segundo
  • A cobrança mínima de memória de 128 MB se aplica
  • A transferência de dados de rede por meio do ENIs do cliente é cobrada de acordo com as taxas padrão do EC2

Navegador

A ferramenta AgentCore Browser fornece um tempo de execução de navegador rápido, seguro e baseado em nuvem para permitir que agentes de IA interajam com sites em grande escala.

Preços com base no consumo
Você paga apenas pelo que usa, sem precisar pré-configurar recursos. Para recursos de CPU, você é cobrado somente quando sua ferramenta está processando ativamente (não durante períodos de espera de E/S, se você estiver apenas aguardando respostas do LLM). Para recursos de memória, apenas será cobrada a memória que o seu agente estiver consumindo.

Detalhes principais:

  • Não requer a seleção prévia de recursos
  • O faturamento é calculado por segundo, usando a marca d'água mais alta de uso de CPU e memória por segundo, com um mínimo de 1 segundo
  • A cobrança mínima de memória de 128 MB se aplica
  • A transferência de dados de rede por meio do ENIs do cliente é cobrada de acordo com as taxas padrão do EC2

Intérprete de código

A ferramenta AgentCore Code Interpreter permite que agentes de IA escrevam e executem código com segurança em ambientes de sandbox, aprimorando sua precisão e expandindo sua capacidade de resolver tarefas complexas de ponta a ponta.

Preços com base no consumo
Você paga apenas pelo que usa, sem precisar pré-configurar recursos. Para recursos de CPU, você é cobrado somente quando sua ferramenta está processando ativamente (não durante períodos de espera de E/S, se você estiver apenas aguardando respostas do LLM). Para recursos de memória, apenas será cobrada a memória que o seu agente estiver consumindo.

Detalhes principais:

  • Não requer a seleção prévia de recursos
  • O faturamento é calculado por segundo, usando a marca d'água mais alta de uso de CPU e memória por segundo, com um mínimo de 1 segundo
  • A cobrança mínima de memória de 128 MB se aplica
  • A transferência de dados de rede por meio do ENIs do cliente é cobrada de acordo com as taxas padrão do EC2 

Gateway

O AgentCore Gateway fornece uma maneira segura para os agentes descobrirem e usarem ferramentas, além da fácil transformação de APIs, funções do Lambda e serviços existentes em ferramentas compatíveis com agentes.

Preços com base no consumo
Você paga somente pelas chamadas de API que seus agentes fazem por meio do Gateway. Você é cobrado com base no número de operações da ferramenta (ListTools e InvokeTool), consultas de pesquisa e ferramentas indexadas para a funcionalidade de pesquisa semântica. 

Detalhes principais:

  • Sem custos iniciais ou compromissos mínimos necessários
  • As APIs ListTools e InvokeTool são medidas em incrementos de transferência de dados de 128 KB

 

Identidade

O AgentCore Identity simplifica o gerenciamento de identidade e acesso dos agentes e permite que seus agentes acessem com segurança os recursos da AWS e ferramentas e serviços de terceiros em nome dos usuários ou sozinhos, com o consentimento pré-autorizado do usuário.

Preços baseados no consumo
Clientes que usam o AgentCore Identity por meio do AgentCore Runtime ou do AgentCore Gateway não incorrem em nenhuma cobrança adicional pelo uso do AgentCore Identity. Para todos os outros cenários, você paga somente pelo que usa e é cobrado com base no número de solicitações do agente à AgentCore Identity para obter um token OAuth ou uma chave de API.

Detalhes principais:

  • Não há taxas mínimas nem compromissos antecipados.
  • O faturamento é calculado por token OAuth ou chave de API bem-sucedida solicitada para realizar uma tarefa que exige autorização para um recurso que não seja da AWS
  • Não há cobranças adicionais quando os clientes usam o AgentCore Identity por meio do AgentCore Runtime ou do AgentCore Gateway

Memória

O AgentCore Memory facilita para os desenvolvedores a criação de agentes sensíveis ao contexto, eliminando o gerenciamento complexo da infraestrutura de memória e fornecendo controle total sobre o que o agente de IA lembra.

Preços com base no consumo
Pague somente pelo que usar. Nossos preços são simples e baseados no uso, alinhando-se diretamente com a forma como seus agentes de IA criam valor:

  1. O preço da memória de curto prazo é baseado no número de eventos brutos ingeridos, oferecendo custos previsíveis para o contexto da sessão.
  2. O preço da memória de longo prazo é baseado no número de memórias armazenadas a cada mês e no número de memórias recuperadas, então você só paga quando seus agentes armazenam e usam conhecimento duradouro.
  3. Para extrair memória de longo prazo de eventos brutos, você pode escolher entre estratégias de memória incorporadas, que incluem processamento automático, ou estratégias de memória personalizadas que são executadas em sua conta usando a opção de modelo e prompt.

Detalhes principais:

  • Não requer a seleção prévia de recursos
  • Para memória de curto prazo, o faturamento é calculado por solicitação de criação de evento
  • Para armazenamento de memória de longo prazo, o faturamento é calculado por memória armazenada por dia e calculado em média ao longo do mês
  • Para recuperação de memória de longo prazo, o faturamento é calculado por solicitação de recuperação de memória

Observabilidade

O AgentCore Observability oferece aos desenvolvedores visibilidade completa dos fluxos de trabalho dos agentes para rastrear, depurar e monitorar o desempenho dos agentes de IA em ambientes de produção.

Preços baseados no consumo
Você paga conforme o uso pela telemetria gerada, armazenada e consultada para seus agentes. Os dados de telemetria são ingeridos e armazenados em sua conta do Amazon CloudWatch. Você é cobrado pela ingestão e armazenamento de dados, consultas para recuperar e analisar informações e mascaramento de dados confidenciais/PII em registros. Para conferir os detalhes de preços, visite a página de preços do Amazon CloudWatch. 

Tabela de definição de preços

Service
Type
Resource
Price
Tempo de execução

Baseado no consumo

Baseado no consumo

CPU

Memória

USD 0,0895 por vCPU/hora

USD 0,00945 por GB/hora

Ferramenta de navegador

Baseado no consumo

Baseado no consumo

CPU

Memória

USD 0,0895 por vCPU/hora

USD 0,00945 por GB/hora

Intérprete de código

Baseado no consumo

Baseado no consumo

CPU

Memória

USD 0,0895 por vCPU/hora

USD 0,00945 por GB/hora

Gateway

Baseado no consumo

Baseado no consumo

Baseado no consumo

Invocações de API (ListTools, InvokeTool)

API de pesquisa

Indexação de ferramentas

USD 0,005 por 1.000 invocações

USD 0,025 por 1.000 invocações

USD 0,02 por 100 ferramentas indexadas por mês

Identidade

Baseado no consumo

Solicitações de token ou chave de API para recursos que não são da AWS

USD 0,010 por 1.000 tokens ou chaves de API solicitadas pelo agente

(Observação: o AgentCore Identity está disponível sem custo adicional para os clientes quando eles o usam por meio do AgentCore Runtime ou do AgentCore Gateway)

Memória

Baseado no consumo

Baseado no consumo

Baseado no consumo

Memória de longo prazo

Armazenamento de memória de longo

Recuperação de memória de longo prazo

USD 0,25 por 1.000 novos eventos

Usando estratégias de memória incorporadas: USD 0,75 por 1000 memórias armazenadas por mês

Usando estratégias de memória personalizadas: USD 0,25 por 1000 memórias armazenadas por mês

USD 0,50 por 1.000 recuperações de memória

Observabilidade

Baseado no consumo

Registros, métricas e rastreamentos

Cobrado de acordo com os preços do Amazon CloudWatch

*Para estratégias personalizadas de extração de memória, você pode incorrer em cobranças adicionais pelo uso do modelo em sua conta

Exemplos de definição de preço

Tempo de execução

Exemplo: implantação do agente de suporte ao cliente

Você planeja implantar um agente de suporte ao cliente que resolva as dúvidas dos usuários por chat e e-mail. O agente lida com problemas de pedidos, verificação de contas e esclarecimentos de políticas. Ele usa geração aumentada de recuperação (RAG) para buscar políticas de produtos e ferramentas compatíveis com o Model Context Protocol (MCP) para consultar o status do pedido e atualizar os tíquetes de suporte. Cada sessão do agente envolve um raciocínio sofisticado de várias etapas com 1 chamada RAG para um armazenamento vetorial, 2 chamadas de ferramentas MCP (por exemplo, OrderAPI, TicketAPI) e 2 etapas de raciocínio LLM. Você implantou seu agente no AgentCore Runtime porque precisa de isolamento completo da sessão e da flexibilidade de escalar para milhões de sessões em segundos.

Processando 10 milhões de solicitações de usuários mensalmente, cada sessão é executada por 60 segundos com 70% de tempo de espera de E/S (ou seja, aguardando respostas do LLM ou respostas de rede de APIs internas). Cada sessão do agente utiliza 1 vCPU durante o processamento ativo e 2 GB de memória continuamente. Seus custos mensais são divididos da seguinte forma:

Custo de CPU por sessão: 18 segundos (ajuste para 70% do tempo de espera de E/S) × 1 vCPU × (USD 0,0895/3600) = USD 0,0004475
Custo de memória por sessão: 60 segundos × 2 GB × (USD 0,00945/3600) = USD 0,000315
Custo total por sessão: USD 0,0007625
Total mensal: 10 milhões de sessões × 0,0007625 USD = 7.625 USD

Os preços baseados no consumo do AgentCore Runtime significam que você paga apenas pelo tempo de processamento ativo da CPU, não pelos períodos de espera de E/S, resultando em alta eficiência de custo em comparação com as opções de computação tradicionais. 

Navegador

Exemplo: Sistema automatizado de reserva de viagens

Você planeja criar um agente de IA de reserva de viagens que automatize o planejamento e a reserva completos de viagens por meio de interações na web. Sua implementação requer o tempo de execução seguro e sem servidor do AgentCore Browser para gerenciar dinamicamente os navegadores headless para pesquisar voos, hotéis, simular cliques, extrair preços e enviar formulários de reserva. A ferramenta AgentCore Browser fornece recursos de nível corporativo, incluindo computação em sandbox isolada por sessão e observabilidade abrangente por meio do Live View e do Session Replay.

O agente processa 100 mil solicitações mensais. Cada sessão do navegador é executada por 10 minutos com 80% de tempo de espera de E/S, utilizando 2 vCPUs durante o processamento ativo e 4 GB de memória continuamente. Seus custos mensais são divididos da seguinte forma:

Custo de CPU por sessão: 120 segundos (ajuste para 80% de espera de E/S) × 2 vCPUs × (USD 0,0895/3600) = USD 0,005967
Custo de memória por sessão: 600 segundos × 4 GB × (USD 0,00945/3600) = USD 0,0063
Custo total por sessão: USD 0,012267
Total mensal: 100 mil sessões × 0,012267 USD = USD 1.226,67

Intérprete de código

Exemplo: Automação de análise de dados em linguagem natural

Você planeja implantar um agente analista de dados que ofereça suporte às equipes de negócios e produtos com consultas de conjuntos de dados, visualizações e análises estatísticas, tudo por meio de linguagem natural. Seu agente gera e executa dinamicamente o código Python para solicitações complexas, como análise de correlação entre o tráfego do site e as taxas de conversão. Você aproveita o AgentCore Code Interpreter porque ele fornece ambientes de sandbox isolados compatíveis com políticas de segurança corporativa, tempos de execução predefinidos para várias linguagens (JavaScript, TypeScript, Python) e suporte para arquivos grandes.

O agente processa 10 mil solicitações mensais com 3 execuções de código por solicitação. Cada execução é executada por 2 minutos com 60% de tempo de espera de E/S, utilizando 2 vCPUs durante o processamento ativo e 4 GB de memória continuamente. Seus custos mensais são divididos da seguinte forma:

Custo de CPU por sessão: 48 segundos (ajuste para 60% de espera de E/S) × 2 vCPUs × (USD 0,0895/3600) = USD 0,002387
Custo de memória por sessão: 120 segundos × 4 GB × (USD 0,00945/3600) = USD 0,00126
Custo total por sessão:USD 0,003647
Total mensal: 30 mil execuções × 0,003647 USD = 109,40 USD

Gateway

Exemplo: conectar o agente do HR Assistant às ferramentas internas

Você planeja criar um agente assistente de RH para uma empresa de médio porte, lidando com questões políticas internas, saldos de licenças, inscrição em benefícios e consultas sobre folha de pagamento. Para atender às solicitações do usuário, o agente precisa acessar vários sistemas internos (APIs de integração, benefícios, folha de pagamento e gerenciamento de licenças) como ferramentas. Você usou o AgentCore Gateway para criar servidores MCP para 200 ferramentas internas com as quais seu agente pode interagir de qualquer lugar, tudo sem escrever nenhum código. Para melhorar a precisão do uso da ferramenta, você aproveitou o recurso de pesquisa para indexar os metadados da ferramenta e permitir a correspondência dinâmica de ferramentas durante a invocação do agente com base no contexto da interação.

Cada interação com o agente exige 1 API de pesquisa e 4 invocações da API InvokeTool. 50 milhões de interações mensais resultam em 50 milhões de pesquisas e 200 milhões de chamadas do InvokeTool. Seus custos mensais são divididos da seguinte forma:

Cobrança do SearchToolIndex: 200 ferramentas × USD 0,02 por 100 ferramentas = USD 0,04
Cobranças da API de pesquisa: 50 milhões × USD 25/milhão = USD 1.250
Cobranças da API InvokeTool: 200 milhões × USD 5/milhão = USD 1.000
Total mensal: USD 2.250,04 

Identidade

Exemplo: Gerenciamento seguro de acesso ao suporte ao cliente

Você planeja operar um agente de suporte ao cliente que auxilia as equipes técnicas acessando várias ferramentas: Slack para conversas de suporte, Zoom para buscar registros de chamadas e GitHub para rastreamento de problemas e registros de confirmação. Sua implementação usa o AgentCore Identity para acesso seguro e delegado “em nome de” usuários ou engenheiros de suporte. O sistema é compatível com os provedores de identidade existentes (por exemplo, Okta, Microsoft Entra ID, Amazon Cognito) e gerencia todos os métodos de autenticação, desde tokens OAuth até funções do IAM, eliminando a necessidade de uma infraestrutura de segurança personalizada.

Vamos supor que o agente esteja sendo usado por 10 mil usuários ativos mensais, com média de 5 interações cada, exigindo 3 acessos à ferramenta por sessão para cada usuário por mês. Seus custos mensais são divididos da seguinte forma:

Total de tokens solicitados: 10 mil usuários × 5 sessões × 3 ferramentas = 150 mil tokens
Total mensal: 150 mil solicitações × 0,010/1.000 USD = 1,50 USD

Nota: O AgentCore Identity é incluído sem custo adicional ao usar o AgentCore Runtime ou o Gateway.

Memória

Exemplo: implementação personalizada do agente assistente de codificação

Você planeja desenvolver um agente assistente de codificação que ajude os engenheiros de software a escrever, depurar e refatorar códigos em IDEs e terminais. Para oferecer uma experiência personalizada, o agente precisa manter o contexto durante uma sessão e lembrar as preferências do usuário em várias sessões. Sua implementação usa a memória AgentCore para equipar o agente com memória de curto prazo (conversas e eventos imediatos) e memória de longo prazo (conhecimento persistente em todas as sessões).

Cada vez que um usuário interage com o agente (por exemplo, enviando um trecho de código ou fazendo uma pergunta de codificação), você envia um evento à Memória AgentCore para armazená-lo como memória de curto prazo. Para memória de longo prazo, você configurou estratégias de extração integradas para extrair e armazenar automaticamente o resumo das sessões de depuração e das preferências do usuário em todas as sessões. O agente pode então recuperar essas memórias de longo prazo para oferecer uma experiência personalizada aos desenvolvedores.

Com 100.000 eventos mensais de memória de curto prazo, 10.000 memórias de longo prazo armazenadas e 20.000 recuperações mensais de memória, seus custos são divididos da seguinte forma:

Memória de curto prazo: 100.000 eventos × USD 0,25/1.000 = USD 25
Armazenamento de memória de longo prazo: 10.000 memórias × USD 0,75/1.000 = USD 7,50
Recuperação de memória de longo prazo: 20.000 recuperações × USD 0,50/1.000 = USD 10
Total mensal: USD 42,50

Observação: com estratégias de extração personalizadas, o custo de armazenamento de longo prazo seria menor em USD 0,25 por 1.000 memórias armazenadas, pois você pode incorrer em cobranças adicionais pelo uso do modelo em sua conta.

Observabilidade

Para obter exemplos de preços do AgentCore Observability, consulte os preços do CloudWatch aqui.

Você encontrou o que estava procurando hoje?

Informe-nos para que possamos melhorar a qualidade do conteúdo em nossas páginas