Passer au contenu principal

Tarification d’Amazon Bedrock AgentCore (version préliminaire)

Adaptez AgentCore à vos besoins — combinez et associez les services, utilisez-les indépendamment ou ensemble, et payez uniquement ce que vous consommez à mesure que vos initiatives IA se développent.

Payez uniquement ce que vous utilisez

Amazon Bedrock AgentCore propose une tarification flexible basée sur la consommation, sans engagement initial ni frais minimum. Chaque service (Runtime, Tools : Browser et Code Interpreter, Gateway, Identity, Memory, Observability) peut être utilisé indépendamment ou combiné, et vous ne payez que ce que vous consommez. Cette approche modulaire permet de commencer petit puis d’adapter l’échelle au fur et à mesure de la croissance de vos applications d’agents IA.

Vous pouvez essayer gratuitement les services AgentCore jusqu’au 16 septembre 2025. La tarification AWS standard s’applique à tout service AWS utilisé conjointement avec AgentCore (exemple : CloudWatch pour AgentCore Observability). À partir du 17 septembre 2025, AWS facturera l’utilisation des services AgentCore selon les tarifs indiqués sur cette page.

Services Amazon Bedrock AgentCore

Runtime

AgentCore Runtime est un environnement d’exécution sans serveur sécurisé, conçu pour déployer et faire évoluer des agents IA et des outils dynamiques.

Tarification basée sur la consommation
Vous ne payez que ce que vous utilisez, sans avoir besoin de préconfigurer des ressources. Pour les ressources processeur, vous êtes facturé lorsque votre agent est en cours de traitement actif (les périodes d’attente I/O, comme lors de la réception de réponses d’un LLM, ne sont pas facturées). Pour la mémoire, vous ne payez que la mémoire effectivement consommée par votre agent. 

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • Facturation à la seconde, basée sur la plus haute utilisation CPU/mémoire enregistrée sur la seconde, avec minimum de 1 seconde.
  • La mémoire est facturée avec un minimum de 128 Mo
  • Le transfert de données réseau via les ENI (Elastic Network Interfaces) des clients est facturé aux tarifs standard d’Amazon EC2

Navigateur

L’outil AgentCore Browser fournit un environnement d’exécution de navigateur rapide, sécurisé et basé sur le cloud pour permettre aux agents IA d’interagir avec des sites Web à grande échelle.

Tarification basée sur la consommation
Vous ne payez que ce que vous utilisez, sans avoir besoin de préconfigurer des ressources. Pour les ressources processeur, vous êtes facturé uniquement lorsque votre outil est en cours de traitement actif (les périodes d’attente I/O, comme lors de la réception de réponses d’un LLM, ne sont pas facturées). Pour la mémoire, vous ne payez que la mémoire effectivement consommée par votre agent.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • La facturation est calculée à la seconde, sur la base du pic d’utilisation CPU et mémoire enregistré durant chaque seconde (minimum d’une seconde)
  • La mémoire est facturée avec un minimum de 128 Mo
  • Le transfert de données réseau via les ENI (Elastic Network Interfaces) des clients est facturé aux tarifs standard d’Amazon EC2

Code Interpreter

L’outil AgentCore Code Interpreter permet aux agents IA d’écrire et d’exécuter du code de manière sécurisée dans des environnement de test (sandbox), améliorant leur précision et leur capacité à résoudre des tâches complexes de bout en bout.

Tarification basée sur la consommation
Vous ne payez que ce que vous utilisez, sans avoir besoin de préconfigurer des ressources. Pour les ressources processeur, vous êtes facturé uniquement lorsque votre outil est en cours de traitement actif (les périodes d’attente I/O, comme lors de la réception de réponses d’un LLM, ne sont pas facturées). Pour la mémoire, vous ne payez que la mémoire effectivement consommée par votre agent.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • La facturation est calculée à la seconde, sur la base du pic d’utilisation CPU et mémoire enregistré durant chaque seconde (minimum d’une seconde)
  • La mémoire est facturée avec un minimum de 128 Mo
  • Le transfert de données réseau via les ENI (Elastic Network Interfaces) des clients est facturé aux tarifs standard d’Amazon EC2 

Gateway

AgentCore Gateway offre un moyen sécurisé aux agents de découvrir et d’utiliser des outils, tout en facilitant la transformation des API, des fonctions Lambda et des services existants en outils compatibles avec les agents.

Tarification basée sur la consommation
Vous payez uniquement les appels API effectués par vos agents via Gateway. La facturation est basée sur le nombre d’opérations effectuées avec les outils (ListTools et InvokeTool), les requêtes de recherche, et les outils indexés pour la recherche sémantique. 

Détails clés :

  • Aucun coût initial ni engagement minimum requis
  • Les API ListTools et InvokeTool sont mesurées par tranches de 128 Ko de transfert de données

 

Identity

AgentCore Identity simplifie la gestion des identités et des accès pour les agents, leur permettant d’accéder de manière sécurisée aux ressources AWS, ainsi qu’à des outils et services tiers, au nom des utilisateurs ou de façon autonome, avec leur consentement préautorisé.

Tarification basée sur la consommation
Les clients qui utilisent AgentCore Identity via AgentCore Runtime ou AgentCore Gateway ne paient aucuns frais supplémentaires. Dans les autres cas, vous ne payez que ce que vous utilisez, selon le nombre de requêtes envoyées par l’agent à AgentCore Identity pour obtenir un jeton OAuth ou une clé API.

Détails clés :

  • Aucuns frais minimum ni engagement initial requis
  • La facturation est basée sur le nombre de jetons OAuth ou de clés API générés avec succès pour exécuter une tâche nécessitant une autorisation pour une ressource non AWS
  • Aucuns frais supplémentaires lorsque AgentCore Identity est utilisé via AgentCore Runtime ou AgentCore Gateway

Memory

AgentCore Memory permet aux développeurs de créer facilement des agents capables de gérer le contexte, sans avoir à gérer une infrastructure mémoire complexe, tout en gardant le contrôle total sur les données mémorisées par l’agent d’IA.

Tarification basée sur la consommation
Vous ne payez que ce que vous consommez. Notre tarification est simple et basée sur l’usage, directement alignée sur la manière dont vos agents IA créent de la valeur :

  1. La mémoire à court terme est facturée en fonction du nombre d’événements bruts ingérés, ce qui permet une visibilité claire des coûts en session.
  2. La mémoire à long terme est facturée selon le nombre de souvenirs stockés chaque mois et le nombre de souvenirs récupérés — vous ne payez que lorsque vos agents stockent et exploitent des connaissances durables.
  3. Pour extraire la mémoire à long terme à partir des événements bruts, vous pouvez choisir entre des stratégies intégrées (traitement automatique) ou des stratégies personnalisées exécutées dans votre compte, avec le modèle et l’invite de votre choix.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • Pour la mémoire à court terme, la facturation est calculée par requête de création d’événement
  • Pour le stockage mémoire à long terme, la facturation est journalière et moyenne sur le mois
  • Pour la récupération mémoire à long terme, la facturation est calculée par requête de récupération

Observability

AgentCore Observability offre aux développeurs une visibilité complète sur les workflows des agents afin de tracer, déboguer et surveiller les performances des agents IA en environnement de production.

Tarification basée sur la consommation
Vous payez à l’usage pour la télémétrie générée, stockée et interrogée par vos agents. Les données de télémétrie sont ingérées et stockées dans votre compte Amazon CloudWatch. Vous êtes facturé pour l’ingestion et le stockage de données, les requêtes d’analyse, ainsi que pour le masquage des données sensibles ou personnelles (PII) dans les journaux. Pour consulter les détails tarifaires, rendez-vous sur la page de tarification d’Amazon CloudWatch. 

Tableau de tarification

Service
Type
Resource
Price
Runtime

Basé sur la consommation

Basé sur la consommation

Processeur

Memory

0,0895 USD par vCPU-heure

0,00945 USD par Go-heure

Browser Tool

Basé sur la consommation

Basé sur la consommation

Processeur

Memory

0,0895 USD par vCPU-heure

0,00945 USD par Go-heure

Code Interpreter

Basé sur la consommation

Basé sur la consommation

Processeur

Memory

0,0895 USD par vCPU-heure

0,00945 USD par Go-heure

Gateway

Basé sur la consommation

Basé sur la consommation

Basé sur la consommation

Invocations d’API (ListTools, InvokeTool)

API de recherche

Indexation d’outils

0,005 USD pour 1 000 invocations

0,025 USD pour 1 000 invocations

0,02 USD pour 100 outils indexés par mois

Identity

Basé sur la consommation

Requêtes de jeton ou clé API pour ressources non AWS

0,010 USD par 1 000 jetons ou clés demandés par l’agent

(Remarque : AgentCore Identity est disponible sans frais supplémentaires lorsque vous l’utilisez via AgentCore Runtime ou AgentCore Gateway.)

Memory

Basé sur la consommation

Basé sur la consommation

Basé sur la consommation

Mémoire à court terme

Stockage de mémoire à long terme

Récupération de mémoire à long terme

0,25 USD pour 1 000 nouveaux événements

Avec stratégies mémoire intégrées : 0,75 USD pour 1 000 mémoires stockées par mois

Avec stratégies mémoire personnalisées : 0,25 USD pour 1 000 mémoires stockées par mois

0,50 USD pour 1 000 récupérations de mémoire

Observability

Basé sur la consommation

Journaux, métriques et traces

Facturé selon les tarifs d’Amazon CloudWatch

*Pour les stratégies d’extraction mémoire personnalisées, des frais supplémentaires peuvent s’appliquer en fonction de l’usage du modèle dans votre compte.

Exemples de tarification

Runtime

Exemple : déploiement d’un agent de prise en charge client

Vous prévoyez de déployer un agent de support client qui répond aux questions des utilisateurs par chat et email. L’agent gère les problèmes de commande, les vérifications de compte et les clarifications de politique. Il utilise une génération augmentée par récupération (RAG) pour consulter les politiques produits, et des outils compatibles avec le protocole MCP pour interroger le statut des commandes et mettre à jour les tickets. Chaque session d’agent implique un raisonnement complexe en plusieurs étapes : 1 appel RAG vers un magasin vectoriel, 2 appels d’outils MCP (exemple : OrderAPI, TicketAPI), 2 étapes de raisonnement LLM. Vous déployez l’agent sur AgentCore Runtime pour bénéficier d’une isolation complète des sessions et d’une grande mise à l’échelle.

L’agent traite 10 millions de requêtes par mois, chaque session durant 60 secondes avec 70 % de temps d’attente I/O (c’est-à-dire en attente de réponses LLM ou de réponses réseau provenant d’API internes). Chaque session d’agent utilise 1 vCPU en traitement actif et 2 Go de mémoire en continu. Vos coûts mensuels se répartissent comme suit :

Coût du processeur par session : 18 secondes (ajustement pour un temps d’attente d’E/S de 70 %) × 1 vCPU × (0,0895 USD/3600) = 0,0004475 USD
Coût de la mémoire par session : 60 secondes × 2 Go × (0,00945 USD/3600) = 0,000315 USD
Coût total par session : 0,0007625 USD
Total mensuel : 10 millions de sessions × 0,0007625 USD = 7 625 USD

Grâce à la tarification basée sur la consommation d’AgentCore Runtime, seuls les traitements actifs du processeur sont facturés, offrant une efficacité de coût supérieure par rapport aux options classiques. 

Navigateur

Exemple : système automatisé de réservation de voyages

Vous développez un aagent d’IA pour automatiser la planification et la réservation complète d’un voyage via le Web. Il s’exécute dans un environnement sans serveur sécurisé via AgentCore Browser, gérant dynamiquement des navigateurs sans interface pour rechercher des vols/hôtels, simuler des clics, extraire des prix, et soumettre des formulaires. AgentCore Browser fournit des fonctions de niveau entreprise, dont un environnement de test (sandbox) par session, une observabilité via Live View et Session Replay.

L’agent traite 100 000 requêtes par mois. Chaque session de navigateur dure 10 minutes, avec 80 % de temps d’attente I/O, utilisant 2 vCPU en traitement actif et 4 Go de mémoire en continu. Vos coûts mensuels se répartissent comme suit :

Coût du processeur par session : 120 secondes (ajustement pour une attente d’E/S de 80 %) × 2 vCPU × (0,0895 USD/3600) = 0,005967 USD
Coût de la mémoire par session : 600 secondes × 4 Go × (0,00945 USD/3600) = 0,0063 USD
Coût total par session : 0,012267 USD
Total mensuel : 100 000 sessions × 0,012267 USD = 1 226,67 USD

Code Interpreter

Exemple : automatisation de l’analyse des données en langage naturel

Vous déployez un agent analyste qui répond en langage naturel aux équipes produit et métier, via des requêtes de jeux de données, visualisations, et analyses statistiques. Il génère et exécute dynamiquement du code Python pour des tâches complexes (corrélation trafic/conversion). AgentCore Code Interpreter est utilisé pour ses environnements de test (sandbox), ses exécutions multilingues (Python, JavaScript, TypeScript) et sa compatibilité avec des fichiers volumineux.

L’agent traite 10 000 requêtes/mois, avec 3 exécutions de code par requête. Chaque exécution dure 2 minutes, avec 60 % d’attente I/O, utilisant 2 vCPU et 4 Go de mémoire. Vos coûts mensuels se répartissent comme suit :

Coût du processeur par session : 48 secondes (ajustement pour une attente d’E/S de 60 %) × 2 vCPU × (0,0895 USD/3600) = 0,002387 USD
Coût de la mémoire par session : 120 secondes × 4 Go × (0,00945 USD/3600) = 0,00126 USD
Coût total par session : 0,003647 USD
Total mensuel : 30 000 exécutions × 0,003647 USD = 109,40 USD

Gateway

Exemple : connexion d’un agent assistant RH à des outils internes

Vous envisagez de créer un agent assistant RH pour une entreprise de taille moyenne, pour répondre aux questions sur les politiques internes, les congés, les avantages et les salaires. Pour répondre aux demandes des utilisateurs, l’agent doit accéder à plusieurs systèmes internes (Onboarding, Avantages, Paie, Gestion des congés) en tant qu’outils. Vous avez utilisé AgentCore Gateway pour créer des serveurs MCP pour 200 outils internes avec lesquels votre agent peut interagir de n’importe où, sans écrire de code. Pour améliorer la précision d’utilisation des outils, vous avez tiré parti de la fonctionnalité de recherche pour indexer les métadonnées des outils et permettre la mise en correspondance dynamique des outils lors de l’appel de l’agent en fonction du contexte d’interaction.

Chaque interaction d’agent nécessite 1 API de recherche et 4 invocations d’API InvokeTool. Pour 50M d’interactions mensuelles : 50M appels Search + 200M appels InvokeTool Vos coûts mensuels se répartissent comme suit :

Frais SearchToolIndex : 200 outils × 0,02 USD pour 100 outils = 0,04 USD
Frais d’API de recherche : 50 millions × 25 USD par million = 1 250 USD
Frais d’API InvokeTool : 200 millions × 5 USD par million = 1 000 USD
Coût mensuel total : 2 250,04 USD

Identity

Exemple : Gestion sécurisée de l’accès à des outils de prise en charge client

Vous envisagez de gérer un agent de support client qui aide les équipes techniques en accédant à plusieurs outils : Slack pour les conversations d’assistance, Zoom pour récupérer les journaux d’appels et GitHub pour le suivi des problèmes et les journaux de validation. Votre implémentation utilise AgentCore Identity pour un accès délégué sécurisé « au nom » des utilisateurs ou des ingénieurs de support. Le système est compatible avec les fournisseurs d’identité existants (par exemple, Okta, Microsoft Entra ID, Amazon Cognito) et gère toutes les méthodes d’authentification, des jetons OAuth aux rôles IAM, éliminant ainsi le besoin d’une infrastructure de sécurité personnalisée.

Supposons que l’agent soit utilisé par 10 000 utilisateurs actifs par mois, effectuant en moyenne 5 interactions chacun, ce qui nécessite 3 accès à l’outil par session pour chaque utilisateur et par mois. Vos coûts mensuels se répartissent comme suit :

Total de jetons demandés : 10 000 utilisateurs × 5 sessions × 3 outils = 150 000 jetons
Total mensuel : 150 000 requêtes × 0,010/1 000 USD = 1,50 USD

Remarque : AgentCore Identity est inclus sans frais supplémentaires lorsqu’il est utilisé via AgentCore Runtime ou Gateway.

Memory

Exemple : implémentation d’un agent d’assistant de codage personnalisé

Vous envisagez de développer un agent assistant de programmation, capable d’aider à écrire, déboguer et refactoriser du code dans les IDEs/terminaux. Pour fournir une expérience personnalisée, l’agent doit maintenir un contexte personnalisé dans la session et mémoriser les préférences utilisateur sur le long terme. Votre implémentation utilise AgentCore Memory pour doter l’agent à la fois d’une mémoire à court terme (conversations et événements immédiats) et d’une mémoire à long terme (connaissances persistantes entre les sessions).

À chaque interaction utilisateur (par exemple, en envoyant un extrait de code ou en posant une question de développement), un événement est transmis à AgentCore Memory pour être stocké comme mémoire à court terme. Pour la mémoire à long terme, vous avez configuré des stratégies d’extraction intégrées permettant de résumer et de stocker automatiquement les sessions de débogage ainsi que les préférences utilisateur d’une session à l’autre. L’agent peut ensuite récupérer ces souvenirs de long terme pour offrir une expérience personnalisée aux développeurs.

Avec 100 000 événements de mémoire à court terme mensuels, 10 000 mémoires à long terme stockées et 20 000 récupérations de mémoire mensuelles, vos coûts se répartissent comme suit :

Mémoire à court terme : 100 000 événements × 0,25 USD/1 000 = 25 USD
Stockage de mémoire à long terme : 10 000 mémoires × 0,75 USD/1 000 = 7,50 USD
Récupération de la mémoire à long terme : 20 000 extractions × 0,50 USD/1 000 = 10 USD
Total mensuel : 42,50 USD

Remarque : En utilisant des stratégies d’extraction personnalisées, le coût de stockage mémoire à long terme serait réduit à 0,25 USD par 1 000 mémoires stockées, mais cela pourrait entraîner des frais supplémentaires liés à l’usage du modèle dans votre compte.