Passer au contenu principal

Tarification d’Amazon Bedrock AgentCore

Adaptez AgentCore à vos besoins : combinez et associez les services, utilisez-les indépendamment ou ensemble, et payez uniquement ce que vous consommez à mesure que vos initiatives IA se développent.

Payez uniquement ce que vous utilisez

Amazon Bedrock AgentCore propose une tarification flexible basée sur la consommation, sans engagement initial ni frais minimum. Chaque service et chaque fonctionnalité (service d’exécution, passerelle, service de stratégie (version préliminaire), service d’identification, service de gestion de mémoire, observatoire, service d’évaluations (version préliminaire), navigateur et service de codage) peuvent être utilisés indépendamment ou conjointement, et vous ne payez que ce que vous utilisez. Cette approche modulaire permet de commencer petit puis d’adapter l’échelle au fur et à mesure de la croissance de vos applications d’agents. 

Commencez à utiliser AgentCore gratuitement : les nouveaux clients AWS reçoivent jusqu’à 200 USD en crédits de l’offre gratuite. Découvrez les avantages de l’offre gratuite AWS et commencez à créer dès aujourd’hui.

Remarque : le service de stratégie dans AgentCore et le service d’évaluations d’AgentCore sont proposées gratuitement dans la version préliminaire.

Services et fonctionnalités d’AgentCore

Service d’exécution

Le service d’exécution AgentCore est un environnement d’exécution sans serveur sécurisé, conçu pour déployer et faire évoluer des agents et des outils. Choisissez entre un déploiement de code direct pour une itération rapide ou un déploiement par conteneur pour un contrôle maximal.

Vous ne payez que pour les ressources actives que vous consommez 
Contrairement aux services informatiques traditionnels qui facturent des ressources pré-allouées (c’est-à-dire une taille d’instance fixe et un coût par seconde lors de l’hébergement de l’agent), avec le service d’exécution AgentCore, vous ne payez que pour la consommation des ressources actives. Cela permet de réaliser des économies substantielles pour les charges de travail des agents, qui passent généralement 30 à 70 % du temps en attente d’E/S (attente de réponses LLM, appels d’outils/d’API ou requêtes de base de données). Avec une tarification pré-allouée, vous paieriez pour le temps d’inactivité du processeur pendant ces périodes d’attente. Grâce à la tarification basée sur la consommation de ressources actives dans le service d’exécution AgentCore, l’attente d’E/S et le temps d’inactivité sont gratuits, si aucun autre processus d’arrière-plan n’est en cours d’exécution.

La facturation est basée sur la consommation de processeur et de mémoire pendant la durée de vie de votre session, calculée à la seconde. Pour les ressources du processeur, vous êtes facturé en fonction de la consommation réelle. Si votre agent ne consomme aucun processeur pendant l’attente d’E/S, aucun frais de processeur n’est facturé. En ce qui concerne les ressources mémoire, vous êtes facturé pour le maximum de mémoire consommé pendant cette seconde.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • La facturation est calculée à la seconde, sur la base de la consommation réelle du processeur et de la mémoire maximale consommée jusqu’à cette seconde, avec un minimum d’une seconde.
  • Vous ne payez que pour la consommation réelle des ressources pendant votre session, qui s’étend du démarrage de la micro-machine virtuelle, de son initialisation, du traitement actif, des périodes d’inactivité, jusqu’à la fin de la session (arrêt de la micro-machine virtuelle).
  • La facturation inclut les frais généraux du système en plus de l’utilisation des ressources de votre application.
  • Une facturation minimale de 128 Mo s’applique pour la mémoire.
  • Coûts de stockage : le déploiement de conteneurs nécessite un stockage ECR (facturé séparément). Le déploiement direct de code vous sera facturé en fonction de la taille des artefacts de code que vous avez déployés, aux tarifs S3 Standard, à compter du 27 février 2026.
  • Les frais de transfert de données réseau s’appliquent aux tarifs EC2 standard.


Navigateur

Le navigateur AgentCore fournit un environnement d’exécution de navigateur rapide, sécurisé et basé sur le cloud pour permettre aux agents d’interagir avec des sites Web à grande échelle. 

Vous ne payez que pour les ressources actives que vous consommez
Contrairement aux services informatiques traditionnels qui facturent des ressources pré-allouées (c’est-à-dire une taille d’instance fixe et un coût par seconde lors de l’hébergement de l’agent), avec le navigateur AgentCore, vous ne payez que pour la consommation des ressources actives. Cela permet de réaliser des économies substantielles pour les charges de travail des agents, qui passent généralement 30 à 70 % du temps en attente d’E/S (attente de réponses LLM, appels d’outils/d’API ou requêtes de base de données). Avec une tarification pré-allouée, vous paieriez pour le temps d’inactivité du processeur pendant ces périodes d’attente. Grâce à la tarification basée sur la consommation de ressources actives dans le navigateur AgentCore, l’attente d’E/S et le temps d’inactivité sont gratuits, si aucun autre processus d’arrière-plan n’est en cours d’exécution.

La facturation est basée sur la consommation de processeur et de mémoire pendant la durée de vie de votre session, calculée à la seconde. Pour les ressources du processeur, vous êtes facturé en fonction de la consommation réelle. Si votre agent ne consomme aucun processeur pendant l’attente d’E/S, aucun frais de processeur n’est facturé. En ce qui concerne les ressources mémoire, vous êtes facturé pour le maximum de mémoire consommé pendant cette seconde.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • La facturation est calculée à la seconde, sur la base de la consommation réelle du processeur et de la mémoire maximale consommée jusqu’à cette seconde, avec un minimum d’une seconde.
  • Vous ne payez que pour la consommation réelle des ressources pendant votre session, qui s’étend du démarrage de la micro-machine virtuelle, de son initialisation, du traitement actif, des périodes d’inactivité, jusqu’à la fin de la session (arrêt de la micro-machine virtuelle).
  • La facturation inclut les frais généraux du système en plus de l’utilisation des ressources de votre application.
  • Une facturation minimale de 128 Mo s’applique pour la mémoire.
  • Les frais de transfert de données réseau s’appliquent aux tarifs EC2 standard.

Service de codage

Le service de codage Agentcore permet aux agents d’exécuter du code en toute sécurité dans des environnement de test (sandbox), améliorant ainsi leur précision et leur capacité à résoudre des tâches complexes de bout en bout. 

Vous ne payez que pour les ressources actives que vous consommez
Contrairement aux services informatiques traditionnels qui facturent des ressources pré-allouées (c’est-à-dire une taille d’instance fixe et un coût par seconde lors de l’hébergement de l’agent), avec le service de codage AgentCore, vous ne payez que pour la consommation des ressources actives. Cela permet de réaliser des économies substantielles pour les charges de travail des agents, qui passent généralement 30 à 70 % du temps en attente d’E/S (attente de réponses LLM, appels d’outils/d’API ou requêtes de base de données). Avec une tarification pré-allouée, vous paieriez pour le temps d’inactivité du processeur pendant ces périodes d’attente. Grâce à la tarification basée sur la consommation de ressources actives dans le service de codage AgentCore, l’attente d’E/S et le temps d’inactivité sont gratuits, si aucun autre processus d’arrière-plan n’est en cours d’exécution.

La facturation est basée sur la consommation de processeur et de mémoire pendant la durée de vie de votre session, calculée à la seconde. Pour les ressources du processeur, vous êtes facturé en fonction de la consommation réelle. Si votre agent ne consomme aucun processeur pendant l’attente d’E/S, aucun frais de processeur n’est facturé. En ce qui concerne les ressources mémoire, vous êtes facturé pour le maximum de mémoire consommé pendant cette seconde.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • La facturation est calculée à la seconde, sur la base de la consommation réelle du processeur et de la mémoire maximale consommée jusqu’à cette seconde, avec un minimum d’une seconde.
  • Vous ne payez que pour la consommation réelle des ressources pendant votre session, qui s’étend du démarrage de la micro-machine virtuelle, de son initialisation, du traitement actif, des périodes d’inactivité, jusqu’à la fin de la session (arrêt de la micro-machine virtuelle).
  • La facturation inclut les frais généraux du système en plus de l’utilisation des ressources de votre application.
  • Une facturation minimale de 128 Mo s’applique pour la mémoire.
  • Les frais de transfert de données réseau s’appliquent aux tarifs EC2 standard.

Passerelle

La passerelle Amazon Bedrock AgentCore permet aux agents d’accéder aux outils en toute sécurité en transformant les API et les fonctions Lambda en outils compatibles avec les agents et en se connectant aux serveurs MCP existants.

Tarification basée sur la consommation
Vous payez uniquement les appels d’API effectués par vos agents via la passerelle. Vous êtes facturé en fonction du nombre d’opérations MCP (telles que ListTools, CallTool et Ping), de requêtes de recherche et d’outils indexés pour la fonctionnalité de recherche sémantique.

Détails clés :

  • Aucun coût initial ni engagement minimum requis.
  • Les frais de transfert de données réseau s’appliquent aux tarifs EC2 standard.

 

Service de stratégie (version préliminaire)

 

Le service de stratégie dans Amazon Bedrock AgentCore vous donne un contrôle complet sur les actions entreprises par les agents, ce qui permet de garantir que les agents respectent les limites définies sans ralentir.

Tarification basée sur la consommation

Vous ne payez que pour les demandes d’autorisation effectuées lors de l’exécution de l’agent. Chaque fois qu’un agent appelle un outil via la passerelle AgentCore, le service de stratégie compare l’action à vos règles pour déterminer si elle est autorisée ou refusée.

En outre, le service de stratégie propose la création de stratégies en langage naturel, ce qui vous permet de créer des stratégies Cedar à l’aide de descriptions simples en langage naturel. Vous êtes facturé par tranche de 1 000 jetons d’entrée utilisateur traités lors de la conversion du langage naturel en instructions de stratégie Cedar.

Service d’identification

Le service d’identification AgentCore simplifie la gestion des identités et des accès pour les agents, leur permettant d’accéder de manière sécurisée aux ressources AWS, ainsi qu’à des outils et services tiers, au nom des utilisateurs ou de façon autonome, avec leur consentement pré-autorisé.

Tarification basée sur la consommation
Les clients qui utilisent AgentCore Identity via AgentCore Runtime ou AgentCore Gateway ne paient aucuns frais supplémentaires. Dans les autres cas, vous ne payez que ce que vous utilisez, selon le nombre de requêtes envoyées par l’agent à AgentCore Identity pour obtenir un jeton OAuth ou une clé API.

Détails clés :

  • Aucuns frais minimum ni engagement initial requis
  • La facturation est basée sur le nombre de jetons OAuth ou de clés API générés avec succès pour exécuter une tâche nécessitant une autorisation pour une ressource non AWS.
  • Aucuns frais supplémentaires lorsque le service d’identification AgentCore est utilisé via le service d’exécution AgentCore ou la passerelle AgentCore. 

Service de gestion de mémoire

Le service de gestion de mémoire AgentCore permet aux développeurs de créer facilement des agents capables de gérer le contexte, sans avoir à gérer une infrastructure mémoire complexe, tout en gardant le contrôle total sur les données mémorisées par l’agent.

Tarification basée sur la consommation
Vous ne payez que ce que vous consommez. Notre tarification est simple et basée sur l’usage, directement alignée sur la manière dont vos agents créent de la valeur :

  1. La mémoire à court terme est facturée en fonction du nombre d’événements bruts créés, ce qui permet une visibilité claire des coûts en session.
  2. Les enregistrements de mémoire à long terme sont facturés en fonction du nombre de mémoires traitées et stockées chaque mois et du nombre d’appels de récupération d’enregistrements de mémoire. Vous ne payez donc que lorsque vos agents stockent et utilisent les connaissances traitées.
  3. Pour extraire la mémoire à long terme à partir des événements bruts, vous pouvez choisir entre des stratégies mémoire intégrées (traitement automatique) ou des stratégies mémoire plus configurables exécutées dans votre compte, avec le modèle et l’invite de votre choix.

Détails clés :

  • Aucune sélection de ressources préalable requise.
  • Pour la mémoire à court terme, la facturation est calculée par requête de création d’événement.
  • Pour le stockage de mémoire à long terme, la facturation est calculée par enregistrement de mémoire stocké par jour et est calculée en moyenne sur le mois.
  • Pour la récupération mémoire à long terme, la facturation est calculée par requête de récupération de mémoire.

Observatoire

L’observatoire d’AgentCore offre aux développeurs une visibilité complète sur les workflows des agents afin de tracer, déboguer et surveiller les performances des agents en environnement de production.

Tarification basée sur la consommation
Vous payez à l’usage pour la télémétrie générée, stockée et interrogée par vos agents. Les données de télémétrie sont ingérées et stockées dans votre compte Amazon CloudWatch. Vous êtes facturé pour l’ingestion et le stockage de données, les requêtes de récupération et d’analyse d’informations, ainsi que pour le masquage des données sensibles ou d’identification personnelle (PII) dans les journaux. Pour consulter les détails tarifaires, rendez-vous sur la page de tarification d’Amazon CloudWatch. 

Service d’évaluations (version préliminaire)

Le service d’évaluations AgentCore permet d’inspecter en permanence la qualité des agents en fonction du comportement réel. Les équipes peuvent effectuer des évaluations agentiques à l’aide de 13 évaluateurs intégrés sur des dimensions de qualité communes ou créer des évaluateurs personnalisés pour des exigences commerciales spécifiques. Les résultats sont intégrés à l’observatoire d’AgentCore, optimisé par Amazon CloudWatch pour une surveillance unifiée.

Tarification basée sur la consommation
Vous payez en fonction de votre utilisation. Pour les évaluateurs intégrés, la tarification est facturée par AgentCore sur la base des jetons d’entrée et de sortie traités lors de l’évaluation. Pour les évaluations personnalisées utilisant votre propre infrastructure LLM, vous payez par évaluation effectuée, avec des coûts d’inférence distincts en fonction du modèle utilisé.

Détails clés :

  • Il n’y a pas d’engagement initial ni de frais minimums.
  • Inclut l’intégration CI/CD avec des seuils de qualité configurables.
  • Surveillance de la production avec règles d’échantillonnage et agrégation de tableaux de bord.
  • Contrôle des coûts grâce à l’échantillonnage basé sur les pourcentages, à l’échantillonnage conditionnel et à la surveillance métrique sélective.
  • Les coûts d’utilisation des modèles sont inclus pour les évaluateurs intégrés, pas de frais de modèle distincts.
  • Les évaluations personnalisées entraînent des frais d’utilisation du modèle supplémentaires sur votre compte.

Tableau de tarification

Service/Capability
Type
Resource
Price
Service d’exécution

Basé sur la consommation active

Basé sur la consommation active

Processeur

Service de gestion de mémoire

0,0895 USD par vCPU-heure

0,00945 USD par Go-heure

Outil de navigation

Basé sur la consommation active

Basé sur la consommation active

Processeur

Service de gestion de mémoire

0,0895 USD par vCPU-heure

0,00945 USD par Go-heure

Service de codage

Basé sur la consommation active

Basé sur la consommation active

Processeur

Service de gestion de mémoire

0,0895 USD par vCPU-heure

0,00945 USD par Go-heure

Gateway

Basé sur la consommation

Basé sur la consommation

Basé sur la consommation

Invocations d’API (ListTools, InvokeTool, Ping)

API de recherche

Indexation d’outils

0,005 USD pour 1 000 invocations

0,025 USD pour 1 000 invocations

0,02 USD pour 100 outils indexés par mois

Identity

Basé sur la consommation

Requêtes de jeton ou clé API pour ressources non AWS

0,010 USD par 1 000 jetons ou clés demandés par l’agent

(Remarque : AgentCore Identity est disponible sans frais supplémentaires lorsque vous l’utilisez via AgentCore Runtime ou AgentCore Gateway.)

Memory

Basé sur la consommation

Basé sur la consommation

Basé sur la consommation

Mémoire à court terme

Stockage de mémoire à long terme

Récupération de mémoire à long terme

0,25 USD pour 1 000 nouveaux événements

Avec stratégies mémoire intégrées : 0,75 USD pour 1 000 enregistrements mémoires stockées par mois

Avec stratégies de mémoire intégrées avec remplacement ou stratégies de mémoire autogérées : 0,25 USD pour 1 000 enregistrements de mémoire stockés par mois*

0,50 USD pour 1 000 enregistrements de mémoire récupérés

Observatoire

Basé sur la consommation





 

Spans, journaux et métriques

Service d’évaluations (version préliminaire)

Basé sur la consommation
 

Basé sur la consommation
 

Évaluateurs intégrés
 

Évaluateurs personnalisés

0,0024 USD pour 1 000 jetons d’entrée
0,012 USD pour 1 000 jetons de sortie

1,50 USD pour 1 000 évaluations (frais d’utilisation du modèle facturés séparément)

Service de stratégie (version préliminaire)

Basé sur la consommation

Basé sur la consommation

Demande d’autorisation

Jetons d’entrée traités

0,000025 USD par demande d’autorisation

0,13 USD pour 1 000 jetons d’entrée

*Pour les stratégies intégrées avec remplacement et les stratégies autogérées, l’utilisation du modèle sur votre compte peut entraîner des frais supplémentaires

Exemples de tarification

Service d’exécution

Exemple : déploiement d’un agent de prise en charge client

Vous prévoyez de déployer un agent de support client qui répond aux questions des utilisateurs par chat et email. L’agent gère les problèmes de commande, les vérifications de compte et les clarifications de politique. Il utilise une génération augmentée par récupération (RAG) pour consulter les politiques produits, et des outils compatibles avec le protocole MCP pour interroger le statut des commandes et mettre à jour les tickets. Chaque session d’agent implique un raisonnement complexe en plusieurs étapes : 1 appel RAG vers un magasin vectoriel, 2 appels d’outils MCP (exemple : OrderAPI, TicketAPI), 2 étapes de raisonnement LLM. Vous déployez l’agent sur le service d’exécution AgentCore pour bénéficier d’une isolation complète des sessions et de la flexibilité nécessaire pour passer à des milliers de sessions en quelques secondes.

En traitant 10 millions de demandes d’utilisateurs par mois, chaque session s’exécute pendant 60 secondes avec un temps d’attente d’E/S de 70 % (attente des réponses LLM et des appels d’API), et aucun autre processus d’arrière-plan n’est en cours d’exécution pendant les E/S. Chaque session d’agent utilise 1 vCPU en traitement actif. L’utilisation de la mémoire commence à 1 Go lors de l’initialisation, passe à 2 Go pendant le traitement RAG, puis culmine à 2,5 Go lors d’appels d’outils complexes pour le reste de la session. Vos coûts mensuels se répartissent comme suit :

Coût du processeur par session : 18 secondes (temps de traitement actif uniquement) × 1 vCPU × (0,0895 USD/3 600) = 0,0004475 USD
Coût de la mémoire par session : 10 secondes × 1 Go × (0,00945 USD/3 600) + 20 secondes × 2 Go × (0,00945 USD/3 600) + 30 secondes × 2,5 Go × (0,00945 USD/3 600) = 0,000026 USD + 0,000053 USD + 0,000197 USD = 0,000276 USD
Coût total par session : 0,0007235 USD

Total mensuel : 10 millions de sessions × 0,0007235 USD = 7 235 USD

Coûts de stockage : avec le déploiement basé sur des conteneurs, vous gérez le stockage ECR séparément en fonction des taux ECR publiés. Si vous utilisiez plutôt le déploiement direct du code, la tarification S3 Standard (à compter du 27 février 2026) s’appliquerait à vos artefacts de code. Pour un agent de 100 Mo, cela représente 0,0023 USD par mois en frais de stockage.

Comparaison avec la tarification préallouée : si cette charge de travail était exécutée sur un service facturant des ressources pré-allouées, vous devrez prévoir des ressources pour les pics d’utilisation (2,5 Go de mémoire, 1 vCPU) pendant les 60 secondes, ce qui se traduirait par des coûts de processeur jusqu’à 3,3 fois plus élevés et des coûts de mémoire jusqu’à 1,4 fois plus élevés. Dans l’exemple ci-dessus, les économies réalisées sur les coûts du processeur sont importantes, étant donné que la consommation du processeur représentait 62 % du coût total de la charge de travail. La tarification basée sur la consommation du service d’exécution AgentCore prend automatiquement en compte l’avantage « l’attente d’E/S est gratuite » et ne facture que l’utilisation réelle de la mémoire au fur et à mesure qu’elle augmente, offrant ainsi une rentabilité substantielle par rapport aux options de calcul traditionnelles.

Navigateur

Exemple : système automatisé de réservation de voyages

Vous développez un agent pour automatiser la planification et la réservation complète d’un voyage via le Web. Il s’exécute dans un environnement sans serveur sécurisé via le navigateur AgentCore, gérant dynamiquement des navigateurs sans interface pour rechercher des vols/hôtels, simuler des clics, extraire des prix, et soumettre des formulaires. AgentCore Browser fournit des fonctions de niveau entreprise, dont un environnement de test (sandbox) par session, une observabilité via Live View et Session Replay.

L’agent traite 100 000 requêtes par mois. Chaque session de navigateur s’exécute pendant 10 minutes avec un temps d’attente d’E/S de 80 %. Pendant le traitement actif, il utilise 2 vCPU et 4 Go de mémoire en continu, et pendant les E/S, il utilise 0,4 vCPU et 5 Go de mémoire. Vos coûts mensuels se répartissent comme suit :

Coût du processeur par session : 120 secondes (ajustement pour une attente d’E/S de 80 %) × 2 vCPU × (0,0895 USD/3600) = 0,005967 USD
Coût de la mémoire par session : 600 secondes × 4 Go × (0,00945 USD/3600) = 0,0063 USD
Coût total par session : 0,012267 USD
Total mensuel : 100 000 sessions × 0,012267 USD = 1 226,67 USD

Code Interpreter

Exemple : automatisation de l’analyse des données en langage naturel

Vous déployez un agent analyste qui répond en langage naturel aux équipes produit et métier, via des requêtes de jeux de données, visualisations, et analyses statistiques. Il génère et exécute dynamiquement du code Python pour des tâches complexes (corrélation trafic/conversion). AgentCore Code Interpreter est utilisé pour ses environnements de test (sandbox), ses exécutions multilingues (Python, JavaScript, TypeScript) et sa compatibilité avec des fichiers volumineux.

L’agent traite 10 000 requêtes/mois, avec 3 exécutions de code par requête. Chaque exécution dure 2 minutes, avec 60 % d’attente I/O, utilisant 2 vCPU et 4 Go de mémoire. Vos coûts mensuels se répartissent comme suit :

Coût du processeur par session : 48 secondes (ajustement pour une attente d’E/S de 60 %) × 2 vCPU × (0,0895 USD/3600) = 0,002387 USD
Coût de la mémoire par session : 120 secondes × 4 Go × (0,00945 USD/3600) = 0,00126 USD
Coût total par session : 0,003647 USD
Total mensuel : 30 000 exécutions × 0,003647 USD = 109,40 USD

Passerelle

Exemple : connexion d’un agent assistant RH à des outils internes

Vous envisagez de créer un agent assistant RH pour une entreprise de taille moyenne, pour répondre aux questions sur les politiques internes, les congés, les avantages et les salaires. Pour répondre aux demandes des utilisateurs, l’agent doit accéder à plusieurs systèmes internes (Onboarding, Avantages, Paie, Gestion des congés) en tant qu’outils. Vous avez utilisé AgentCore Gateway pour créer des serveurs MCP pour 200 outils internes avec lesquels votre agent peut interagir de n’importe où, sans écrire de code. Pour améliorer la précision d’utilisation des outils, vous avez tiré parti de la fonctionnalité de recherche pour indexer les métadonnées des outils et permettre la mise en correspondance dynamique des outils lors de l’appel de l’agent en fonction du contexte d’interaction.

Chaque interaction d’agent nécessite 1 API de recherche et 4 invocations d’API InvokeTool. Pour 50M d’interactions mensuelles : 50M appels Search + 200M appels InvokeTool Vos coûts mensuels se répartissent comme suit :

Frais SearchToolIndex : 200 outils × 0,02 USD pour 100 outils = 0,04 USD
Frais d’API de recherche : 50 millions × 25 USD par million = 1 250 USD
Frais d’API InvokeTool : 200 millions × 5 USD par million = 1 000 USD
Coût mensuel total : 2 250,04 USD

Service de stratégie (version préliminaire)

Exemple :

Vous envisagez de développer un agent d’automatisation des achats qui aidera les équipes opérationnelles à gérer la sélection des fournisseurs, la création des bons de commande et l’approbation des factures. Pour vous assurer que les actions respectent les règles métier définies, vous utilisez le service de stratégie avec la passerelle AgentCore pour vérifier automatiquement chaque action avant qu’elle ne soit exécutée conformément à vos stratégies définies. Chaque fois que l’agent tente d’effectuer une action (par exemple, envoyer une approbation d’achat ou initier un paiement), la passerelle intercepte l’appel de l’outil pour vérifier si l’action est autorisée ou refusée. Supposons que l’agent gère 100 000 sessions par mois et effectue 5 appels d’outils en moyenne par session. Si vous implémentez une demande d’autorisation pour chaque appel d’outil, vous effectuez 500 000 demandes d’autorisation par mois, dont le coût se répartit comme suit :


Demandes d’autorisation = 100 000 sessions x 5 appels d’outils/session x 1 stratégie appliquée/appel d’outil = 500 000 demandes d’autorisation
Total mensuel : 500 000 demandes x 0,000025 = 12,50 USD


Avant le déploiement, votre équipe utilise éventuellement la création de stratégies en langage naturel pour simplifier l’intégration et la configuration des stratégies. Au lieu de rédiger les stratégies Cedar manuellement, ils décrivent les règles en langage clair et AgentCore les convertit en instructions de stratégie Cedar. Des frais uniques vous sont facturés en fonction du nombre de jetons saisis par l’utilisateur traités au cours de cette étape de création. Si votre équipe utilise 10 000 jetons pour créer plusieurs stratégies, vos coûts seront les suivants :

Création de stratégies = 20 000 jetons × 0,13 USD pour 1 000 jetons d’entrée = 2,60 USD

Remarque : les tarifs CloudWatch standard s’appliquent si l’observatoire est activé.

Identity

Exemple : gestion sécurisée de l’accès à des outils de prise en charge client

Vous envisagez de gérer un agent de support client qui aide les équipes techniques en accédant à plusieurs outils : Slack pour les conversations d’assistance, Zoom pour récupérer les journaux d’appels et GitHub pour le suivi des problèmes et les journaux de validation. Votre implémentation utilise le service d’identification AgentCore pour un accès délégué sécurisé pour les utilisateurs ou les ingénieurs de support. Le système est compatible avec les fournisseurs d’identité existants (par exemple, Amazon Cognito, Okta, Microsoft Entra ID) et gère toutes les méthodes d’authentification, des jetons OAuth aux clés d’API, éliminant ainsi le besoin d’une infrastructure de sécurité personnalisée. 

Supposons que l’agent soit utilisé par 10 000 utilisateurs actifs par mois, effectuant en moyenne 5 interactions chacun, ce qui nécessite 3 accès à l’outil par session pour chaque utilisateur et par mois. Vos coûts mensuels se répartissent comme suit :

Total de jetons demandés : 10 000 utilisateurs × 5 sessions × 3 outils = 150 000 jetons
Total mensuel : 150 000 requêtes × 0,010/1 000 USD = 1,50 USD

Remarque : le service d’identification AgentCore est inclus sans frais supplémentaires lorsqu’il est utilisé via le service d’exécution ou la passerelle AgentCore.

Service de gestion de mémoire

Exemple : implémentation d’un agent d’assistant de codage personnalisé

Vous envisagez de développer un agent assistant de programmation, capable d’aider à écrire, déboguer et refactoriser du code dans les IDEs/terminaux. Pour fournir une expérience personnalisée, l’agent doit maintenir un contexte personnalisé dans la session et mémoriser les préférences utilisateur sur le long terme. Votre implémentation utilise AgentCore Memory pour doter l’agent à la fois d’une mémoire à court terme (conversations et événements immédiats) et d’une mémoire à long terme (connaissances persistantes entre les sessions).

À chaque interaction utilisateur (par exemple, en envoyant un extrait de code ou en posant une question de développement), un événement est transmis à AgentCore Memory pour être stocké comme mémoire à court terme. Pour la mémoire à long terme, vous avez configuré des stratégies d’extraction intégrées permettant de résumer et de stocker automatiquement les sessions de débogage ainsi que les préférences utilisateur d’une session à l’autre. L’agent peut ensuite récupérer ces souvenirs de long terme pour offrir une expérience personnalisée aux développeurs.

Avec 100 000 événements de mémoire à court terme mensuels, 10 000 enregistrements de mémoire à long terme stockés et 20 000 appels de récupération d’enregistrement de mémoire mensuels, vos coûts se répartissent comme suit :

Mémoire à court terme : 100 000 événements × 0,25 USD/1 000 = 25 USD
Stockage de mémoire à long terme : 10 000 mémoires × 0,75 USD/1 000 = 7,50 USD
Récupération de la mémoire à long terme : 20 000 extractions × 0,50 USD/1 000 = 10 USD
Total mensuel : 42,50 USD

Remarque : avec des stratégies d’extraction intégrées avec remplacement, le coût du stockage à long terme serait inférieur à 0,25 USD par tranche de 1 000 mémoires stockées. Toutefois, l’utilisation du modèle sur votre compte peut entraîner des frais supplémentaires.

Observatoire

Exemple : plateforme de conseil financier multi-agents

Vous envisagez de déployer une plateforme complète de conseil financier avec plusieurs agents spécialisés chargés de la recherche en investissement, de l’analyse de portefeuille et des contrôles de conformité réglementaire. Chaque agent effectue un raisonnement complexe en plusieurs étapes à l’aide de requêtes de base de données et de recherches sur le Web, d’appels d’API aux fournisseurs de données financières et d’analyses de documents. La plateforme traite des millions de transactions et génère de nombreuses données télémétriques, notamment des traces, des métriques et des journaux pour toutes les interactions des agents. Vous utilisez l’observatoire d’AgentCore pour surveiller les performances, résoudre les problèmes et garantir la conformité aux réglementations financières grâce à des pistes d’audit complètes.

Votre plateforme génère 10 To de données d’observabilité par mois à partir des interactions des agents, des appels d’API et des événements système. En supposant que 30 % des spans sont des journaux d’événements (appel de modèle, appel d’outil), environ 6 To (en supposant 2 Ko de données de journal par événement de span) sont écrits dans les journaux standard de CloudWatch. Vos coûts mensuels se répartissent comme suit :

Frais d’ingestion de span mensuels : 10 To × 1 000 Go/To × 0,35 USD/Go = 3 500 USD
Frais d’enregistrement des événements mensuels : 6 To × 1 000 Go/To × 0,50 USD/Go = 3 000 USD
Total mensuel : 3 500 USD + 3 000 USD = 6 500 USD

*Les tarifs standard de CloudWatch s’appliqueront à toutes les métriques et à toutes les données de journaux non télémétriques (standard) envoyées à CloudWatch.

Service d’évaluations (version préliminaire)

Exemple : surveillance de la qualité des agents du service client pour le commerce en ligne

Vous envisagez de déployer un agent de service client qui gère les demandes de commande, le traitement des retours et les recommandations de produits pour une plateforme de commerce en ligne. Pour garantir une qualité de service constante, vous utilisez le service d’évaluations AgentCore pour surveiller les performances des agents dans les environnements de développement et de production. Votre implémentation utilise 3 évaluateurs intégrés au niveau de la trace (exactitude, utilité et taux de réussite des objectifs) plus un évaluateur personnalisé pour les mesures de qualité spécifiques à l’entreprise.

Pendant le développement, votre pipeline CI/CD évalue 5 000 interactions de test par mois. En production, vous surveillez 2 % des interactions en direct grâce à des règles d’échantillonnage, en évaluant 10 000 conversations clients par mois. Chaque évaluation intégrée traite en moyenne 15 000 jetons d’entrée (y compris l’historique des conversations, les catalogues de produits et les détails des commandes) et génère 300 jetons de sortie pour la notation.

Vos coûts mensuels se répartissent comme suit :
Évaluateurs intégrés :

  • Nombre total d’interactions évaluées : 15 000 (5 000 en développement + 10 000 en production)
  • Évaluateurs intégrés par interaction : 3 (exactitude, utilité, taux de réussite des objectifs)
  • Évaluation totale : 15 000 interactions × 3 évaluateurs = 45 000 évaluations
  • Jetons d’entrée : 45 000 évaluations × 15 000 jetons = 675 millions de jetons
  • Jetons de sortie : 45 000 évaluations × 300 jetons = 13,5 millions de jetons
  • Coût d’entrée : 675 millions de jetons × 2,40 USD/1 million = 1 620 USD
  • Coût de sortie : 13,5 millions de jetons × 12,00 USD/1 million = 162 USD
  • Sous-total des évaluateurs intégrés : 1 782 USD

Évaluations personnalisées :

  • Total des évaluations personnalisées : 15 000 interactions × 1 évaluateur personnalisé = 15 000 évaluations
  • Coût de l’évaluation personnalisée : 15 000 évaluations × 1,50 USD/1 000 = 22,50 USD

Total mensuel : 1 804,50 USD

Remarque : Les coûts d’utilisation du modèle sont inclus pour les évaluateurs intégrés. Les évaluations personnalisées entraînent des frais d’utilisation du modèle supplémentaires sur votre compte.

I want to

Avez-vous trouvé les informations que vous recherchiez ?

Faites-nous part de vos commentaires afin que nous puissions améliorer le contenu de nos pages