Amazon Bedrock

Tarification d’Amazon Bedrock

Démarrer gratuitement

Demander un devis

Tarification des modèles

Tarification des modèles

La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.

Amazon Bedrock prend en charge différents niveaux, notamment les niveaux Standard, Flex, Priority et Reserved. Cliquez pour en savoir plus sur les niveaux de service.

Amazon Bedrock propose certains modèles de fondation (FM) provenant des principaux fournisseurs d’IA tels qu’Anthropic, Meta, Mistral AI et Amazon pour l’inférence par lots à un prix 50 % inférieur à celui de la tarification d’inférence à la demande. Pour en savoir plus sur le mode Lot, cliquez sur ici. Veuillez vous référer à la ici.

AI21 Labs
AI21 Labs

Tarification à la demande
Amazon
- Amazon Nova
- Amazon Titan
- Autres Amazon
- Amazon Nova
- Amazon Nova
  
  Tarification des modèles de compréhension
  
  Inférence inter-régions mondiale
  
  Inférence géographique interrégionale et intrarégionale
  
  Outils intégrés
  
  Tarification des modèles de génération de contenu créatif
  
  Tarification des modèles de compréhension et de génération de la parole
  
  Tarification à la demande pour les modèles de fondation de synthèse vocale
  
  Remarque : *la tarification d’entrée et de sortie des jetons de texte s’applique à des cas d’utilisation spécifiques tels que la transcription parole-texte, les appels d’outils pour l’achèvement de tâches ou l’ancrage des connaissances, l’ajout d’un historique des conversations à la session, etc.
  
  L’inférence à la demande pour les modèles Nova personnalisés est proposée au même prix que l’inférence Nova de base.
  
  Tarification des modèles de vectorisation
- Amazon Titan
- Amazon Titan
- Autres Amazon
Anthropic

Anthropic

Tarification à la demande et par lots

Modèles à accès étendu

Fournisseur	Nom du modèle	Régions	Prix par million de jetons d’entrée	Prix par million de jetons de sortie	Prix par million de jetons d’entrée (lot)	Prix par million de jetons de sortie (lot)	Prix par million de jetons d’entrée (écriture dans le cache)	Prix par million de jetons d’entrée (lecture du cache)
Anthropic	Claude 3.5 Sonnet (accès public étendu, à compter du 1er décembre 2025)	USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), Europe (Francfort), Europe (Irlande), Europe (Zurich), Europe (Paris)	6,00 USD	30,00 USD	3,00 USD	15,00 USD	N/A	N/A
Anthropic	Claude 3.5 Sonnet v2 (accès public étendu, à compter du 1er décembre 2025)	USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon)	6,00 USD	30,00 USD	3,00 USD	15,00 USD	7,50 USD	0,60 USD

Tarification du niveau Reserved

Inférence optimisée en termes de latence

Tarification du débit alloué

Pour connaître la tarification du débit alloué, veuillez contacter l’équipe chargée de votre compte.

Cohere

Cohere

Tarification à la demande

Modèles Cohere	Prix pour 1 000 requêtes**
Rerank 3.5	2,00 USD
**Le nombre de requêtes pouvant contenir jusqu’à 100 segments de document vous est facturé. Si la requête contient plus de 100 segments de document, elle est comptée comme plusieurs requêtes. Par exemple, si une demande contient 350 documents, elle sera traitée comme 4 demandes. Veuillez noter que chaque document ne peut contenir que 500 jetons (y compris le total des jetons de la requête et du document), et si la longueur du jeton est supérieure à 512 jetons, il est divisé en plusieurs documents.

Tarification pour la personnalisation (ajustement)

* Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement x nombre d’époques

Tarification du débit provisionné

Modèles Cohere	Prix par heure et par modèle sans engagement	Tarif horaire par unité modèle pour un engagement d'un mois	Tarif horaire par unité modèle pour un engagement de six mois
Command de Cohere	49,5 USD	39,60 USD	23,77 USD
Cohere Command - Light	8,56 USD	6,85 USD	4,11 USD
Intégrer 3 anglais	7,12 USD	6,76 USD	6,41 USD
Intégrer 3 multilingue	7,12 USD	6,76 USD	6,41 USD

Veuillez contacter votre compte AWS ou votre équipe de vente pour plus de détails sur les modèles d'unités.

DeepSeek

DeepSeek

Tarification à la demande

Standard
Priority
Flex

Standard

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles DeepSeek	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
DeepSeek v3.2	0,62 USD	1,85 USD

Régions : Asie-Pacifique (Mumbai), Amérique du Sud (São Paulo), Asie-Pacifique (Jakarta), Asie-Pacifique (Tokyo) et Europe (Stockholm)

Modèles DeepSeek	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
DeepSeek v3.2	0,74 USD	2,22 USD

Région : Asie-Pacifique (Sydney)

Modèles DeepSeek	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
DeepSeek v3.1	0,5974 USD	1,7304 USD
DeepSeek v3.2	0,6386 USD	1,9055 USD

Priority

Région : Asie-Pacifique (Sydney)

Modèles DeepSeek	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
DeepSeek v3.1	1,0455 USD	3,0282 USD

Flex

Région : Asie-Pacifique (Sydney)

Modèles DeepSeek	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
DeepSeek v3.1	0,2987 USD	0,8652 USD

Google

Google

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles Google	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Gemma 3 4B	0,04 USD	0,08 USD
Gemma 3 12B	0,09 USD	0.29 USD
Gemma 3 27B	0,23 USD	0,38 USD

Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)

Modèles Google	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Gemma 3 4B	0,05 USD	0,09 USD
Gemma 3 12B	0,11 USD	0,34 USD
Gemma 3 27B	0,27 USD	0,45 USD

Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles Google	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Gemma 3 4B	0,05 USD	0,10 USD
Gemma 3 12B	0,11 USD	0,35 USD
Gemma 3 27B	0,28 USD	0.46 USD

Région : Europe (Londres)

Modèles Google	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Gemma 3 4B	0,06 USD	0,12 USD
Gemma 3 12B	0,14 USD	0,45 USD
Gemma 3 27B	0,36 USD	0,59 USD

Région : Asie-Pacifique (Sydney)

Modèles Google	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Gemma 3 4B	0,0412 USD	0,0824 USD
Gemma 3 12B	0,0927 USD	0,2987 USD
Gemma 3 27B	0,2369 USD	0,3914 USD

* La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex est réduite de 50 % par rapport à la tarification du niveau Standard

Luma AI
Tarification à la demande
Meta

MiniMax AI

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
MiniMax M2	0,30 USD	1,20 USD
Minimax M2.1	0,30 USD	1,20 USD

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Minimax M2.5	0,30 USD	1,20 USD

Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
MiniMax M2	0,35 USD	1,41 USD
Minimax M2.1	0,36 USD	1,44 USD

Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
MiniMax M2	0,36 USD	1,45 USD
Minimax M2.1	0,36 USD	1,44 USD

Région : Europe (Londres)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
MiniMax M2	0,47 USD	1,86 USD
Minimax M2.1	0,47 USD	1,86 USD

Régions : Europe (Francfort), Europe (Stockholm), Asie-Pacifique (Jakarta)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Minimax M2.1	0,36 USD	1,44 USD

Région : Asie-Pacifique (Sydney)

Modèles MiniMax	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
MiniMax M2	0,3090 USD	1,2360 USD
Minimax M2.1	0,3090 USD	1,2360 USD

Mistral AI

Mistral AI

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,40 USD	2,00 USD
Magistral Small 1.2	0,50 USD	1,50 USD
Voxtral Mini 1.0	0,04 USD	0,04 USD
Voxtral Small 1.0	0,10 USD	0,30 USD
Ministral 3B 3.0	0,10 USD	0,10 USD
Ministral 8B 3.0	0,15 USD	0,15 USD
Ministral 14B 3.0	0,20 USD	0,20 USD
Mistral Large 3	0,50 USD	1,50 USD

Régions : Asie-Pacifique (Mumbai)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,48 USD	2,40 USD
Magistral Small 1.2	0,59 USD	1,76 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,35 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD
Mistral Large 3	0,59 USD	1,76 USD

Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,48 USD	2,40 USD
Magistral Small 1.2	0,61 USD	1,82 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,36 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD
Mistral Large 3	0,61 USD	1,82 USD

Régions : Europe (Irlande) et Europe (Milan)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,48 USD	2,40 USD
Magistral Small 1.2	0,59 USD	1,76 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,35 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD

Région : Europe (Londres)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,62 USD	3,10 USD
Magistral Small 1.2	0,78 USD	2,33 USD
Voxtral Mini 1.0	0,06 USD	0,06 USD
Voxtral Small 1.0	0,16 USD	0,47 USD
Ministral 3B 3.0	0,16 USD	0,16 USD
Ministral 8B 3.0	0,23 USD	0,23 USD
Ministral 14B 3.0	0,31 USD	0,31 USD

Région : Asie-Pacifique (Sydney)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,41 USD	2,06 USD
Magistral Small 1.2	0,5150 USD	1,5450 USD
Voxtral Mini 1.0	0,0412 USD	0,0412 USD
Voxtral Small 1.0	0,1030 USD	0,3090 USD
Ministral 3B 3.0	0,1030 USD	0,1030 USD
Ministral 8B 3.0	0,1545 USD	0,1545 USD
Ministral 14B 3.0	0,2060 USD	0,2060 USD
Mistral Large 3	0,5150 USD	1,5450 USD

Régions : Asie-Pacifique (Jakarta), Europe (Francfort), Europe (Stockholm)

Modèles Mistral	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Devstral 2 135B	0,48 USD	2,40 USD

Moonshot AI

Moonshot AI

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles Kimi	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Kimi K2 Thinking	0,60 USD	2,50 USD
Kimi K2.5	0,60 USD	3,00 USD

Région : Asie-Pacifique (Mumbai)

Modèles Kimi	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Kimi K2 Thinking	0,71 USD	2,94 USD
Kimi K2.5	0,72 USD	3,60 USD

Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles Kimi	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Kimi K2 Thinking	0,73 USD	3,03 USD
Kimi K2.5	0,72 USD	3,60 USD

Régions : Europe (Stockholm), Asie-Pacifique (Jakarta)

Modèles Kimi	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Kimi K2.5	0,72 USD	3,60 USD

Région : Asie-Pacifique (Sydney)

Modèles Kimi	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Kimi K2 Thinking	0,6180 USD	2,5750 USD
Kimi K2.5	0,6180 USD	3,0900 USD

NVIDIA

NVIDIA

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles NVIDIA	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
NVIDIA Nemotron Nano 2	0,06 USD	0,23 USD
NVIDIA Nemotron Nano 2 VL	0,20 USD	0,60 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,06 USD	0,24 USD

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles NVIDIA	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
NVIDIA Nemotron 3 Super 120B A12B	0,15 USD	0,65 USD

Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)

Modèles NVIDIA	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
NVIDIA Nemotron Nano 2	0,07 USD	0,27 USD
NVIDIA Nemotron Nano 2 VL	0,24 USD	0,71 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,07 USD	0,28 USD

Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles NVIDIA	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
NVIDIA Nemotron Nano 2	0,07 USD	0,28 USD
NVIDIA Nemotron Nano 2 VL	0,24 USD	0,73 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,07 USD	0.29 USD

Région : Europe (Londres)

Modèles NVIDIA	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
NVIDIA Nemotron Nano 2	0,09 USD	0,36 USD
NVIDIA Nemotron Nano 2 VL	0,31 USD	0,93 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,09 USD	0,37 USD

Région : Asie-Pacifique (Sydney)

Modèles NVIDIA	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
NVIDIA Nemotron Nano 2	0,0618 USD	0,2369 USD
NVIDIA Nemotron Nano 2 VL	0,2060 USD	0,6180 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,0618 USD	0,2472 USD

* La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard

OpenAI

OpenAI

gpt-oss-20b, 120b
gpt-oss-safeguard 20b, 120b

gpt-oss-20b, 120b

Standard
Priority
Flex
Lot
Personnalisation de modèle

Standard

Région : Asie-Pacifique (Sydney)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
gpt-oss-20b	0,0721 USD	0,3090 USD
gpt-oss-120b	0,1545 USD	0,6180 USD

Priority

Région : Asie-Pacifique (Sydney)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
gpt-oss-20b	0,1262 USD	0,5408 USD
gpt-oss-120b	0,2704 USD	1,0815 USD

Flex

Région : Asie-Pacifique (Sydney)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
gpt-oss-20b	0,0361 USD	0,1545 USD
gpt-oss-120b	0,0773 USD	0,3090 USD

Région : Asie-Pacifique (Sydney)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
gpt-oss-20b	0,0361 USD	0,1545 USD
gpt-oss-120b	0,0773 USD	0,3090 USD

Personnalisation de modèle

Personnalisation de modèle

Tarification du peaufinage par renforcement

Grâce à la fonctionnalité de peaufinage par renforcement d’Amazon Bedrock, vous pouvez améliorer la précision des modèles sans avoir besoin d’une expertise approfondie en machine learning ou de grandes quantités de données étiquetées. Amazon Bedrock automatise le flux de travail de peaufinage par renforcement : il prend en compte vos exemples d’invites, génère des modèles de réponses et attribue des notes à celles-ci à l’aide de votre fonction de récompense. Ces invites, réponses et notes servent ensuite à entraîner votre modèle via un flux de travail RFT itératif.

L’ensemble du flux de travail d’entraînement est facturé à un taux horaire. Une fois l’entraînement terminé, les clients peuvent immédiatement utiliser le modèle peaufiné qui en résulte pour effectuer des inférences à la demande. L’option d’inférence à la demande comprend un modèle de tarification basé sur des jetons qui facture en fonction du nombre de jetons traités lors de l’inférence.

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles OpenAI	Prix par heure d’entraînement	Prix par million de jetons d’entrée	Prix par million de jetons de sortie	Prix de stockage de chaque modèle entraîné par mois
gpt-oss-20b	80,00 USD	0,09 USD	0,39 USD	1,95 USD

gpt-oss-safeguard 20b, 120b

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GPT OSS Safeguard 20B	0,07 USD	0,20 USD
GPT OSS Safeguard 120B	0,15 USD	0,60 USD

Régions : Asie-Pacifique (Mumbai), Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GPT OSS Safeguard 20B	0,08 USD	0,24 USD
GPT OSS Safeguard 120B	0,18 USD	0,71 USD

Régions : Europe (Irlande) et Europe (Milan)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GPT OSS Safeguard 20B	0,08 USD	0,23 USD
GPT OSS Safeguard 120B	0,18 USD	0,70 USD

Région : Europe (Londres)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GPT OSS Safeguard 20B	0,11 USD	0,31 USD
GPT OSS Safeguard 120B	0,23 USD	0,93 USD

Région : Asie-Pacifique (Sydney)

Modèles OpenAI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GPT OSS Safeguard 20B	0,0721 USD	0,2060 USD
GPT OSS Safeguard 120B	0,1545 USD	0,6180 USD

Qwen

Amazon Bedrock

Qwen

Qwen3 Coder, 32B, 235B
Qwen 3 Next, VL, Coder Next

Qwen3 Coder, 32B, 235B

Standard
Priority
Flex
Lot
Personnalisation de modèle

Standard

Région : Asie-Pacifique (Sydney)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Coder 30B A3B	0,1545 USD	0,6180 USD
Qwen3 32B	0,1545 USD	0,6180 USD
Qwen3 235B A22B 2507	0,2266 USD	0,9064 USD

Priority

Région : Asie-Pacifique (Sydney)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Coder 30B A3B	0,2704 USD	1,0815 USD
Qwen3 32B	0,2704 USD	1,0815 USD
Qwen3 235B A22B 2507	0,3966 USD	1,5862 USD

Flex

Région : Asie-Pacifique (Sydney)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Coder 30B A3B	0,0773 USD	0,3090 USD
Qwen3 32B	0,0773 USD	0,3090 USD
Qwen3 235B A22B 2507	0,1133 USD	0,4532 USD

Région : Asie-Pacifique (Sydney)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Coder 30B A3B	0,0773 USD	0,3090 USD
Qwen3 32B	0,0773 USD	0,3090 USD
Qwen3 235B A22B 2507	0,1133 USD	0,4532 USD

Personnalisation de modèle

Personnalisation de modèle

Tarification du peaufinage par renforcement

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Qwen	Prix par heure d’entraînement	Prix par million de jetons d’entrée	Prix par million de jetons de sortie	Prix de stockage de chaque modèle entraîné par mois
Qwen3 32B	80,00 USD	0,20 USD	0,78 USD	1,95 USD

Qwen 3 Next, VL, Coder Next

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Next 80B A3B	0,15 USD	1,20 USD
Qwen3 VL 235B A22B	0,53 USD	2,66 USD
Qwen3 Coder Next	0,50 USD	1,20 USD

Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Next 80B A3B	0,18 USD	1,41 USD
Qwen3 VL 235B A22B	0,62 USD	3,13 USD
Qwen3 Coder Next	0,60 USD	1,44 USD

Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Next 80B A3B	0,18 USD	1,45 USD
Qwen3 VL 235B A22B	0,64 USD	3,22 USD
Qwen3 Coder Next	0,60 USD	1,44 USD

Région : Europe (Londres)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Next 80B A3B	0,23 USD	1,86 USD
Qwen3 VL 235B A22B	0,82 USD	4,12 USD
Qwen3 Coder Next	0,78 USD	1,86 USD

Régions : Europe (Francfort) et Asie-Pacifique (Jakarta)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Coder Next	0,60 USD	1,44 USD

Région : Asie-Pacifique (Sydney)

Modèles Qwen	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Qwen3 Next 80B A3B	0,1545 USD	1,2360 USD
Qwen3 VL 235B A22B	0,5459 USD	2,7398 USD
Qwen3 Coder Next	0,5150 USD	1,2360 USD

Stability AI

Stability AI

Tarification à la demande

Les modèles d’images de la génération précédente proposés par Stability AI sont facturés par image, en fonction du nombre d’étapes et de la résolution de l’image.

Région : Oregon, Virginie du Nord, Ohio

Stability AI Image Services	Prix par génération pour chaque modèle
Stable Image – Suppression d’arrière-plan	0,07 USD
Stable Image – Effacement d’objet	0,07 USD
Stable Image – Structure de contrôle	0,07 USD
Stable Image – Croquis de contrôle	0,07 USD
Stable Image – Guide de style	0,07 USD
Stable Image – Rechercher et remplacer	0,07 USD
Stable Image – Retoucher	0,07 USD
Stable Image – Rechercher et recoloriser	0,07 USD
Stable Image – Transfert de style	0,08 USD
Stable Image – Mise à l’échelle conservatrice	0,40 USD
Stable Image – Mise à l’échelle créative	0,60 USD
Stable Image – Mise à l’échelle rapide	0,03 USD
Stable Image – Outpaint	0,06 USD

TwelveLabs
TwelveLabs

Tarification à la demande
Inférence interrégionale mondiale

Inférence interrégionale géographique et intrarégionale

Inférence interrégionale mondiale

Inférence interrégionale géographique et intrarégionale
Writer

Writer

Tarification à la demande

Modèles Writer	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Palmyra X4	2,50 USD	10,00 USD
Palmyra X5	0,60 USD	6,00 USD

Z AI

Amazon Bedrock

Z AI

GLM 5
GLM 4.7
GLM 4.7 Flash

GLM 5

Tarification à la demande

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 5	1,00 USD	3,20 USD

GLM 4.7

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7	0,60 USD	2,20 USD

Régions : Asie-Pacifique (Jakarta), Asie-Pacifique (Mumbai), Asie-Pacifique (Tokyo), Amérique du Sud (São Paulo) et Europe (Stockholm)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7	0,72 USD	2,64 USD

Région : Asie-Pacifique (Sydney)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7	0,6180 USD	2,2660 USD

GLM 4.7 Flash

Tarification à la demande

Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7 Flash	0,07 USD	0,40 USD

Régions : Asie-Pacifique (Jakarta), Asie-Pacifique (Mumbai), Asie-Pacifique (Tokyo), Europe (Francfort), Europe (Irlande), Europe (Milan), Europe (Stockholm) et Amérique du Sud (São Paulo)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7 Flash	0,08 USD	0,48 USD

Région : Europe (Londres)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7 Flash	0,11 USD	0,62 USD

Région : Asie-Pacifique (Sydney)

Modèles Z AI	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
GLM 4.7 Flash	0,0721 USD	0,4120 USD

Importation de modèles personnalisés

Importation de modèles personnalisés

Llama

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version d'unité modèle personnalisée	v1.0
Prix par unité de modèle personnalisé par min*	0,05718 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Région : Europe (Francfort)

Version de l'unité de modèle personnalisé	v1.0
Prix par unité de modèle personnalisé par min*	0,07144 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.

*Facturé par créneaux de 5 minutes

Lama multimodal

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version d'unité modèle personnalisée	v1.0
Prix par unité de modèle personnalisé par min*	0,05718 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Région : Europe (Francfort)

Version de l'unité de modèle personnalisé	v1.0
Prix par unité de modèle personnalisé par min*	0,07144 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

*Facturé par tranches de cinq minutes

Mistral

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version d'unité modèle personnalisée	v1.0
Prix par unité de modèle personnalisé par min*	0,05718 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Région : Europe (Francfort)

Version de l'unité de modèle personnalisé	v1.0
Prix par unité de modèle personnalisé par min*	0,07144 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

*Facturé par tranches de cinq minutes

Mixtral

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version d'unité modèle personnalisée	v1.0
Prix par unité de modèle personnalisé par min*	0,05718 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Région : Europe (Francfort)

Version de l'unité de modèle personnalisé	v1.0
Prix par unité de modèle personnalisé par min*	0,07144 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

*Facturé par tranches de cinq minutes

Flan

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version d'unité modèle personnalisée	v1.0
Prix par unité de modèle personnalisé par min*	0,05718 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Région : Europe (Francfort)

Version de l'unité de modèle personnalisé	v1.0
Prix par unité de modèle personnalisé par min*	0,07144 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

*Facturé par tranches de cinq minutes

Tarification par inférence à la demande :
Vous êtes facturé dans des fenêtres de 5 minutes pour la durée pendant laquelle votre copie de modèle est active à compter de la première invocation réussie. La limite maximale de débit et de simultanéité par copie de modèle dépend de facteurs tels que la combinaison de jetons d’entrée/sortie, le type de matériel, la taille du modèle, l’architecture, les optimisations d’inférence et est déterminée lors du flux de travail d’importation du modèle.

Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : il existe un maximum par défaut de 3 copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.

Qwen

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version d'unité modèle personnalisée	v1.0
Prix par unité de modèle personnalisé par min*	0,05718 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

Région : Europe (Francfort)

Version de l'unité de modèle personnalisé	v1.0
Prix par unité de modèle personnalisé par min*	0,07144 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

*Facturé par tranches de cinq minutes

OpenAI

Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Version de l'unité de modèle personnalisé	v2.0
Prix par unité de modèle personnalisé par min*	0,1433 USD
Coût de stockage mensuel par unité de modèle personnalisé	1,95 USD

*Facturé par tranches de cinq minutes

Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : il existe un maximum par défaut de trois copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.

Bases de connaissances
Extraction de données structurées (génération SQL)

La récupération de données structurées est facturée pour chaque demande de génération d’une requête SQL. La requête SQL générée est utilisée pour récupérer les données à partir de magasins de données structurés.

Modèles Rerank

Les modèles Rerank sont conçus pour améliorer la pertinence et la précision des réponses dans les applications de génération à enrichissement contextuel (RAG). Ils sont facturés par requête.

**Le nombre de requêtes pouvant contenir jusqu’à 100 segments de document vous est facturé. Si la requête contient plus de 100 segments de document, elle est comptée comme plusieurs requêtes. Par exemple, si une demande contient 350 documents, elle sera traitée comme 4 demandes. Veuillez noter que chaque document ne peut contenir que 512 jetons (y compris le total des jetons de la requête et du document), et si la longueur du jeton est supérieure à 512 jetons, il est divisé en plusieurs documents. Une requête est équivalente à une unité de recherche.
Barrières de protection

Barrières de protection Amazon Bedrock

La tarification des barrières de protection Amazon Bedrock est basée sur les frais occasionnés par le filtre utilisé dans la barrière de protection. La tarification est la même pour le niveau Standard et le niveau Classic.

Filtre de barrières de protection*	Tarification
Filtres de contenu pour le niveau Standard et le niveau Classic (contenu textuel)	0,15 USD pour 1 000 unités de texte
Filtres de contenu (contenu d'image)	0,00075 USD par image traitée
Rubriques refusées pour le niveau Standard et le niveau Classic	0,15 USD pour 1 000 unités de texte
Filtres d’informations sensibles	0,10 USD pour 1 000 unités de texte
Filtres d’informations sensibles (expression régulière)	Gratuit
Filtres de mots	Gratuit
Vérifications de l’ancrage contextuel	0,10 USD pour 1 000 unités de texte
Vérifications du raisonnement automatisé	0,17 USD pour 1 000 unités de texte par politique de raisonnement automatisé

Tarification à la demande

* Chaque filtre de barrière de protections est facultatif et peut être activé en fonction des exigences de votre application. Des frais seront facturés en fonction du type de filtre utilisé pour la barrière de protections. Par exemple, si une barrière de protection est configurée avec des filtres de contenu et des sujets refusés, des frais seront facturés pour ces deux filtres, alors qu’aucun frais ne sera associé aux filtres d’informations sensibles.

Remarque : une unité de texte peut contenir jusqu'à 1 000 caractères. Si une saisie de texte comporte plus de 1 000 caractères, elle est traitée comme plusieurs unités de texte, chacune contenant 1 000 caractères ou moins. Par exemple, si une saisie de texte contient 5 600 caractères, elle sera facturée pour 6 unités de texte.

La vérification d'ancrage contextuelle utilise une source de référence et une requête pour déterminer si la réponse du modèle est fondée sur la source et pertinente pour la requête. Le nombre total d’unités de texte facturées est calculé en combinant tous les caractères de la source, de la requête et de la réponse du modèle.

Évaluation du modèle

Évaluation du modèle

L'évaluation du modèle est facturée pour l'inférence à partir du modèle que vous avez choisi. Les scores algorithmiques générés automatiquement sont fournis sans frais supplémentaires. Pour l’évaluation basée sur l’humain dans laquelle vous apportez votre propre flux de travail, l’inférence de modèle dans l’évaluation vous est facturée et des frais de 0,21 USD par tâche humaine effectuée vous sont facturés.

Si vous utilisez l’évaluation par RAG ou le LLM-juge dans l’évaluation des modèles, les jetons utilisés par le modèle juge sont facturés sur la base des prix du niveau Standard à la demande. Les invites du juge sont facturées dans le cadre de votre utilisation de jeton et sont disponibles dans la documentation publique. L’évaluation par RAG sur une base de connaissances Bedrock entraîne également des frais d’utilisation réguliers des bases de connaissances Bedrock.

Modèle

Prix pour 1 000 jetons d’entrée

Prix pour 1 000 jetons de sortie

Prix par tâche humaine

Modèle sélectionné pour l'évaluation

Sur la base du modèle sélectionné

0,21 USD

Automatisation des données
Automatisation des données

L’automatisation des données Amazon Bedrock transforme le contenu multimodal non structuré en formats de données structurées pour des cas d’utilisation tels que le traitement intelligent des documents, l’analyse vidéo et la génération à enrichissement contextuel (RAG). Bedrock Data Automation peut générer du contenu de sortie standard à l’aide de valeurs par défaut prédéfinies qui sont spécifiques à la modalité, comme des descriptions scène par scène de vidéos, des transcriptions audio ou une analyse automatique de documents. Les clients peuvent également créer des sorties personnalisées en spécifiant leurs exigences de sortie dans des plans en fonction de leur propre schéma de données, qu’ils peuvent ensuite facilement charger dans une base de données ou un entrepôt de données existant. Grâce à une intégration avec les bases de connaissances, l’automatisation des données Bedrock peut également servir à analyser le contenu des applications de RAG, pour ainsi améliorer la précision et la pertinence des résultats en incluant des informations intégrées à la fois dans les images et le texte.

Les bases de connaissances d’Amazon Bedrock proposent une intégration de l’automatisation des données Bedrock afin de fournir des réponses plus pertinentes et plus précises aux données multimodales. Lorsque vous configurez une base de connaissances, vous pouvez sélectionner Bedrock Data Automation comme méthode d’analyse pour analyser et extraire des informations pertinentes à partir d’images ou de documents, qui peuvent inclure des figures, des graphiques et des diagrammes. Au cours du traitement, Bedrock Data Automation extrait des informations pertinentes des documents et des images ingérés, qui sont ensuite utilisées dans les étapes suivantes de la base de connaissances pour le découpage, la vectorisation et le stockage. Lorsqu’elle est intégrée aux bases de connaissances, Bedrock Data Automation fournit et facture des résultats standardisés.
Routage des invites intelligent

Point de prix	Dimension de tarification	Plan tarifaire
Routage des invites intelligent	1 USD par tranche de 1 000 requêtes	À la demande

Routage des invites intelligent

Le routage des invites intelligent vous permet d'utiliser une combinaison de modèles de fondation (FM) de la même famille de modèles pour optimiser la qualité et les coûts. Par exemple, avec la famille de modèles Anthropic's Claude, Amazon Bedrock peut acheminer intelligemment les requêtes entre Claude 3.5 Sonnet et Claude 3 Haiku en fonction de la complexité de l'invite. De même, Amazon Bedrock peut acheminer les demandes entre Meta Llama 3.3 70B et 3.18B, et Nova Pro et Nova Lite. Le routeur des invites prédit quel modèle fournira les meilleures performances pour chaque demande, tout en optimisant la qualité de la réponse et les coûts. Cette fonction est particulièrement utile pour les applications telles que les assistants de service client, où les requêtes simples peuvent être traitées par des modèles plus petits, plus rapides et plus rentables, et où les requêtes complexes sont acheminées vers des modèles plus performants. Le routage des invites intelligent peut réduire les coûts jusqu’à 30 % sans compromettre la précision.

Optimisation des invites

Optimisation des invites pour Amazon Bedrock

Vous êtes facturé en fonction du nombre de jetons figurant dans les invites saisies et dans les invites optimisées.

Tous les frais sont facturés mensuellement à compter du 23 avril 2025.

Prix pour 1 000 jetons

0,030 USD

Exemples de tarification

AI21 labs

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD
Amazon

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Amazon Titan Text Lite pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base Amazon Titan Image Generator pour générer 1 000 images de taille 1 024 × 1 024 au format de qualité standard.

Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD

Tarification de la personnalisation (ajustement et pré-entraînement continu)

Un développeur d’applications personnalise un modèle Amazon Titan Image Generator à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer la performance du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot, + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 USD = 182,95 USD

Tarification du débit provisionné

Un développeur d’applications achète deux unités de modèles Amazon Titan Text Express avec un engagement d'un mois pour son cas d'utilisation de résumé de texte.

Coût mensuel total encouru = 2 unités de modèles x 18,40 USD/heure x 24 heures x 31 jours = 27 379,20 USD

Un développeur d’applications achète une unité de modèle du modèle de base Amazon Titan Image Generator avec un engagement d’un mois.

Coût total engagé = 1 unité de modèle * 16,20 USD * 24 heures * 31 jours = 12 052,80 USD
Barrières de protection Amazon Bedrock
Exemple 1 : chatbot d'assistance à la clientèle
Un développeur d'applications crée un chatbot d'assistance à la clientèle et utilise des filtres de contenu pour bloquer le contenu préjudiciable et les sujets refusés pour filtrer les requêtes et les réponses indésirables.

Le chatbot répond à 1 000 requêtes d'utilisateurs par heure. Chaque requête utilisateur a une longueur d'entrée moyenne de 200 caractères et reçoit une réponse FM de 1 500 caractères.

Chaque requête utilisateur de 200 caractères correspond à une unité de texte.

Chaque réponse FM de 1 500 caractères correspond à 2 unités de texte.

Unités de texte traitées chaque heure = (1 + 2) x 1 000 requêtes = 3 000 unités de texte

Coût total par heure pour les filtres de contenu et les sujets refusés = 3000 x (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

Exemple 2 : résumé des transcriptions d’un centre d’appels
Un développeur d'applications crée une application pour résumer les transcriptions des discussions entre les utilisateurs et les agents d’assistance. Il utilise un filtre d'informations sensibles pour supprimer les données d’identification personnelles (PII) dans les résumés générés pour 10 000 conversations.

Chaque résumé généré comporte en moyenne 3 500 caractères, ce qui correspond à 4 unités de texte.

Coût total engagé pour résumer 10 000 conversations = 10 000 * 4 * (0,1/1 000 USD) = 4 USD
Exemple 3 : moteur de vérification de protocole médical
Une entreprise de technologie médicale met en œuvre des vérifications du raisonnement automatisé dans son système d’aide à la décision clinique afin de valider les suggestions de traitement par rapport aux directives médicales.

Le système traite 5 000 cas de patients par mois. Chaque cas implique :
- Résumé des données du patient : 500 caractères (1 unité de texte)
- Évaluation du diagnostic : 2 000 caractères (2 unités de texte)
- Recommandation de traitement : 4 500 caractères (5 unités de texte)
Unités de texte traitées par mois = (1 + 2 + 5) * 5 000 cas = 40 000 unités de texte
Coût total encouru par mois pour les vérifications du raisonnement automatisé = 40 000 * 0,17 USD/1 000 = 6,80 USD
Amazon Bedrock Knowledge Bases

Exemple de tarification 1 (reclassement à l’aide du modèle Amazon Rerank 1.0)

Au cours d’un mois donné, vous soumettez 2 millions de demandes à l’API Rerank en utilisant le modèle Amazon Rerank 1.0 : 1 million de ces demandes contiennent moins de 100 documents chacune et seront donc facturées pour une demande chacune. Le million de demandes restant contient 120 à 150 documents. Par conséquent, chacune de ces demandes sera facturée pour 2 demandes.

Prix par demande = 0,001 USD
Coût total = 1 000 000 * 0.001 USD + 1 000 000 * 2 * 0.001 USD = 3 000 USD

Exemple de tarification 2 : (extraction de données structurées)

Un développeur d’applications crée un chatbot de support qui interroge les données structurées stockées dans Amazon Redshift. Le développeur crée une base de connaissances Bedrock et se connecte à Amazon Redshift. Le chatbot répond à 10 000 requêtes d’utilisateurs par heure. Chaque requête utilisateur coûtera 0,002 USD par API GenerateQuery pour générer du code SQL à partir d’une requête utilisateur.

Coût total encouru pour générer du code SQL par heure = 0,002 * 10 000 USD = 20 USD.
Coût total engagé au cours du mois = 20 USD * 24 * 30 = 1 440 USD
Anthropic

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Anthropic Claude pour résumer une entrée de 11 000 jetons de texte d’entrée en une sortie de 4 000 jetons.

Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Tarification du débit provisionné

Un développeur d’applications achète une unité de modèle Anthropic Claude Instant dans la région USA Ouest (Oregon) :

Coût mensuel total encouru = 1 unité de modèle * 39,60 USD * 24 heures * 31 jours = 29 462,40 USD
Cohere

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,0020 USD = 0,013 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command - Light pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Embed anglais ou multilingue pour générer des intégrations pour 10 000 jetons d’entrée.

Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD

Tarification de la personnalisation (ajustement)

Un développeur d’applications personnalise un modèle Cohere Command à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,50 USD) = 55,45 USD

Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 39,60 USD

Tarification du débit provisionné

Un développeur d’applications achète une unité de modèle de Cohere Command avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

Coût mensuel total encouru = 1 unité de modèle * 39,60 USD * 24 heures * 31 jours = 29 462,40 USD
Importation de modèles personnalisés

Exemple de tarification : un développeur d'applications importe un modèle de type Llama 3.1 personnalisé d'une taille de paramètre 8B avec une longueur de séquence de 128 Ko dans la région us-est-1 et supprime le modèle au bout d'un mois. Cela nécessite 2 unités de modèle personnalisées. Ainsi, le prix par minute sera de 0,1570 USD car 2 unités de modèle personnalisées sont requises. Les coûts de stockage des modèles pour 2 unités modèles personnalisées seraient de 3,90 USD par mois.

L’importation du modèle est gratuite. La première invocation réussie a lieu à 8 h 03, heure à laquelle le comptage commence. Les fenêtres de comptage de 5 minutes vont de 8 h 03 à 8 h 07 ; de 8 h 07 à 8 h 11, etc. S’il y a au moins une invocation pendant une période de 5 minutes, la fenêtre sera considérée comme active pour la facturation. S’il y a une invocation à 8 h 03 et aucune autre invocation après 8 h 07, le comptage s’arrêtera à 8 h 07. Dans ce cas, la facture serait calculée comme suit : 0,1570 USD * 5 minutes * 1 tranche de 5 minutes = 0,785 USD.
Data Automation

Exemple de tarification 1 :
Supposons que vous traitiez un document de 1 000 pages à l’aide de la sortie standard BDA. Les 1 000 pages sont traitées à l’aide du plan 1 qui comporte 15 champs. Le prix par page pour tout plan comportant 30 champs ou moins est de 0,040 USD. Le coût total s’élèverait à 40 USD.

Nombre total de pages traitées = 1 000
Prix par page pour les plans comportant moins de 30 champs = 0,040 USD
Coût total = 1 000 USD * 0.040 = 40 USD

Exemple de tarification 2 :
Supposons que vous traitiez 2 documents à l’aide de la sortie standard BDA. Le document 1 compte 40 pages et est traité à l’aide du plan 1 qui comporte 20 champs. Le document 2 compte 10 pages et est traité à l’aide du plan 2, qui comporte 40 champs. Le prix par page du plan 1 est de 0,040 USD, car il contient 30 champs ou moins. Le prix par page du plan 2 est de 0,045 USD. Le coût de traitement du document 1 à l’aide du plan 1 est de 1,60 USD. Le coût de traitement du document 2 à l’aide du plan 2 est de 0,45 USD. Le coût total du traitement des deux documents serait de 2,05 USD.

Nombre total de pages traitées = 50
Prix par page pour le Plan 1 contenant moins de 30 champs = 0,040 USD
Prix par page pour le Plan 2 avec 40 champs = 0,040 USD + (nombre de champs supplémentaires supérieurs à 30 * 0,0005 USD par champ)
Nombre de champs supplémentaires supérieur à 30 = 40 - 30 = 10
Prix par page pour le Plan 2 avec 40 champs = 0,040 USD + (10 *0,0005 USD par champ) = 0,045 USD
Frais pour le document 1 utilisant le plan 1 = 40 pages x 0,040 USD par page = 1,6 USD
Frais pour le document 2 utilisant le plan 2 = 10 pages x 0,045 USD par page = 0,45 USD
Frais totaux = Frais pour le document 1 + Frais pour le document 2 = 1,6 USD + 0,45 USD = 2,05 USD

Exemple de tarification 3 :
Supposons que vous configuriez les bases de connaissances Bedrock pour utiliser Bedrock Data Automation comme analyseur, puis que vous ingériez un document de 1 000 pages. Notez que les structures de coûts diffèrent entre les options d'analyse des bases de connaissances. BDA utilise une tarification par page, tandis que les analyseurs du modèle de fondation facturent en fonction des jetons d'entrée et de sortie. À titre de contexte, le traitement de 1 000 pages, dont 30 % contiennent des tableaux et 30 % des figures, nécessite généralement 2 900 jetons d'entrée et 750 jetons de sortie. La consommation de jetons varie en fonction du type de contenu. Les clients sont donc invités à effectuer des tests en utilisant leurs propres données pour obtenir des estimations plus précises. L’intégration des bases de connaissances Bedrock et de Bedrock Data Automation utilise une sortie standard, dont le prix par page est de 0,010 USD. Le coût total s’élèverait à 10 USD.

Nombre total de pages traitées = 1 000
Prix par page pour la sortie standard = 0,010 USD
Coût total = 1 000 * 0,010 USD = 10 USD

Exemple de tarification 4 :
Supposons que vous traitez une vidéo de 60 minutes à l’aide de la sortie standard BDA. Le prix par minute pour la sortie vidéo standard est de 0,050 USD. Le coût total s’élèverait à 3,00 USD.

Nombre total de minutes traitées = 60
Prix par minute pour la sortie vidéo standard = 0,050 USD
Coût total = 60 * 0.050 USD = 3,00 USD

Exemple de tarification 5 :
Supposons que vous traitiez 2 000 images à l’aide de la sortie personnalisée BDA. Les 1 000 premières images sont traitées à l’aide du plan 1, qui comporte 10 champs. Les 1 000 dernières images sont traitées à l’aide du plan 2, qui comporte 40 champs. Le prix par image pour le plan 1 est de 0,005 USD, car il contient 30 champs ou moins. Le prix par image du plan 2 est de 0,01 USD. Le coût de traitement des 1 000 premières images à l’aide du plan 1 est de 5,00 USD. Le coût de traitement des 1 000 dernières images à l’aide du plan 2 est de 10,00 USD. Le coût total du traitement des 2 000 images serait de 15,00 USD

Coût des 1 000 premières images = 1 000 images * 0,005 USD par image = 5,00 USD
Coût pour 1 000 dernières images = 1 000 images * (0,005 USD + (nombre de champs supplémentaires supérieurs à 30 *0,0005 USD par champ))
= 1 000 * (0,005 USD + ((40 - 30) *0,0005 USD))
= 1 000 * (0,005 USD + (10 * 0,0005 USD)) = 10,00 USD
Coût total = 5,00 USD + 10,00 USD = 15,00 USD

Exemple de tarification 6 :
Supposons que vous souhaitiez utiliser la sortie standard de Bedrock Data Automation pour traiter 15 000 minutes d’enregistrements audio de réunions dans votre organisation. Le coût total du traitement des 15 000 minutes audio serait de 90 USD.

Nombre total de minutes traitées = 15 000 minutes
Coût total = 15 000 min * 0,006 USD = 90 USD
DeepSeek

Tarification à la demande

Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle DeepSeek-R1 pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons (y compris des jetons de raisonnement) :

Coût horaire total encouru = 2 000 jetons/1000 * 0,00135 USD + 1 000 jetons/1 000 * 0,0054 USD = 0,0081 USD
Flux

Exemple : résumé des actualités
Un développeur d’applications crée un flux pour automatiser la synthèse des actualités pour les traders. Le flux comprend un nœud d’entrée qui prend un emplacement S3 et un nœud de récupération S3 qui récupère 10 fichiers contenant des articles de 10 agences de presse majeures dans S3 (2 transitions de nœuds). Il utilise ensuite un nœud itérateur pour invoquer un modèle avec un nœud d’invite pour résumer chaque fichier (+ 10 fichiers x 2 transitions de nœuds). Il collecte ensuite tous les résultats à l’aide d’un nœud collecteur, écrit les résultats dans S3 à l’aide d’un nœud de stockage S3 et les complète dans un nœud de sortie (+ 3 transitions de nœud). Ils font fonctionner ce flux toutes les demi-heures de chaque jour de la semaine.

Le nombre de transitions de nœuds par exécution de flux est le suivant : 2 + 1 + 10 * 2 + 3 = 25 transitions de nœuds par exécution de flux

Le nombre d’exécutions de flux par mois est de : 24 heures * 2 * 5 jours * 4 semaines = 960 exécutions de flux par mois.

La facture mensuelle totale est de : 25 * 960 * 0,035 USD / 1 000 = 0,84 USD

Frais supplémentaires
La facture inclura également des frais supplémentaires pour les services AWS utilisés dans l’exécution du flux de travail, notamment l’utilisation d’Amazon S3 dans les nœuds de récupération et de stockage, et l’utilisation du modèle de fondation Amazon Bedrock dans le nœud d’invite.
Meta

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Meta Llama 2 Chat (13B) pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.

Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD

Tarification de la personnalisation (ajustement)

Un développeur d’applications personnalise le modèle Llama 2 Pretrained (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.

Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,50 USD) = 33,44 USD

Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 21,18 USD

Tarification du débit provisionné

Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

Coût mensuel total encouru = 1 unité de modèle * 21,18 USD * 24 heures * 31 jours = 15 757,92 USD
Mistral AI

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

Coût horaire total encouru = 2 000 jetons/1 000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

Coût horaire total encouru = 2 000 jetons/1 000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD

Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons.

Coût horaire total encouru = 2 000 jetons/1 000 * 0,008 USD + 1 000 jetons/1 000 * 0,024 USD = 0,04 USD

Évaluation des modèles

Exemple d'évaluation des modèles 1 :

Le jeu de données contient 50 invites, et le développeur a besoin d’un travailleur pour évaluer chaque ensemble invite-réponse (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »).

Cette tâche d'évaluation comportera 50 tâches (1 tâche pour chaque paire d’invite-réponse par travailleur). Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.

Les frais suivants sont encourus pour ce travail d'évaluation de modèles :

Élément	Nombre de jetons d'entrée	Prix pour 1000 jetons d'entrée	Coût des intrants	Nombre de jetons de sortie	Prix pour 1000 jetons de sortie	Coût de production	Nombre de tâches humaines	Prix par tâche humaine	Coût des tâches humaines	Total
Inférence instantanée Claude	5 000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5 000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Tâches humaines							50	0,21 USD	10,50 USD	10,50 USD
Total										11,06 USD

Exemple d'évaluation du modèle 2 :

Tarification à la demande
Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).

Le jeu de données contient 50 invites, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble invites-réponses (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »). Ce travail d'évaluation comportera 100 tâches (1 tâche pour chaque ensemble invites-réponses par travailleur : 2 travailleurs x 50 ensembles invites-réponses = 100 tâches humaines).

Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.

Les frais suivants sont encourus pour ce travail d'évaluation de modèles :

Élément	Nombre de jetons d'entrée	Prix pour 1000 jetons d'entrée	Coût des intrants	Nombre de jetons de sortie	Prix pour 1000 jetons de sortie	Coût de production	Nombre de tâches humaines	Prix par tâche humaine	Coût des tâches humaines	Total
Inférence instantanée Claude	5 000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5 000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Tâches humaines							100	0,21 USD	21,00 USD	21,00 USD
Total										21,56 USD

Optimisation des invites

Exemple : résumé des actualités
Un développeur d'applications crée une invite pour résumer les actualités pour les traders à l'aide de Claude 3.5. L'invite d'origine comprend 429 jetons. L'invite optimisée comporte 511 jetons et comprend des instructions et des exemples plus spécifiques pour générer une réponse plus concise à partir des FM. Il utilise l'invite optimisée avec 511 jetons comme entrée pour l'optimiseur d'invite, et crée 2 nouvelles variantes pour Claude 3.7 et Nova Pro avec 582 et 579 jetons.

Nombre total de jetons d'entrée et de sortie pour une optimisation d’invite : 429 + 511 + 511 + 582 + 511 + 579 = 3 123

La facture mensuelle totale est de : 3 123/1 000 * 0,03 USD = 0,09 USD
Stability AI

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille d’étape de 70 (qualité supérieure).

Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.0 pour générer une image de 1 024 x 1 024 avec une taille d’étape de 70 (qualité supérieure).

Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD

Tarification du débit provisionné

Un développeur d’applications achète une unité de modèle de SDXL 1.0 avec un engagement d’un mois.

Coût total = 1 * 49,86 USD * 24 heures * 31 jours = 37 095,84 USD
TwelveLabs

Tarification à la demande

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Pegasus 1.2 pour décrire ce qu’implique une vidéo de 10 secondes, qui fournit une sortie de 2 000 jetons.

Coût total = 10 secondes * 0,00049 USD + 2 000 jetons / 1 000 * 0,0075 USD = 0,0199 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Marengo Embed [3.0 ou 2.7] pour intégrer 10 vidéos, d’une durée combinée de 100 minutes.

Coût total encouru = 100 minutes (6 000 secondes) * 0,00070 USD = 4,2 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Marengo Embed 3.0 pour générer, sur la base d’un texte et d’une image fournis ensemble, une intégration qui pourrait être utilisée pour trouver le clip contenant le sac affiché dans l’image donnée, dans le référentiel d’intégration créé en utilisant l’exemple ci-dessus.

Coût total encouru = 1 demande texte * 0,00007 USD +1 demande image * 0,0001 USD = 0,00017 USD

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Marengo Embed [3.0 ou 2.7] en fournissant un texte pour générer une intégration qui pourrait être utilisée pour trouver les clips correspondants dans le référentiel d’intégration créé en utilisant l’exemple ci-dessus.

Coût total encouru = 1 demande texte * 0,00007 USD = 0,00007 USD
Writer

Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Palmyra X5 de Writer pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

Coût total encouru = 10 000 jetons/1000 x 0,003 USD + 2 000 jetons/1000 x 0,015 USD = 0,06 USD

Étapes suivantes

Atelier

Explorez les cas d’utilisation courants d’Amazon Bedrock grâce à un atelier guidé

Voir l’atelier

Démonstration

Voir des démonstrations des fonctionnalités d’Amazon Bedrock

Explorez la bibliothèque de démonstrations

Modèles Meta	Prix par million de jetons d’entrée	Prix par million de jetons de sortie
Lama 2 Chat (13B)	0,75 USD	1,00 USD
Llama 2 Chat (70B)	1,95 USD	2,56 USD

Modèles Meta	Prix pour entraîner un million de jetons	*Prix pour stocker chaque modèle personnalisé par mois**	Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement)
Llama 2 Pretrained (13B)	1,49 USD	1,95 USD	23,50 USD
Llama 2 Pretrained (70B)	7,99 USD	1,95 USD	23,50 USD

Modèles Meta	Tarif horaire par unité modèle pour un engagement d’un mois	Tarif horaire par unité de modèle pour un engagement de six mois
Llama 2 Pretrained et Chat (13B)	21,18 USD	13,08 USD
Llama 2 Pretrained (70B)	21,18 USD	13,08 USD

Tarification d’Amazon Bedrock

Tarification des modèles

AI21 Labs

Amazon Nova

Tarification des modèles de compréhension

Inférence inter-régions mondiale

Inférence géographique interrégionale et intrarégionale

Outils intégrés

Tarification des modèles de génération de contenu créatif

Tarification des modèles de compréhension et de génération de la parole

Tarification à la demande pour les modèles de fondation de synthèse vocale

Tarification des modèles de vectorisation

Amazon Titan

Anthropic

Tarification du niveau Reserved

Cohere

DeepSeek

Google

Tarification à la demande

Meta

MiniMax AI

Mistral AI

Moonshot AI

NVIDIA

OpenAI

Qwen

Stability AI

TwelveLabs

Writer

Z AI

Importation de modèles personnalisés

Barrières de protection Amazon Bedrock

Évaluation du modèle

Automatisation des données

Optimisation des invites pour Amazon Bedrock

Exemples de tarification

AI21 labs

Amazon

Tarification à la demande

Tarification de la personnalisation (ajustement et pré-entraînement continu)

Tarification du débit provisionné

Barrières de protection Amazon Bedrock

Amazon Bedrock Knowledge Bases

Anthropic

Tarification à la demande

Tarification du débit provisionné

Cohere

Tarification à la demande

Tarification de la personnalisation (ajustement)

Importation de modèles personnalisés

Data Automation

DeepSeek

Flux

Meta

Tarification à la demande

Tarification de la personnalisation (ajustement)

Tarification du débit provisionné

Mistral AI

Tarification à la demande

Évaluation des modèles

Exemple d'évaluation des modèles 1 :

Exemple d'évaluation du modèle 2 :

Optimisation des invites

Stability AI

Tarification à la demande

Tarification du débit provisionné

TwelveLabs

Writer

Étapes suivantes

Explorez les cas d’utilisation courants d’Amazon Bedrock grâce à un atelier guidé

Voir des démonstrations des fonctionnalités d’Amazon Bedrock

Apprendre

Ressources

Développeurs

Aide