- AWS
- Amazon Bedrock
- Tarification
Tarification d’Amazon Bedrock
-
Tarification des modèles
-
Bases de connaissances
-
Barrières de protection
-
Évaluation du modèle
-
Automatisation des données
-
Routage des invites intelligent
-
Optimisation des invites
-
Tarification des modèles
-
Tarification des modèles
La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.
Amazon Bedrock prend en charge différents niveaux, notamment les niveaux Standard, Flex, Priority et Reserved. Cliquez pour en savoir plus sur les niveaux de service.
Amazon Bedrock propose certains modèles de fondation (FM) provenant des principaux fournisseurs d’IA tels qu’Anthropic, Meta, Mistral AI et Amazon pour l’inférence par lots à un prix 50 % inférieur à celui de la tarification d’inférence à la demande. Pour en savoir plus sur le mode Lot, cliquez sur ici. Veuillez vous référer à la ici.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
DeepSeek
-
Google
-
Luma AI
-
Meta
-
MiniMax AI
-
Mistral AI
-
Moonshot AI
-
NVIDIA
-
OpenAI
-
Qwen
-
Stability AI
-
TwelveLabs
-
Writer
-
Z AI
-
Importation de modèles personnalisés
-
AI21 Labs
-
AI21 Labs
Tarification à la demande
-
Amazon
-
-
Amazon Nova
-
Amazon Titan
-
Autres Amazon
-
Amazon Nova
-
Amazon Nova
Tarification des modèles de compréhension
Inférence inter-régions mondiale
Inférence géographique interrégionale et intrarégionale
Outils intégrés
Tarification des modèles de génération de contenu créatif
Tarification des modèles de compréhension et de génération de la parole
Tarification à la demande pour les modèles de fondation de synthèse vocale
Remarque : *la tarification d’entrée et de sortie des jetons de texte s’applique à des cas d’utilisation spécifiques tels que la transcription parole-texte, les appels d’outils pour l’achèvement de tâches ou l’ancrage des connaissances, l’ajout d’un historique des conversations à la session, etc.
L’inférence à la demande pour les modèles Nova personnalisés est proposée au même prix que l’inférence Nova de base.
Tarification des modèles de vectorisation
-
Amazon Titan
-
Amazon Titan
-
Autres Amazon
-
-
-
Anthropic
-
Anthropic
Tarification à la demande et par lots
Modèles à accès étendu
Fournisseur Nom du modèle Régions Prix par million de jetons d’entrée Prix par million de jetons de sortie Prix par million de jetons d’entrée (lot) Prix par million de jetons de sortie (lot) Prix par million de jetons d’entrée (écriture dans le cache) Prix par million de jetons d’entrée (lecture du cache) Anthropic Claude 3.5 Sonnet (accès public étendu, à compter du 1er décembre 2025) USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), Europe (Francfort), Europe (Irlande), Europe (Zurich), Europe (Paris) 6,00 USD 30,00 USD 3,00 USD 15,00 USD N/A N/A Anthropic Claude 3.5 Sonnet v2 (accès public étendu, à compter du 1er décembre 2025) USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon) 6,00 USD 30,00 USD 3,00 USD 15,00 USD 7,50 USD 0,60 USD Tarification du niveau Reserved
Inférence optimisée en termes de latence
Tarification du débit alloué
Pour connaître la tarification du débit alloué, veuillez contacter l’équipe chargée de votre compte.
-
Cohere
-
Cohere
Tarification à la demande
Modèles Cohere Prix pour 1 000 requêtes** Rerank 3.5 2,00 USD **Le nombre de requêtes pouvant contenir jusqu’à 100 segments de document vous est facturé. Si la requête contient plus de 100 segments de document, elle est comptée comme plusieurs requêtes. Par exemple, si une demande contient 350 documents, elle sera traitée comme 4 demandes. Veuillez noter que chaque document ne peut contenir que 500 jetons (y compris le total des jetons de la requête et du document), et si la longueur du jeton est supérieure à 512 jetons, il est divisé en plusieurs documents. Tarification pour la personnalisation (ajustement)
* Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement x nombre d’époques
Tarification du débit provisionné
Modèles Cohere Prix par heure et par modèle
sans engagementTarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois
Command de Cohere
49,5 USD 39,60 USD
23,77 USD
Cohere Command - Light 8,56 USD 6,85 USD
4,11 USD Intégrer 3 anglais 7,12 USD 6,76 USD
6,41 USD Intégrer 3 multilingue 7,12 USD 6,76 USD
6,41 USD Veuillez contacter votre compte AWS ou votre équipe de vente pour plus de détails sur les modèles d'unités.
-
DeepSeek
-
DeepSeek
Tarification à la demande
-
Standard
-
Priority
-
Flex
-
Standard
-
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles DeepSeek Prix par million de jetons d’entrée Prix par million de jetons de sortie DeepSeek v3.2 0,62 USD 1,85 USD Régions : Asie-Pacifique (Mumbai), Amérique du Sud (São Paulo), Asie-Pacifique (Jakarta), Asie-Pacifique (Tokyo) et Europe (Stockholm)
Modèles DeepSeek Prix par million de jetons d’entrée Prix par million de jetons de sortie DeepSeek v3.2 0,74 USD 2,22 USD Région : Asie-Pacifique (Sydney)
Modèles DeepSeek Prix par million de jetons d’entrée Prix par million de jetons de sortie DeepSeek v3.1 0,5974 USD 1,7304 USD DeepSeek v3.2 0,6386 USD 1,9055 USD -
Priority
-
Région : Asie-Pacifique (Sydney)
Modèles DeepSeek Prix par million de jetons d’entrée Prix par million de jetons de sortie DeepSeek v3.1 1,0455 USD 3,0282 USD -
Flex
-
Région : Asie-Pacifique (Sydney)
Modèles DeepSeek Prix par million de jetons d’entrée Prix par million de jetons de sortie DeepSeek v3.1 0,2987 USD 0,8652 USD
-
-
Google
-
Google
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles Google Prix par million de jetons d’entrée Prix par million de jetons de sortie Gemma 3 4B 0,04 USD 0,08 USD Gemma 3 12B 0,09 USD 0.29 USD Gemma 3 27B 0,23 USD 0,38 USD Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)
Modèles Google Prix par million de jetons d’entrée Prix par million de jetons de sortie Gemma 3 4B 0,05 USD 0,09 USD Gemma 3 12B 0,11 USD 0,34 USD Gemma 3 27B 0,27 USD 0,45 USD Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles Google Prix par million de jetons d’entrée Prix par million de jetons de sortie Gemma 3 4B 0,05 USD 0,10 USD Gemma 3 12B 0,11 USD 0,35 USD Gemma 3 27B 0,28 USD 0.46 USD Région : Europe (Londres)
Modèles Google Prix par million de jetons d’entrée Prix par million de jetons de sortie Gemma 3 4B 0,06 USD 0,12 USD Gemma 3 12B 0,14 USD 0,45 USD Gemma 3 27B 0,36 USD 0,59 USD Région : Asie-Pacifique (Sydney)
Modèles Google Prix par million de jetons d’entrée Prix par million de jetons de sortie Gemma 3 4B 0,0412 USD 0,0824 USD Gemma 3 12B 0,0927 USD 0,2987 USD Gemma 3 27B 0,2369 USD 0,3914 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex est réduite de 50 % par rapport à la tarification du niveau Standard -
Luma AI
-
Tarification à la demande
-
Meta
-
Meta
Llama 4
Tarification à la demande et par lots
Llama 3.3
Tarification à la demande et par lots
Llama 3.2
Tarification à la demande et par lots
Tarification pour la personnalisation de modèle (peaufinage)
Tarification du débit provisionné
Llama 3.1
Tarification à la demande et par lots
Tarification pour la personnalisation de modèle (ajustement)
Tarification du débit provisionné
Llama 3
Tarification à la demande
Llama 2
Tarification à la demande
Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Meta Prix par million de jetons d’entrée Prix par million de jetons de sortie Lama 2 Chat (13B)
0,75 USD
1,00 USD
Llama 2 Chat (70B) 1,95 USD
2,56 USD Tarification pour la personnalisation de modèle (peaufinage)
Modèles Meta Prix pour entraîner un million de jetons Prix pour stocker chaque modèle personnalisé* par mois Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement) Llama 2 Pretrained (13B)
1,49 USD
1,95 USD
23,50 USD
Llama 2 Pretrained (70B) 7,99 USD
1,95 USD 23,50 USD *Stockage de modèles personnalisés = 1,95 USD
Tarification du débit provisionné
Modèles Meta Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité de modèle pour un engagement de six mois Llama 2 Pretrained et Chat (13B)
21,18 USD
13,08 USD
Llama 2 Pretrained (70B) 21,18 USD
13,08 USD *Les modèles préentraînés de Llama 2 ne sont disponibles qu’en débit provisionné après personnalisation.
Veuillez contacter votre compte AWS ou votre équipe de vente pour plus de détails sur les modèles d’unités.
-
MiniMax AI
-
MiniMax AI
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie MiniMax M2 0,30 USD 1,20 USD Minimax M2.1 0,30 USD 1,20 USD Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie Minimax M2.5 0,30 USD 1,20 USD Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie MiniMax M2 0,35 USD 1,41 USD Minimax M2.1 0,36 USD 1,44 USD Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie MiniMax M2 0,36 USD 1,45 USD Minimax M2.1 0,36 USD 1,44 USD Région : Europe (Londres)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie MiniMax M2 0,47 USD 1,86 USD Minimax M2.1 0,47 USD 1,86 USD Régions : Europe (Francfort), Europe (Stockholm), Asie-Pacifique (Jakarta)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie Minimax M2.1 0,36 USD 1,44 USD Région : Asie-Pacifique (Sydney)
Modèles MiniMax Prix par million de jetons d’entrée Prix par million de jetons de sortie MiniMax M2 0,3090 USD 1,2360 USD Minimax M2.1 0,3090 USD 1,2360 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex est réduite de 50 % par rapport à la tarification du niveau Standard -
Mistral AI
-
Mistral AI
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,40 USD 2,00 USD Magistral Small 1.2 0,50 USD 1,50 USD Voxtral Mini 1.0 0,04 USD 0,04 USD Voxtral Small 1.0 0,10 USD 0,30 USD Ministral 3B 3.0 0,10 USD 0,10 USD Ministral 8B 3.0 0,15 USD 0,15 USD Ministral 14B 3.0 0,20 USD 0,20 USD Mistral Large 3 0,50 USD 1,50 USD Régions : Asie-Pacifique (Mumbai)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,48 USD 2,40 USD Magistral Small 1.2 0,59 USD 1,76 USD Voxtral Mini 1.0 0,05 USD 0,05 USD Voxtral Small 1.0 0,12 USD 0,35 USD Ministral 3B 3.0 0,12 USD 0,12 USD Ministral 8B 3.0 0,18 USD 0,18 USD Ministral 14B 3.0 0,24 USD 0,24 USD Mistral Large 3 0,59 USD 1,76 USD Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,48 USD 2,40 USD Magistral Small 1.2 0,61 USD 1,82 USD Voxtral Mini 1.0 0,05 USD 0,05 USD Voxtral Small 1.0 0,12 USD 0,36 USD Ministral 3B 3.0 0,12 USD 0,12 USD Ministral 8B 3.0 0,18 USD 0,18 USD Ministral 14B 3.0 0,24 USD 0,24 USD Mistral Large 3 0,61 USD 1,82 USD Régions : Europe (Irlande) et Europe (Milan)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,48 USD 2,40 USD Magistral Small 1.2 0,59 USD 1,76 USD Voxtral Mini 1.0 0,05 USD 0,05 USD Voxtral Small 1.0 0,12 USD 0,35 USD Ministral 3B 3.0 0,12 USD 0,12 USD Ministral 8B 3.0 0,18 USD 0,18 USD Ministral 14B 3.0 0,24 USD 0,24 USD Région : Europe (Londres)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,62 USD 3,10 USD Magistral Small 1.2 0,78 USD 2,33 USD Voxtral Mini 1.0 0,06 USD 0,06 USD Voxtral Small 1.0 0,16 USD 0,47 USD Ministral 3B 3.0 0,16 USD 0,16 USD Ministral 8B 3.0 0,23 USD 0,23 USD Ministral 14B 3.0 0,31 USD 0,31 USD Région : Asie-Pacifique (Sydney)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,41 USD 2,06 USD Magistral Small 1.2 0,5150 USD 1,5450 USD Voxtral Mini 1.0 0,0412 USD 0,0412 USD Voxtral Small 1.0 0,1030 USD 0,3090 USD Ministral 3B 3.0 0,1030 USD 0,1030 USD Ministral 8B 3.0 0,1545 USD 0,1545 USD Ministral 14B 3.0 0,2060 USD 0,2060 USD Mistral Large 3 0,5150 USD 1,5450 USD Régions : Asie-Pacifique (Jakarta), Europe (Francfort), Europe (Stockholm)
Modèles Mistral Prix par million de jetons d’entrée Prix par million de jetons de sortie Devstral 2 135B 0,48 USD 2,40 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex est réduite de 50 % par rapport à la tarification du niveau Standard -
Moonshot AI
-
Moonshot AI
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles Kimi Prix par million de jetons d’entrée Prix par million de jetons de sortie Kimi K2 Thinking 0,60 USD 2,50 USD Kimi K2.5 0,60 USD 3,00 USD Région : Asie-Pacifique (Mumbai)
Modèles Kimi Prix par million de jetons d’entrée Prix par million de jetons de sortie Kimi K2 Thinking 0,71 USD 2,94 USD Kimi K2.5 0,72 USD 3,60 USD Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles Kimi Prix par million de jetons d’entrée Prix par million de jetons de sortie Kimi K2 Thinking 0,73 USD 3,03 USD Kimi K2.5 0,72 USD 3,60 USD Régions : Europe (Stockholm), Asie-Pacifique (Jakarta)
Modèles Kimi Prix par million de jetons d’entrée Prix par million de jetons de sortie Kimi K2.5 0,72 USD 3,60 USD Région : Asie-Pacifique (Sydney)
Modèles Kimi Prix par million de jetons d’entrée Prix par million de jetons de sortie Kimi K2 Thinking 0,6180 USD 2,5750 USD Kimi K2.5 0,6180 USD 3,0900 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex est réduite de 50 % par rapport à la tarification du niveau Standard -
NVIDIA
-
NVIDIA
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles NVIDIA Prix par million de jetons d’entrée Prix par million de jetons de sortie NVIDIA Nemotron Nano 2 0,06 USD 0,23 USD NVIDIA Nemotron Nano 2 VL 0,20 USD 0,60 USD NVIDIA Nemotron 3 Nano 30B A3B 0,06 USD 0,24 USD Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles NVIDIA Prix par million de jetons d’entrée Prix par million de jetons de sortie NVIDIA Nemotron 3 Super 120B A12B 0,15 USD 0,65 USD Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)
Modèles NVIDIA Prix par million de jetons d’entrée Prix par million de jetons de sortie NVIDIA Nemotron Nano 2 0,07 USD 0,27 USD NVIDIA Nemotron Nano 2 VL 0,24 USD 0,71 USD NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,28 USD Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles NVIDIA Prix par million de jetons d’entrée Prix par million de jetons de sortie NVIDIA Nemotron Nano 2 0,07 USD 0,28 USD NVIDIA Nemotron Nano 2 VL 0,24 USD 0,73 USD NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0.29 USD Région : Europe (Londres)
Modèles NVIDIA Prix par million de jetons d’entrée Prix par million de jetons de sortie NVIDIA Nemotron Nano 2 0,09 USD 0,36 USD NVIDIA Nemotron Nano 2 VL 0,31 USD 0,93 USD NVIDIA Nemotron 3 Nano 30B A3B 0,09 USD 0,37 USD Région : Asie-Pacifique (Sydney)
Modèles NVIDIA Prix par million de jetons d’entrée Prix par million de jetons de sortie NVIDIA Nemotron Nano 2 0,0618 USD 0,2369 USD NVIDIA Nemotron Nano 2 VL 0,2060 USD 0,6180 USD NVIDIA Nemotron 3 Nano 30B A3B 0,0618 USD 0,2472 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard -
OpenAI
-
OpenAI
-
gpt-oss-20b, 120b
-
gpt-oss-safeguard 20b, 120b
-
gpt-oss-20b, 120b
-
-
Standard
-
Priority
-
Flex
-
Lot
-
Personnalisation de modèle
-
Standard
-
Région : Asie-Pacifique (Sydney)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie gpt-oss-20b 0,0721 USD 0,3090 USD gpt-oss-120b 0,1545 USD 0,6180 USD -
Priority
-
Région : Asie-Pacifique (Sydney)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie gpt-oss-20b 0,1262 USD 0,5408 USD gpt-oss-120b 0,2704 USD 1,0815 USD -
Flex
-
Région : Asie-Pacifique (Sydney)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie gpt-oss-20b 0,0361 USD 0,1545 USD gpt-oss-120b 0,0773 USD 0,3090 USD -
Lot
-
Région : Asie-Pacifique (Sydney)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie gpt-oss-20b 0,0361 USD 0,1545 USD gpt-oss-120b 0,0773 USD 0,3090 USD -
Personnalisation de modèle
-
Personnalisation de modèle
Tarification du peaufinage par renforcement
Grâce à la fonctionnalité de peaufinage par renforcement d’Amazon Bedrock, vous pouvez améliorer la précision des modèles sans avoir besoin d’une expertise approfondie en machine learning ou de grandes quantités de données étiquetées. Amazon Bedrock automatise le flux de travail de peaufinage par renforcement : il prend en compte vos exemples d’invites, génère des modèles de réponses et attribue des notes à celles-ci à l’aide de votre fonction de récompense. Ces invites, réponses et notes servent ensuite à entraîner votre modèle via un flux de travail RFT itératif.
L’ensemble du flux de travail d’entraînement est facturé à un taux horaire. Une fois l’entraînement terminé, les clients peuvent immédiatement utiliser le modèle peaufiné qui en résulte pour effectuer des inférences à la demande. L’option d’inférence à la demande comprend un modèle de tarification basé sur des jetons qui facture en fonction du nombre de jetons traités lors de l’inférence.
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles OpenAI Prix par heure d’entraînement Prix par million de jetons d’entrée Prix par million de jetons de sortie Prix de stockage de chaque modèle entraîné par mois gpt-oss-20b 80,00 USD 0,09 USD 0,39 USD 1,95 USD
-
-
gpt-oss-safeguard 20b, 120b
-
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie GPT OSS Safeguard 20B 0,07 USD 0,20 USD GPT OSS Safeguard 120B 0,15 USD 0,60 USD Régions : Asie-Pacifique (Mumbai), Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie GPT OSS Safeguard 20B 0,08 USD 0,24 USD GPT OSS Safeguard 120B 0,18 USD 0,71 USD Régions : Europe (Irlande) et Europe (Milan)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie GPT OSS Safeguard 20B 0,08 USD 0,23 USD GPT OSS Safeguard 120B 0,18 USD 0,70 USD Région : Europe (Londres)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie GPT OSS Safeguard 20B 0,11 USD 0,31 USD GPT OSS Safeguard 120B 0,23 USD 0,93 USD Région : Asie-Pacifique (Sydney)
Modèles OpenAI Prix par million de jetons d’entrée Prix par million de jetons de sortie GPT OSS Safeguard 20B 0,0721 USD 0,2060 USD GPT OSS Safeguard 120B 0,1545 USD 0,6180 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard.
-
-
Qwen
-
Qwen
-
Qwen3 Coder, 32B, 235B
-
Qwen 3 Next, VL, Coder Next
-
Qwen3 Coder, 32B, 235B
-
-
Standard
-
Priority
-
Flex
-
Lot
-
Personnalisation de modèle
-
Standard
-
Région : Asie-Pacifique (Sydney)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Coder 30B A3B 0,1545 USD 0,6180 USD Qwen3 32B 0,1545 USD 0,6180 USD Qwen3 235B A22B 2507 0,2266 USD 0,9064 USD -
Priority
-
Région : Asie-Pacifique (Sydney)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Coder 30B A3B 0,2704 USD 1,0815 USD Qwen3 32B 0,2704 USD 1,0815 USD Qwen3 235B A22B 2507 0,3966 USD 1,5862 USD -
Flex
-
Région : Asie-Pacifique (Sydney)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD Qwen3 32B 0,0773 USD 0,3090 USD Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD -
Lot
-
Région : Asie-Pacifique (Sydney)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD Qwen3 32B 0,0773 USD 0,3090 USD Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD -
Personnalisation de modèle
-
Personnalisation de modèle
Tarification du peaufinage par renforcement
Grâce à la fonctionnalité de peaufinage par renforcement d’Amazon Bedrock, vous pouvez améliorer la précision des modèles sans avoir besoin d’une expertise approfondie en machine learning ou de grandes quantités de données étiquetées. Amazon Bedrock automatise le flux de travail de peaufinage par renforcement : il prend en compte vos exemples d’invites, génère des modèles de réponses et attribue des notes à celles-ci à l’aide de votre fonction de récompense. Ces invites, réponses et notes servent ensuite à entraîner votre modèle via un flux de travail RFT itératif.
L’ensemble du flux de travail d’entraînement est facturé à un taux horaire. Une fois l’entraînement terminé, les clients peuvent immédiatement utiliser le modèle peaufiné qui en résulte pour effectuer des inférences à la demande. L’option d’inférence à la demande comprend un modèle de tarification basé sur des jetons qui facture en fonction du nombre de jetons traités lors de l’inférence.
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Qwen Prix par heure d’entraînement Prix par million de jetons d’entrée Prix par million de jetons de sortie Prix de stockage de chaque modèle entraîné par mois Qwen3 32B 80,00 USD 0,20 USD 0,78 USD 1,95 USD
-
-
Qwen 3 Next, VL, Coder Next
-
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Next 80B A3B 0,15 USD 1,20 USD Qwen3 VL 235B A22B 0,53 USD 2,66 USD Qwen3 Coder Next 0,50 USD 1,20 USD Régions : Asie-Pacifique (Mumbai), Europe (Irlande) et Europe (Milan)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Next 80B A3B 0,18 USD 1,41 USD Qwen3 VL 235B A22B 0,62 USD 3,13 USD Qwen3 Coder Next 0,60 USD 1,44 USD Régions : Amérique du Sud (São Paulo) et Asie-Pacifique (Tokyo)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Next 80B A3B 0,18 USD 1,45 USD Qwen3 VL 235B A22B 0,64 USD 3,22 USD Qwen3 Coder Next 0,60 USD 1,44 USD Région : Europe (Londres)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Next 80B A3B 0,23 USD 1,86 USD Qwen3 VL 235B A22B 0,82 USD 4,12 USD Qwen3 Coder Next 0,78 USD 1,86 USD Régions : Europe (Francfort) et Asie-Pacifique (Jakarta)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Coder Next 0,60 USD 1,44 USD Région : Asie-Pacifique (Sydney)
Modèles Qwen Prix par million de jetons d’entrée Prix par million de jetons de sortie Qwen3 Next 80B A3B 0,1545 USD 1,2360 USD Qwen3 VL 235B A22B 0,5459 USD 2,7398 USD Qwen3 Coder Next 0,5150 USD 1,2360 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard.
-
-
Stability AI
-
Stability AI
Tarification à la demande
Les modèles d’images de la génération précédente proposés par Stability AI sont facturés par image, en fonction du nombre d’étapes et de la résolution de l’image.
Région : Oregon, Virginie du Nord, Ohio
Stability AI Image Services Prix par génération pour chaque modèle Stable Image – Suppression d’arrière-plan 0,07 USD Stable Image – Effacement d’objet 0,07 USD Stable Image – Structure de contrôle 0,07 USD Stable Image – Croquis de contrôle 0,07 USD Stable Image – Guide de style 0,07 USD Stable Image – Rechercher et remplacer 0,07 USD Stable Image – Retoucher 0,07 USD Stable Image – Rechercher et recoloriser 0,07 USD Stable Image – Transfert de style 0,08 USD Stable Image – Mise à l’échelle conservatrice 0,40 USD Stable Image – Mise à l’échelle créative 0,60 USD Stable Image – Mise à l’échelle rapide 0,03 USD Stable Image – Outpaint 0,06 USD -
TwelveLabs
-
TwelveLabs
Tarification à la demande
-
Inférence interrégionale mondiale
-
Inférence interrégionale géographique et intrarégionale
-
Inférence interrégionale mondiale
-
-
Inférence interrégionale géographique et intrarégionale
-
-
-
Writer
-
Writer
Tarification à la demande
Modèles Writer Prix par million de jetons d’entrée Prix par million de jetons de sortie Palmyra X4 2,50 USD 10,00 USD Palmyra X5 0,60 USD 6,00 USD -
Z AI
-
Z AI
-
GLM 5
-
GLM 4.7
-
GLM 4.7 Flash
-
GLM 5
-
Tarification à la demande
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 5 1,00 USD 3,20 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard. -
GLM 4.7
-
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 0,60 USD 2,20 USD Régions : Asie-Pacifique (Jakarta), Asie-Pacifique (Mumbai), Asie-Pacifique (Tokyo), Amérique du Sud (São Paulo) et Europe (Stockholm)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 0,72 USD 2,64 USD Région : Asie-Pacifique (Sydney)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 0,6180 USD 2,2660 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard. -
GLM 4.7 Flash
-
Tarification à la demande
Régions : USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 Flash 0,07 USD 0,40 USD Régions : Asie-Pacifique (Jakarta), Asie-Pacifique (Mumbai), Asie-Pacifique (Tokyo), Europe (Francfort), Europe (Irlande), Europe (Milan), Europe (Stockholm) et Amérique du Sud (São Paulo)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 Flash 0,08 USD 0,48 USD Région : Europe (Londres)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 Flash 0,11 USD 0,62 USD Région : Asie-Pacifique (Sydney)
Modèles Z AI Prix par million de jetons d’entrée Prix par million de jetons de sortie GLM 4.7 Flash 0,0721 USD 0,4120 USD * La tarification du niveau Priority est majorée de 75 % par rapport à la tarification du niveau Standard
* La tarification du niveau Flex et par lot est réduite de 50 % par rapport à la tarification du niveau Standard.
-
-
Importation de modèles personnalisés
-
Importation de modèles personnalisés
-
Llama
-
Lama multimodal
-
Mistral
-
Mixtral
-
Flan
-
Qwen
-
OpenAI
-
Llama
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisé par min* 0,05718 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Région : Europe (Francfort)
Version de l'unité de modèle personnalisé v1.0 Prix par unité de modèle personnalisé par min* 0,07144 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par créneaux de 5 minutes
-
Lama multimodal
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisé par min* 0,05718 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Région : Europe (Francfort)
Version de l'unité de modèle personnalisé v1.0 Prix par unité de modèle personnalisé par min* 0,07144 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par tranches de cinq minutes
-
Mistral
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisé par min* 0,05718 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Région : Europe (Francfort)
Version de l'unité de modèle personnalisé v1.0 Prix par unité de modèle personnalisé par min* 0,07144 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par tranches de cinq minutes
-
Mixtral
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisé par min* 0,05718 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Région : Europe (Francfort)
Version de l'unité de modèle personnalisé v1.0 Prix par unité de modèle personnalisé par min* 0,07144 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par tranches de cinq minutes
-
Flan
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisé par min* 0,05718 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Région : Europe (Francfort)
Version de l'unité de modèle personnalisé v1.0 Prix par unité de modèle personnalisé par min* 0,07144 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par tranches de cinq minutes
Tarification par inférence à la demande :
Vous êtes facturé dans des fenêtres de 5 minutes pour la durée pendant laquelle votre copie de modèle est active à compter de la première invocation réussie. La limite maximale de débit et de simultanéité par copie de modèle dépend de facteurs tels que la combinaison de jetons d’entrée/sortie, le type de matériel, la taille du modèle, l’architecture, les optimisations d’inférence et est déterminée lors du flux de travail d’importation du modèle.Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : il existe un maximum par défaut de 3 copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.
-
Qwen
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version d'unité modèle personnalisée v1.0 Prix par unité de modèle personnalisé par min* 0,05718 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Région : Europe (Francfort)
Version de l'unité de modèle personnalisé v1.0 Prix par unité de modèle personnalisé par min* 0,07144 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par tranches de cinq minutes
Tarification par inférence à la demande :
Vous êtes facturé dans des fenêtres de 5 minutes pour la durée pendant laquelle votre copie de modèle est active à compter de la première invocation réussie. La limite maximale de débit et de simultanéité par copie de modèle dépend de facteurs tels que la combinaison de jetons d’entrée/sortie, le type de matériel, la taille du modèle, l’architecture, les optimisations d’inférence et est déterminée lors du flux de travail d’importation du modèle.Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : il existe un maximum par défaut de 3 copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.
-
OpenAI
-
Régions : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Version de l'unité de modèle personnalisé v2.0 Prix par unité de modèle personnalisé par min* 0,1433 USD Coût de stockage mensuel par unité de modèle personnalisé 1,95 USD Remarque : les unités de modèle personnalisé nécessaires pour héberger un modèle dépendent de divers facteurs, notamment de l'architecture du modèle, du nombre de paramètres du modèle et de la longueur du contexte. Le nombre exact d'unités de modèle personnalisé nécessaires sera déterminé au moment de l'importation. À titre de référence, le modèle Llama 3.1 8B 128K nécessite 2 unités de modèle personnalisées, un modèle Llama 3.1 70B 128k nécessite 8 unités de modèle personnalisées.
*Facturé par tranches de cinq minutes
Tarification par inférence à la demande :
Vous êtes facturé dans des fenêtres de 5 minutes pour la durée pendant laquelle votre copie de modèle est active à compter de la première invocation réussie. La limite maximale de débit et de simultanéité par copie de modèle dépend de facteurs tels que la combinaison de jetons d’entrée/sortie, le type de matériel, la taille du modèle, l’architecture, les optimisations d’inférence et est déterminée lors du flux de travail d’importation du modèle.Bedrock met automatiquement à l’échelle le nombre de copies du modèle en fonction de vos habitudes d’utilisation. S'il n’y a aucune invocation pendant une période de 5 minutes, Bedrock sera réduit verticalement à zéro puis redimensionné lorsque vous invoquerez votre modèle. Lors de la redimensionnement, vous pouvez rencontrer un temps de démarrage à froid (en dizaines de secondes) en fonction de la taille du modèle. Bedrock augmente verticalement également le nombre de copies du modèle si votre volume d’inférence dépasse systématiquement les limites de simultanéité d’une seule copie de modèle. Remarque : il existe un maximum par défaut de trois copies de modèle par compte et par modèle importé, qui peut être augmenté par le biais de Service Quotas.
-
-
-
Bases de connaissances
-
Extraction de données structurées (génération SQL)
La récupération de données structurées est facturée pour chaque demande de génération d’une requête SQL. La requête SQL générée est utilisée pour récupérer les données à partir de magasins de données structurés.
Modèles Rerank
Les modèles Rerank sont conçus pour améliorer la pertinence et la précision des réponses dans les applications de génération à enrichissement contextuel (RAG). Ils sont facturés par requête.
**Le nombre de requêtes pouvant contenir jusqu’à 100 segments de document vous est facturé. Si la requête contient plus de 100 segments de document, elle est comptée comme plusieurs requêtes. Par exemple, si une demande contient 350 documents, elle sera traitée comme 4 demandes. Veuillez noter que chaque document ne peut contenir que 512 jetons (y compris le total des jetons de la requête et du document), et si la longueur du jeton est supérieure à 512 jetons, il est divisé en plusieurs documents. Une requête est équivalente à une unité de recherche.
-
Barrières de protection
-
Barrières de protection Amazon Bedrock
La tarification des barrières de protection Amazon Bedrock est basée sur les frais occasionnés par le filtre utilisé dans la barrière de protection. La tarification est la même pour le niveau Standard et le niveau Classic.
Filtre de barrières de protection*
Tarification
Filtres de contenu pour le niveau Standard et le niveau Classic (contenu textuel) 0,15 USD pour 1 000 unités de texte
Filtres de contenu (contenu d'image)
0,00075 USD par image traitée
Rubriques refusées pour le niveau Standard et le niveau Classic
0,15 USD pour 1 000 unités de texte
Filtres d’informations sensibles
0,10 USD pour 1 000 unités de texte
Filtres d’informations sensibles (expression régulière)
Gratuit
Filtres de mots
Gratuit
Vérifications de l’ancrage contextuel
0,10 USD pour 1 000 unités de texte
Vérifications du raisonnement automatisé
0,17 USD pour 1 000 unités de texte par politique de raisonnement automatisé
Tarification à la demande
* Chaque filtre de barrière de protections est facultatif et peut être activé en fonction des exigences de votre application. Des frais seront facturés en fonction du type de filtre utilisé pour la barrière de protections. Par exemple, si une barrière de protection est configurée avec des filtres de contenu et des sujets refusés, des frais seront facturés pour ces deux filtres, alors qu’aucun frais ne sera associé aux filtres d’informations sensibles.
Remarque : une unité de texte peut contenir jusqu'à 1 000 caractères. Si une saisie de texte comporte plus de 1 000 caractères, elle est traitée comme plusieurs unités de texte, chacune contenant 1 000 caractères ou moins. Par exemple, si une saisie de texte contient 5 600 caractères, elle sera facturée pour 6 unités de texte.La vérification d'ancrage contextuelle utilise une source de référence et une requête pour déterminer si la réponse du modèle est fondée sur la source et pertinente pour la requête. Le nombre total d’unités de texte facturées est calculé en combinant tous les caractères de la source, de la requête et de la réponse du modèle.
-
Évaluation du modèle
-
Évaluation du modèle
L'évaluation du modèle est facturée pour l'inférence à partir du modèle que vous avez choisi. Les scores algorithmiques générés automatiquement sont fournis sans frais supplémentaires. Pour l’évaluation basée sur l’humain dans laquelle vous apportez votre propre flux de travail, l’inférence de modèle dans l’évaluation vous est facturée et des frais de 0,21 USD par tâche humaine effectuée vous sont facturés.
Si vous utilisez l’évaluation par RAG ou le LLM-juge dans l’évaluation des modèles, les jetons utilisés par le modèle juge sont facturés sur la base des prix du niveau Standard à la demande. Les invites du juge sont facturées dans le cadre de votre utilisation de jeton et sont disponibles dans la documentation publique. L’évaluation par RAG sur une base de connaissances Bedrock entraîne également des frais d’utilisation réguliers des bases de connaissances Bedrock.
Modèle
Prix pour 1 000 jetons d’entrée
Prix pour 1 000 jetons de sortie
Prix par tâche humaine
Modèle sélectionné pour l'évaluation
Sur la base du modèle sélectionné
Sur la base du modèle sélectionné
0,21 USD
-
Automatisation des données
-
Automatisation des données
L’automatisation des données Amazon Bedrock transforme le contenu multimodal non structuré en formats de données structurées pour des cas d’utilisation tels que le traitement intelligent des documents, l’analyse vidéo et la génération à enrichissement contextuel (RAG). Bedrock Data Automation peut générer du contenu de sortie standard à l’aide de valeurs par défaut prédéfinies qui sont spécifiques à la modalité, comme des descriptions scène par scène de vidéos, des transcriptions audio ou une analyse automatique de documents. Les clients peuvent également créer des sorties personnalisées en spécifiant leurs exigences de sortie dans des plans en fonction de leur propre schéma de données, qu’ils peuvent ensuite facilement charger dans une base de données ou un entrepôt de données existant. Grâce à une intégration avec les bases de connaissances, l’automatisation des données Bedrock peut également servir à analyser le contenu des applications de RAG, pour ainsi améliorer la précision et la pertinence des résultats en incluant des informations intégrées à la fois dans les images et le texte.
Les bases de connaissances d’Amazon Bedrock proposent une intégration de l’automatisation des données Bedrock afin de fournir des réponses plus pertinentes et plus précises aux données multimodales. Lorsque vous configurez une base de connaissances, vous pouvez sélectionner Bedrock Data Automation comme méthode d’analyse pour analyser et extraire des informations pertinentes à partir d’images ou de documents, qui peuvent inclure des figures, des graphiques et des diagrammes. Au cours du traitement, Bedrock Data Automation extrait des informations pertinentes des documents et des images ingérés, qui sont ensuite utilisées dans les étapes suivantes de la base de connaissances pour le découpage, la vectorisation et le stockage. Lorsqu’elle est intégrée aux bases de connaissances, Bedrock Data Automation fournit et facture des résultats standardisés.
-
Routage des invites intelligent
-
Point de prix Dimension de tarification Plan tarifaire Routage des invites intelligent 1 USD par tranche de 1 000 requêtes À la demande Routage des invites intelligent
Le routage des invites intelligent vous permet d'utiliser une combinaison de modèles de fondation (FM) de la même famille de modèles pour optimiser la qualité et les coûts. Par exemple, avec la famille de modèles Anthropic's Claude, Amazon Bedrock peut acheminer intelligemment les requêtes entre Claude 3.5 Sonnet et Claude 3 Haiku en fonction de la complexité de l'invite. De même, Amazon Bedrock peut acheminer les demandes entre Meta Llama 3.3 70B et 3.18B, et Nova Pro et Nova Lite. Le routeur des invites prédit quel modèle fournira les meilleures performances pour chaque demande, tout en optimisant la qualité de la réponse et les coûts. Cette fonction est particulièrement utile pour les applications telles que les assistants de service client, où les requêtes simples peuvent être traitées par des modèles plus petits, plus rapides et plus rentables, et où les requêtes complexes sont acheminées vers des modèles plus performants. Le routage des invites intelligent peut réduire les coûts jusqu’à 30 % sans compromettre la précision.
-
Optimisation des invites
-
Optimisation des invites pour Amazon Bedrock
Vous êtes facturé en fonction du nombre de jetons figurant dans les invites saisies et dans les invites optimisées.
Tous les frais sont facturés mensuellement à compter du 23 avril 2025.
Prix pour 1 000 jetons 0,030 USD
Exemples de tarification
-
AI21 labs
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD
-
Amazon
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Amazon Titan Text Lite pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base Amazon Titan Image Generator pour générer 1 000 images de taille 1 024 × 1 024 au format de qualité standard.
Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD
Tarification de la personnalisation (ajustement et pré-entraînement continu)
Un développeur d’applications personnalise un modèle Amazon Titan Image Generator à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer la performance du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.
Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot, + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 USD = 182,95 USD
Tarification du débit provisionné
Un développeur d’applications achète deux unités de modèles Amazon Titan Text Express avec un engagement d'un mois pour son cas d'utilisation de résumé de texte.
Coût mensuel total encouru = 2 unités de modèles x 18,40 USD/heure x 24 heures x 31 jours = 27 379,20 USD
Un développeur d’applications achète une unité de modèle du modèle de base Amazon Titan Image Generator avec un engagement d’un mois.
Coût total engagé = 1 unité de modèle * 16,20 USD * 24 heures * 31 jours = 12 052,80 USD
-
Barrières de protection Amazon Bedrock
Exemple 1 : chatbot d'assistance à la clientèle
Un développeur d'applications crée un chatbot d'assistance à la clientèle et utilise des filtres de contenu pour bloquer le contenu préjudiciable et les sujets refusés pour filtrer les requêtes et les réponses indésirables.
Le chatbot répond à 1 000 requêtes d'utilisateurs par heure. Chaque requête utilisateur a une longueur d'entrée moyenne de 200 caractères et reçoit une réponse FM de 1 500 caractères.
Chaque requête utilisateur de 200 caractères correspond à une unité de texte.
Chaque réponse FM de 1 500 caractères correspond à 2 unités de texte.
Unités de texte traitées chaque heure = (1 + 2) x 1 000 requêtes = 3 000 unités de texte
Coût total par heure pour les filtres de contenu et les sujets refusés = 3000 x (0,15 USD + 0,15 USD) / 1000 = 0,90 USDExemple 2 : résumé des transcriptions d’un centre d’appels
Un développeur d'applications crée une application pour résumer les transcriptions des discussions entre les utilisateurs et les agents d’assistance. Il utilise un filtre d'informations sensibles pour supprimer les données d’identification personnelles (PII) dans les résumés générés pour 10 000 conversations.
Chaque résumé généré comporte en moyenne 3 500 caractères, ce qui correspond à 4 unités de texte.
Coût total engagé pour résumer 10 000 conversations = 10 000 * 4 * (0,1/1 000 USD) = 4 USDExemple 3 : moteur de vérification de protocole médical
Une entreprise de technologie médicale met en œuvre des vérifications du raisonnement automatisé dans son système d’aide à la décision clinique afin de valider les suggestions de traitement par rapport aux directives médicales.Le système traite 5 000 cas de patients par mois. Chaque cas implique :
- Résumé des données du patient : 500 caractères (1 unité de texte)
- Évaluation du diagnostic : 2 000 caractères (2 unités de texte)
- Recommandation de traitement : 4 500 caractères (5 unités de texte)
Unités de texte traitées par mois = (1 + 2 + 5) * 5 000 cas = 40 000 unités de texte
Coût total encouru par mois pour les vérifications du raisonnement automatisé = 40 000 * 0,17 USD/1 000 = 6,80 USD -
Amazon Bedrock Knowledge Bases
Exemple de tarification 1 (reclassement à l’aide du modèle Amazon Rerank 1.0)
Au cours d’un mois donné, vous soumettez 2 millions de demandes à l’API Rerank en utilisant le modèle Amazon Rerank 1.0 : 1 million de ces demandes contiennent moins de 100 documents chacune et seront donc facturées pour une demande chacune. Le million de demandes restant contient 120 à 150 documents. Par conséquent, chacune de ces demandes sera facturée pour 2 demandes.
Prix par demande = 0,001 USD
Coût total = 1 000 000 * 0.001 USD + 1 000 000 * 2 * 0.001 USD = 3 000 USDExemple de tarification 2 : (extraction de données structurées)
Un développeur d’applications crée un chatbot de support qui interroge les données structurées stockées dans Amazon Redshift. Le développeur crée une base de connaissances Bedrock et se connecte à Amazon Redshift. Le chatbot répond à 10 000 requêtes d’utilisateurs par heure. Chaque requête utilisateur coûtera 0,002 USD par API GenerateQuery pour générer du code SQL à partir d’une requête utilisateur.
Coût total encouru pour générer du code SQL par heure = 0,002 * 10 000 USD = 20 USD.
Coût total engagé au cours du mois = 20 USD * 24 * 30 = 1 440 USD -
Anthropic
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Anthropic Claude pour résumer une entrée de 11 000 jetons de texte d’entrée en une sortie de 4 000 jetons.
Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle Anthropic Claude Instant dans la région USA Ouest (Oregon) :
Coût mensuel total encouru = 1 unité de modèle * 39,60 USD * 24 heures * 31 jours = 29 462,40 USD
-
Cohere
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,0020 USD = 0,013 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Command - Light pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Cohere Embed anglais ou multilingue pour générer des intégrations pour 10 000 jetons d’entrée.
Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD
Tarification de la personnalisation (ajustement)
Un développeur d’applications personnalise un modèle Cohere Command à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.
Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,50 USD) = 55,45 USD
Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 39,60 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle de Cohere Command avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 1 unité de modèle * 39,60 USD * 24 heures * 31 jours = 29 462,40 USD
-
Importation de modèles personnalisés
Exemple de tarification : un développeur d'applications importe un modèle de type Llama 3.1 personnalisé d'une taille de paramètre 8B avec une longueur de séquence de 128 Ko dans la région us-est-1 et supprime le modèle au bout d'un mois. Cela nécessite 2 unités de modèle personnalisées. Ainsi, le prix par minute sera de 0,1570 USD car 2 unités de modèle personnalisées sont requises. Les coûts de stockage des modèles pour 2 unités modèles personnalisées seraient de 3,90 USD par mois.
L’importation du modèle est gratuite. La première invocation réussie a lieu à 8 h 03, heure à laquelle le comptage commence. Les fenêtres de comptage de 5 minutes vont de 8 h 03 à 8 h 07 ; de 8 h 07 à 8 h 11, etc. S’il y a au moins une invocation pendant une période de 5 minutes, la fenêtre sera considérée comme active pour la facturation. S’il y a une invocation à 8 h 03 et aucune autre invocation après 8 h 07, le comptage s’arrêtera à 8 h 07. Dans ce cas, la facture serait calculée comme suit : 0,1570 USD * 5 minutes * 1 tranche de 5 minutes = 0,785 USD.
-
Data Automation
Exemple de tarification 1 :
Supposons que vous traitiez un document de 1 000 pages à l’aide de la sortie standard BDA. Les 1 000 pages sont traitées à l’aide du plan 1 qui comporte 15 champs. Le prix par page pour tout plan comportant 30 champs ou moins est de 0,040 USD. Le coût total s’élèverait à 40 USD.
Nombre total de pages traitées = 1 000
Prix par page pour les plans comportant moins de 30 champs = 0,040 USD
Coût total = 1 000 USD * 0.040 = 40 USDExemple de tarification 2 :
Supposons que vous traitiez 2 documents à l’aide de la sortie standard BDA. Le document 1 compte 40 pages et est traité à l’aide du plan 1 qui comporte 20 champs. Le document 2 compte 10 pages et est traité à l’aide du plan 2, qui comporte 40 champs. Le prix par page du plan 1 est de 0,040 USD, car il contient 30 champs ou moins. Le prix par page du plan 2 est de 0,045 USD. Le coût de traitement du document 1 à l’aide du plan 1 est de 1,60 USD. Le coût de traitement du document 2 à l’aide du plan 2 est de 0,45 USD. Le coût total du traitement des deux documents serait de 2,05 USD.
Nombre total de pages traitées = 50
Prix par page pour le Plan 1 contenant moins de 30 champs = 0,040 USD
Prix par page pour le Plan 2 avec 40 champs = 0,040 USD + (nombre de champs supplémentaires supérieurs à 30 * 0,0005 USD par champ)
Nombre de champs supplémentaires supérieur à 30 = 40 - 30 = 10
Prix par page pour le Plan 2 avec 40 champs = 0,040 USD + (10 *0,0005 USD par champ) = 0,045 USD
Frais pour le document 1 utilisant le plan 1 = 40 pages x 0,040 USD par page = 1,6 USD
Frais pour le document 2 utilisant le plan 2 = 10 pages x 0,045 USD par page = 0,45 USD
Frais totaux = Frais pour le document 1 + Frais pour le document 2 = 1,6 USD + 0,45 USD = 2,05 USDExemple de tarification 3 :
Supposons que vous configuriez les bases de connaissances Bedrock pour utiliser Bedrock Data Automation comme analyseur, puis que vous ingériez un document de 1 000 pages. Notez que les structures de coûts diffèrent entre les options d'analyse des bases de connaissances. BDA utilise une tarification par page, tandis que les analyseurs du modèle de fondation facturent en fonction des jetons d'entrée et de sortie. À titre de contexte, le traitement de 1 000 pages, dont 30 % contiennent des tableaux et 30 % des figures, nécessite généralement 2 900 jetons d'entrée et 750 jetons de sortie. La consommation de jetons varie en fonction du type de contenu. Les clients sont donc invités à effectuer des tests en utilisant leurs propres données pour obtenir des estimations plus précises. L’intégration des bases de connaissances Bedrock et de Bedrock Data Automation utilise une sortie standard, dont le prix par page est de 0,010 USD. Le coût total s’élèverait à 10 USD.Nombre total de pages traitées = 1 000
Prix par page pour la sortie standard = 0,010 USD
Coût total = 1 000 * 0,010 USD = 10 USDExemple de tarification 4 :
Supposons que vous traitez une vidéo de 60 minutes à l’aide de la sortie standard BDA. Le prix par minute pour la sortie vidéo standard est de 0,050 USD. Le coût total s’élèverait à 3,00 USD.
Nombre total de minutes traitées = 60
Prix par minute pour la sortie vidéo standard = 0,050 USD
Coût total = 60 * 0.050 USD = 3,00 USDExemple de tarification 5 :
Supposons que vous traitiez 2 000 images à l’aide de la sortie personnalisée BDA. Les 1 000 premières images sont traitées à l’aide du plan 1, qui comporte 10 champs. Les 1 000 dernières images sont traitées à l’aide du plan 2, qui comporte 40 champs. Le prix par image pour le plan 1 est de 0,005 USD, car il contient 30 champs ou moins. Le prix par image du plan 2 est de 0,01 USD. Le coût de traitement des 1 000 premières images à l’aide du plan 1 est de 5,00 USD. Le coût de traitement des 1 000 dernières images à l’aide du plan 2 est de 10,00 USD. Le coût total du traitement des 2 000 images serait de 15,00 USD
Coût des 1 000 premières images = 1 000 images * 0,005 USD par image = 5,00 USD
Coût pour 1 000 dernières images = 1 000 images * (0,005 USD + (nombre de champs supplémentaires supérieurs à 30 *0,0005 USD par champ))
= 1 000 * (0,005 USD + ((40 - 30) *0,0005 USD))
= 1 000 * (0,005 USD + (10 * 0,0005 USD)) = 10,00 USD
Coût total = 5,00 USD + 10,00 USD = 15,00 USDExemple de tarification 6 :
Supposons que vous souhaitiez utiliser la sortie standard de Bedrock Data Automation pour traiter 15 000 minutes d’enregistrements audio de réunions dans votre organisation. Le coût total du traitement des 15 000 minutes audio serait de 90 USD.
Nombre total de minutes traitées = 15 000 minutes
Coût total = 15 000 min * 0,006 USD = 90 USD -
DeepSeek
Tarification à la demande
Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle DeepSeek-R1 pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons (y compris des jetons de raisonnement) :
Coût horaire total encouru = 2 000 jetons/1000 * 0,00135 USD + 1 000 jetons/1 000 * 0,0054 USD = 0,0081 USD
-
Flux
Exemple : résumé des actualités
Un développeur d’applications crée un flux pour automatiser la synthèse des actualités pour les traders. Le flux comprend un nœud d’entrée qui prend un emplacement S3 et un nœud de récupération S3 qui récupère 10 fichiers contenant des articles de 10 agences de presse majeures dans S3 (2 transitions de nœuds). Il utilise ensuite un nœud itérateur pour invoquer un modèle avec un nœud d’invite pour résumer chaque fichier (+ 10 fichiers x 2 transitions de nœuds). Il collecte ensuite tous les résultats à l’aide d’un nœud collecteur, écrit les résultats dans S3 à l’aide d’un nœud de stockage S3 et les complète dans un nœud de sortie (+ 3 transitions de nœud). Ils font fonctionner ce flux toutes les demi-heures de chaque jour de la semaine.Le nombre de transitions de nœuds par exécution de flux est le suivant : 2 + 1 + 10 * 2 + 3 = 25 transitions de nœuds par exécution de flux
Le nombre d’exécutions de flux par mois est de : 24 heures * 2 * 5 jours * 4 semaines = 960 exécutions de flux par mois.
La facture mensuelle totale est de : 25 * 960 * 0,035 USD / 1 000 = 0,84 USD
Frais supplémentaires
La facture inclura également des frais supplémentaires pour les services AWS utilisés dans l’exécution du flux de travail, notamment l’utilisation d’Amazon S3 dans les nœuds de récupération et de stockage, et l’utilisation du modèle de fondation Amazon Bedrock dans le nœud d’invite. -
Meta
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Meta Llama 2 Chat (13B) pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.
Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD
Tarification de la personnalisation (ajustement)
Un développeur d’applications personnalise le modèle Llama 2 Pretrained (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit provisionné du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit provisionné (engagement d’un mois) pour héberger le modèle personnalisé.
Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,50 USD) = 33,44 USD
Coût mensuel encouru pour le débit provisionné (engagement d’un mois) du modèle personnalisé = 21,18 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 1 unité de modèle * 21,18 USD * 24 heures * 31 jours = 15 757,92 USD
-
Mistral AI
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD
Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 * 0,008 USD + 1 000 jetons/1 000 * 0,024 USD = 0,04 USD
-
Évaluation des modèles
Exemple d'évaluation des modèles 1 :
Tarification à la demande
Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).Le jeu de données contient 50 invites, et le développeur a besoin d’un travailleur pour évaluer chaque ensemble invite-réponse (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »).
Cette tâche d'évaluation comportera 50 tâches (1 tâche pour chaque paire d’invite-réponse par travailleur). Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.
Les frais suivants sont encourus pour ce travail d'évaluation de modèles :Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total Inférence instantanée Claude 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tâches humaines 50 0,21 USD 10,50 USD 10,50 USD Total 11,06 USD Exemple d'évaluation du modèle 2 :
Tarification à la demande
Un développeur d'applications soumet un jeu de données pour l'évaluation de modèles humains à l'aide d'Anthropic Claude 2.1 et d'Anthropic Claude Instant dans la région AWS de l'USA Est (Virginie du Nord).
Le jeu de données contient 50 invites, et le développeur a besoin de 2 travailleurs pour évaluer chaque ensemble invites-réponses (configurable dans le paramètre de création de tâches d'évaluation en tant que « travailleurs par invite »). Ce travail d'évaluation comportera 100 tâches (1 tâche pour chaque ensemble invites-réponses par travailleur : 2 travailleurs x 50 ensembles invites-réponses = 100 tâches humaines).
Les 50 invites totalisent 5 000 jetons d'entrée, et les réponses associées totalisent 15 000 jetons pour Anthropic Claude Instant et 20 000 jetons pour Anthropic Claude 2.1.
Les frais suivants sont encourus pour ce travail d'évaluation de modèles :Élément Nombre de jetons d'entrée Prix pour 1000 jetons d'entrée Coût des intrants Nombre de jetons de sortie Prix pour 1000 jetons de sortie Coût de production Nombre de tâches humaines Prix par tâche humaine Coût des tâches humaines Total Inférence instantanée Claude 5 000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tâches humaines 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Optimisation des invites
Exemple : résumé des actualités
Un développeur d'applications crée une invite pour résumer les actualités pour les traders à l'aide de Claude 3.5. L'invite d'origine comprend 429 jetons. L'invite optimisée comporte 511 jetons et comprend des instructions et des exemples plus spécifiques pour générer une réponse plus concise à partir des FM. Il utilise l'invite optimisée avec 511 jetons comme entrée pour l'optimiseur d'invite, et crée 2 nouvelles variantes pour Claude 3.7 et Nova Pro avec 582 et 579 jetons.Nombre total de jetons d'entrée et de sortie pour une optimisation d’invite : 429 + 511 + 511 + 582 + 511 + 579 = 3 123
La facture mensuelle totale est de : 3 123/1 000 * 0,03 USD = 0,09 USD
-
Stability AI
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille d’étape de 70 (qualité supérieure).
Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.0 pour générer une image de 1 024 x 1 024 avec une taille d’étape de 70 (qualité supérieure).
Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD
Tarification du débit provisionné
Un développeur d’applications achète une unité de modèle de SDXL 1.0 avec un engagement d’un mois.
Coût total = 1 * 49,86 USD * 24 heures * 31 jours = 37 095,84 USD
-
TwelveLabs
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Pegasus 1.2 pour décrire ce qu’implique une vidéo de 10 secondes, qui fournit une sortie de 2 000 jetons.
Coût total = 10 secondes * 0,00049 USD + 2 000 jetons / 1 000 * 0,0075 USD = 0,0199 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Marengo Embed [3.0 ou 2.7] pour intégrer 10 vidéos, d’une durée combinée de 100 minutes.Coût total encouru = 100 minutes (6 000 secondes) * 0,00070 USD = 4,2 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Marengo Embed 3.0 pour générer, sur la base d’un texte et d’une image fournis ensemble, une intégration qui pourrait être utilisée pour trouver le clip contenant le sac affiché dans l’image donnée, dans le référentiel d’intégration créé en utilisant l’exemple ci-dessus.Coût total encouru = 1 demande texte * 0,00007 USD +1 demande image * 0,0001 USD = 0,00017 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Marengo Embed [3.0 ou 2.7] en fournissant un texte pour générer une intégration qui pourrait être utilisée pour trouver les clips correspondants dans le référentiel d’intégration créé en utilisant l’exemple ci-dessus.Coût total encouru = 1 demande texte * 0,00007 USD = 0,00007 USD
-
Writer
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Palmyra X5 de Writer pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 10 000 jetons/1000 x 0,003 USD + 2 000 jetons/1000 x 0,015 USD = 0,06 USD