Tarifs d'Amazon Bedrock
Vue d'ensemble des tarifs
Amazon Bedrock est un service entièrement géré qui propose un choix de systèmes d’IA à usage général (FM) haute performance via une API unique, ainsi qu’un large éventail des capacités dont vous avez besoin pour créer des applications d’IA générative, ce qui simplifie le développement tout en préservant la confidentialité, la sécurité et une IA responsable.
Avec Amazon Bedrock, l’inférence et la personnalisation des modèles vous sont facturées. Vous avez le choix entre deux plans tarifaires pour l’inférence : 1/ à la demande et par lots : ce plan vous permet d’utiliser les FM sur la base du paiement à l’utilisation sans avoir à prendre d’engagements temporels. 2/ Débit alloué : ce plan vous permet d’allouer un débit suffisant pour répondre aux exigences de performances de votre application en échange d’un engagement à durée déterminée.
Modèles de tarification
À la demande
Avec le mode à la demande, vous ne payez que ce que vous consommez, sans engagement de durée. Pour les modèles de génération de texte, vous êtes facturé pour chaque jeton d’entrée traité et chaque jeton de sortie généré. Pour les modèles d’intégration, vous êtes facturé pour chaque jeton d’entrée traité. Un jeton est composé de quelques caractères et se réfère à l’unité de base du texte qu’un modèle apprend pour comprendre l’entrée et l’invite de l’utilisateur. Pour les modèles de génération d’images, vous êtes facturé pour chaque image générée.
Lot
Avec le mode par lots, vous pouvez fournir un ensemble d’invites dans un seul fichier d’entrée et recevoir les réponses dans un seul fichier de sortie, ce qui vous permet d’obtenir des prédictions simultanées à grande échelle. Les réponses sont traitées et stockées dans votre compartiment Amazon S3 afin que vous puissiez y accéder ultérieurement. La tarification du mode par lots est la même que celle du mode à la demande.
Débit alloué
Avec le mode de débit provisionné, vous pouvez acheter des unités de modèle pour un modèle de base ou un modèle personnalisé spécifique. Le mode de débit provisionné est principalement conçu pour les charges de travail d’inférence cohérentes importantes qui nécessitent un débit garanti. Les modèles personnalisés ne sont accessibles qu’à l’aide du débit provisionné. Une unité modèle fournit un certain débit, qui est mesuré par le nombre maximum de jetons d’entrée ou de sortie traités par minute. Avec la tarification du débit provisionné, vous êtes facturé à l’heure, vous avez la possibilité de choisir entre des conditions d’engagement d’un mois ou de six mois.
Personnalisation du modèle
Avec Amazon Bedrock, vous pouvez personnaliser les FM en fonction de vos données afin de fournir des réponses adaptées à des tâches spécifiques et à votre contexte commercial. Vous pouvez affiner les modèles à l’aide de données étiquetées ou utiliser un préentraînement continu avec des données non étiquetées. Pour la personnalisation d’un modèle de génération de texte, vous êtes facturé pour l’entraînement du modèle en fonction du nombre total de jetons traités par le modèle (nombre de jetons dans le corpus de données d’entraînement multiplié par le nombre d’époques) et pour le stockage du modèle facturé par mois et par modèle. Une époque correspond à un passage complet dans votre jeu de données d’entraînement lors d’un ajustement ou d’un préentraînement continu. Les inférences utilisant des modèles personnalisés sont facturées dans le cadre du plan de débit provisionné et nécessitent que vous achetiez le débit provisionné. Une unité de modèle est mise à disposition sans engagement de durée pour l’inférence sur un modèle personnalisé. Vous serez facturé pour le nombre d’heures que la première unité de modèle que vous utilisez pour l’inférence de modèle personnalisé. Si vous souhaitez augmenter votre débit au-delà d’une unité de modèle, vous devez souscrire un engagement d’un mois ou de six mois.
Des outils puissants pour créer sans frais supplémentaires
Lorsque vous utilisez des agents pour Amazon Bedrock et des bases de connaissances pour Amazon Bedrock, vous n’êtes facturé que pour les modèles et les bases de données vectorielles que vous utilisez avec ces capacités.
Ventilation de la tarification
La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.
AI21 Labs
Tarification à la demande et par lots
Modèles AI21 Labs | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Jurassic-2 Mid |
0,0125 USD |
0,0125 USD |
Jurassic 2 Ultra |
0,0188 USD |
0,0188 USD |
Actuellement, la personnalisation du modèle (ajustement) et le débit provisionné ne sont pas pris en charge pour les modèles AI21 Labs sur Amazon Bedrock.
Amazon
Anthropic
Tarification à la demande et par lots
Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Anthropic | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Claude Instant |
0,0008 USD |
0,0024 USD |
Claude 2.0/2.1 |
0,008 USD |
0,02400 USD |
Claude 3 Opus* |
0,01500 USD |
0,07500 USD |
Claude 3 Sonnet |
0,003 USD |
0,015 USD |
Claude 3 Haïku |
0,00025 USD |
0,00125 USD |
*Claude 3 Opus est actuellement disponible dans la région USA Ouest (Oregon). |
Région : Asie-Pacifique (Sydney)
Modèles Anthropic | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Claude 3 Sonnet |
0,003 USD |
0,015 USD |
Claude 3 Haïku |
0,00025 USD |
0,00125 USD |
Région : Europe (Paris)
Modèles Anthropic | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Claude 3 Sonnet |
0,003 USD |
0,015 USD |
Claude 3 Haïku |
0,00025 USD |
0,00125 USD |
Région : Asie-Pacifique (Tokyo)
Modèles Anthropic | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Claude Instant |
0,0008 USD |
0,0024 USD |
Claude 2.0/2.1 |
0,008 USD |
0,024 USD |
Région : Europe (Francfort)
Modèles Anthropic | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Claude Instant |
0,0008 USD |
0,0024 USD |
Claude 2.0/2.1 |
0,008 USD |
0,024 USD |
Tarification du débit alloué :
Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)
Modèles Anthropic | Prix par heure par modèle avec aucun engagement |
Tarif horaire par unité modèle pour un engagement d'un mois | Tarif horaire par unité modèle pour un engagement de six mois |
Claude Instant |
44,00 USD | 39,60 USD |
22 USD |
Claude 2.0/2.1 |
70,00 USD | 63,00 USD |
35,00 USD |
Modèles Anthropic | Prix par heure par modèle avec aucun engagement |
Tarif horaire par unité modèle pour un engagement d'un mois | Tarif horaire par unité modèle pour un engagement de six mois |
Claude Instant |
44,00 USD | 39,60 USD |
22 USD |
Claude 2.0/2.1 |
70,00 USD | 63,00 USD |
35,00 USD |
Région : Asie-Pacifique (Tokyo)
Modèles Anthropic | Tarif horaire par unité modèle pour un engagement d’un mois | Tarif horaire par unité modèle pour un engagement de six mois |
Claude Instant |
53 USD |
29 USD |
Claude 2.0/2.1 |
86 USD |
48 USD |
Région : Europe (Francfort)
Modèles Anthropic | Tarif horaire par unité modèle pour un engagement d’un mois | Tarif horaire par unité modèle pour un engagement de six mois |
Claude Instant |
49 USD |
27 USD |
Claude 2.0/2.1 |
79 USD |
44 USD |
Contactez l’équipe responsable de votre compte AWS pour plus de détails sur les unités modèles.
Cohere
Tarification à la demande et par lots
Modèles Cohere | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Command | 0,0015 USD | 0,002 USD |
Command-Light | 0,0003 USD | 0,0006 USD |
Embed – anglais | 0,0001 USD | Non applicable |
Embed – multilingue | 0,0001 USD | Non applicable |
Tarification pour la personnalisation (ajustement)
Modèles Cohere | Prix pour entraîner 1 000 jetons | Prix pour stocker chaque modèle personnalisé par mois | Prix à déduire d’un modèle personnalisé par unité de modèle par heure (avec une tarification de débit provisionné sans engagement) |
Command de Cohere |
0,004 USD |
1,95 USD |
49,5 USD |
Command-Light de Cohere | 0,001 USD | 1,95 USD |
8,56 USD |
*Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement multipliés par le nombre d’époques
Tarification du débit alloué :
Modèles Cohere | Prix par heure et par modèle sans engagement |
Tarif horaire par unité modèle pour un engagement d'un mois | Tarif horaire par unité modèle pour un engagement de six mois |
Command de Cohere |
49,5 USD | 39,60 USD |
23,77 USD |
Command-Light de Cohere | 8,56 USD | 6,85 USD |
4,11 USD |
Embed – anglais | 7,12 USD | 6,76 USD |
6,41 USD |
Embed – multilingue | 7,12 USD | 6,76 USD |
6,41 USD |
Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.
Metal Lama 2
Tarification à la demande et par lots
Modèles Meta | Prix pour 1 000 jetons d’entrée | Prix pour 1 000 jetons de sortie |
Lama 2 Chat (13B) |
0,00075 USD |
0,001 USD |
Lama 2 Chat (70B) | 0,00195 USD |
0,00256 USD |
Tarification pour la personnalisation du modèle (ajustement)
Modèles Meta | Prix pour entraîner 1 000 jetons | Prix pour stocker chaque modèle personnalisé* par mois | Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement) |
Llama 2 préentraîné (13B) |
0,00149 USD |
1,95 USD |
23,5 USD |
Llama 2 préentraîné (70B) | 0,00799 USD |
1,95 USD | 23,5 USD |
*Stockage de modèles personnalisés = 1,95 USD
Tarification du débit alloué :
Modèles Meta | Tarif horaire par unité modèle pour un engagement d’un mois | Tarif horaire par unité modèle pour un engagement de six mois |
Llama 2 préentraîné et chat (13B) |
21,18 USD |
13,08 USD |
Llama 2 préentraîné (70B) | 21,18 USD |
13,08 USD |
*Les modèles préentraînés de Llama 2 ne sont disponibles qu’en débit provisionné après personnalisation.
Pour plus de détails sur les unités de modèle, veuillez contacter l’équipe responsable de votre compte AWS ou l’équipe des ventes.
Mistral AI
Tarification à la demande - Régions : USA Est (Virginie du Nord), USA Ouest (Oregon)
Modèles Mistral AI | Prix pour 1 000 jetons d'entrée | Prix pour 1 000 jetons de sortie |
Mistral 7B | 0,00015 USD |
0,0002 USD |
Mixtral 8x7B | 0,00045 USD |
0,0007 USD |
Mistral Large | 0,008 USD | 0,024 USD |
Tarification à la demande – Régions : Europe (Paris), Asie-Pacifique (Sydney)
Modèle Mistral AI | Prix pour 1 000 jetons d'entrée | Prix pour 1 000 jetons de sortie |
Mistral 7B | 0,0002 USD |
0,00026 USD |
Mixtral 8x7B | 0,00059 USD |
0,00091 USD |
Mistral Large | 0,0104 USD | 0,0312 USD |
Stability AI
Tarification à la demande et par lots
Les modèles d’image proposés par Stability AI sont facturés par image, en fonction du nombre de pas et de la résolution de l’image :
Modèle de Stability AI | Résolution de l’image | Prix par image générée pour la qualité standard (<=50 étapes) | Prix par image générée pour la qualité supérieure (>50 étapes) |
SDXL 0.8 |
512 × 512 ou plus petit |
0,018 USD par image |
0,036 USD par image |
Plus grand que 512 × 512 |
0,036 USD par image |
0,072 USD par image |
|
SDXL 1.0 | Jusqu’à 1024 × 1024 |
0,04 USD | 0,08 USD |
Tarification du débit alloué :
Modèle de Stability AI | Tarif horaire par unité modèle pour un engagement d’un mois* | Tarif horaire par unité modèle pour un engagement de six mois* |
SDXL 1.0 |
49,86 USD |
46,18 USD |
**Comprend l’inférence pour les modèles de base et les modèles personnalisés.
Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.
Actuellement, la personnalisation des modèles (ajustement) n’est pas prise en charge pour les modèles Stability AI sur Amazon Bedrock.
Exemples de tarification
-
AI21 Labs
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD
-
Amazon
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Lite d’Amazon Titan Text pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base de Titan Image Generator pour générer 1 000 images de taille 1024 × 1024 au format de qualité standard
Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD
Tarification de la personnalisation (ajustement et préentraînement continu)
Un développeur d’applications personnalise un modèle Titan Image Generation à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit alloué (engagement d’un mois) pour héberger le modèle personnalisé.
Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Tarification du débit alloué
Un développeur d’applications achète deux unités de modèles de Titan Text Express avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 2 unités de modèles x 18,4 USD/heure x 24 heures x 31 jours = 27 379,2 USD
Un développeur d’applications achète une unité de modèle du modèle de base Titan Image Generator avec un engagement d’un mois.
Coût total encouru = 1 x 16,2 USD x 24 heures x 31 jours = 12 052,8 USD
-
Anthropic
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Claude d’Anthropic pour résumer une entrée de 11 000 jetons de texte d’entrée à une sortie de 4 000 jetons.
Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Tarification du débit alloué
Un développeur d’applications achète une unité de modèle Claude Instant d’Anthropic dans la région USA Ouest (Oregon) :
Coût mensuel total encouru = 1 unité de modèle x 39,6 USD x 24 heures x 31 jours = 29 462,4 USD
-
Cohere
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Command de Cohere pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,002 USD = 0,013 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Command-Light de Cohere pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.
Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle anglais ou multilingue Embed de Cohere pour générer des intégrations pour 10 000 jetons d’entrée.
Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD
Tarification de la personnalisation (ajustement)
Un développeur d’applications personnalise un modèle Command de Cohere à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit alloué du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit alloué (engagement d’un mois) pour héberger le modèle personnalisé.
Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,5 USD) = 55,45 USD
Coût mensuel encouru pour le débit alloué (engagement d’un mois) du modèle personnalisé = 39,6 USD
Tarification du débit alloué
Un développeur d’applications achète une unité de modèle de Command de Cohere avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 1 unité de modèle x 39,6 USD x 24 heures x 31 jours = 29 462,4 USD
-
Meta
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Llama 2 Chat (13B) de Meta pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.
Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD
Tarification de la personnalisation (ajustement)
Un développeur d’applications personnalise le modèle Llama 2 préentraîné (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit alloué du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit alloué (engagement d’un mois) pour héberger le modèle personnalisé.
Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,5 USD) = 33,44 USD
Coût mensuel encouru pour le débit alloué (engagement d’un mois) du modèle personnalisé = 21,18 USD
Tarification du débit alloué
Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.
Coût mensuel total encouru = 1 unité de modèle x 21,2 USD x 24 heures x 31 jours = 15 772,8 USD
-
Mistral AI
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total = 2 000 jetons/1000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.
Coût horaire total = 2 000 jetons/1000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD
Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : Une requête au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons.
Coût horaire total encouru = 2 000 jetons/1000 x 0,008 USD + 1000 jetons/1 000 x 0,024 USD = 0,04 USD
-
Stability AI
Tarification à la demande
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille de pas de 70 (qualité supérieure).
Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD
Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.0 pour générer une image de 1024 x 1024 avec une taille de pas de 70 (qualité supérieure).
Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD
Tarification du débit alloué
Un développeur d’applications achète une unité de modèle de SDXL1.0 avec un engagement d’un mois.
Coût total = 1 x 49,86 USD x 24 heures x 31 jours = 37 095,84 USD