Tarifs d'Amazon Bedrock

Vue d'ensemble des tarifs

Amazon Bedrock est un service entièrement géré qui propose un choix de systèmes d’IA à usage général (FM) haute performance via une API unique, ainsi qu’un large éventail des capacités dont vous avez besoin pour créer des applications d’IA générative, ce qui simplifie le développement tout en préservant la confidentialité, la sécurité et une IA responsable.

Avec Amazon Bedrock, l’inférence et la personnalisation des modèles vous sont facturées. Vous avez le choix entre deux plans tarifaires pour l’inférence : 1/ à la demande et par lots : ce plan vous permet d’utiliser les FM sur la base du paiement à l’utilisation sans avoir à prendre d’engagements temporels. 2/ Débit alloué : ce plan vous permet d’allouer un débit suffisant pour répondre aux exigences de performances de votre application en échange d’un engagement à durée déterminée.

Modèles de tarification

À la demande

Avec le mode à la demande, vous ne payez que ce que vous consommez, sans engagement de durée. Pour les modèles de génération de texte, vous êtes facturé pour chaque jeton d’entrée traité et chaque jeton de sortie généré. Pour les modèles d’intégration, vous êtes facturé pour chaque jeton d’entrée traité. Un jeton est composé de quelques caractères et se réfère à l’unité de base du texte qu’un modèle apprend pour comprendre l’entrée et l’invite de l’utilisateur. Pour les modèles de génération d’images, vous êtes facturé pour chaque image générée.

Lot

Avec le mode par lots, vous pouvez fournir un ensemble d’invites dans un seul fichier d’entrée et recevoir les réponses dans un seul fichier de sortie, ce qui vous permet d’obtenir des prédictions simultanées à grande échelle. Les réponses sont traitées et stockées dans votre compartiment Amazon S3 afin que vous puissiez y accéder ultérieurement. La tarification du mode par lots est la même que celle du mode à la demande.

Débit alloué

Avec le mode de débit provisionné, vous pouvez acheter des unités de modèle pour un modèle de base ou un modèle personnalisé spécifique. Le mode de débit provisionné est principalement conçu pour les charges de travail d’inférence cohérentes importantes qui nécessitent un débit garanti. Les modèles personnalisés ne sont accessibles qu’à l’aide du débit provisionné. Une unité modèle fournit un certain débit, qui est mesuré par le nombre maximum de jetons d’entrée ou de sortie traités par minute. Avec la tarification du débit provisionné, vous êtes facturé à l’heure, vous avez la possibilité de choisir entre des conditions d’engagement d’un mois ou de six mois.

Personnalisation du modèle

Avec Amazon Bedrock, vous pouvez personnaliser les FM en fonction de vos données afin de fournir des réponses adaptées à des tâches spécifiques et à votre contexte commercial. Vous pouvez affiner les modèles à l’aide de données étiquetées ou utiliser un préentraînement continu avec des données non étiquetées. Pour la personnalisation d’un modèle de génération de texte, vous êtes facturé pour l’entraînement du modèle en fonction du nombre total de jetons traités par le modèle (nombre de jetons dans le corpus de données d’entraînement multiplié par le nombre d’époques) et pour le stockage du modèle facturé par mois et par modèle. Une époque correspond à un passage complet dans votre jeu de données d’entraînement lors d’un ajustement ou d’un préentraînement continu. Les inférences utilisant des modèles personnalisés sont facturées dans le cadre du plan de débit provisionné et nécessitent que vous achetiez le débit provisionné. Une unité de modèle est mise à disposition sans engagement de durée pour l’inférence sur un modèle personnalisé. Vous serez facturé pour le nombre d’heures que la première unité de modèle que vous utilisez pour l’inférence de modèle personnalisé. Si vous souhaitez augmenter votre débit au-delà d’une unité de modèle, vous devez souscrire un engagement d’un mois ou de six mois.

Des outils puissants pour créer sans frais supplémentaires

Lorsque vous utilisez des agents pour Amazon Bedrock et des bases de connaissances pour Amazon Bedrock, vous n’êtes facturé que pour les modèles et les bases de données vectorielles que vous utilisez avec ces capacités.

Ventilation de la tarification

La tarification dépend de la modalité, du fournisseur et du modèle. Sélectionnez le fournisseur du modèle pour voir les tarifs détaillés.

AI21 Labs

Tarification à la demande et par lots

Modèles AI21 Labs Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic 2 Ultra

0,0188 USD

0,0188 USD

Actuellement, la personnalisation du modèle (ajustement) et le débit provisionné ne sont pas pris en charge pour les modèles AI21 Labs sur Amazon Bedrock.

Amazon

Région

Anthropic

Tarification à la demande et par lots

Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,02400 USD

Claude 3 Opus*

0,01500 USD

0,07500 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

*Claude 3 Opus est actuellement disponible dans la région USA Ouest (Oregon).

Région : Asie-Pacifique (Sydney)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

Région : Europe (Paris)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haïku

0,00025 USD

0,00125 USD

Région : Asie-Pacifique (Tokyo)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Région : Europe (Francfort)

Modèles Anthropic Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Tarification du débit alloué :

Région : USA Est (Virginie du Nord) et USA Ouest (Oregon)

Modèles Anthropic Prix par heure par modèle avec
aucun engagement
Tarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

44,00 USD

39,60 USD

22 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Modèles Anthropic Prix par heure par modèle avec
aucun engagement
Tarif horaire par unité modèle pour un engagement d'un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

44,00 USD

39,60 USD

22 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Région : Asie-Pacifique (Tokyo)

Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

53 USD

29 USD

Claude 2.0/2.1

86 USD

48 USD

Région : Europe (Francfort)

Modèles Anthropic Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

Claude Instant

49 USD

27 USD

Claude 2.0/2.1

79 USD

44 USD

Contactez l’équipe responsable de votre compte AWS pour plus de détails sur les unités modèles. 

Cohere

Tarification à la demande et par lots

Modèles Cohere Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie
Command 0,0015 USD 0,002 USD
Command-Light 0,0003 USD 0,0006 USD
Embed – anglais 0,0001 USD Non applicable
Embed – multilingue 0,0001 USD Non applicable

Tarification pour la personnalisation (ajustement)

Modèles Cohere Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé par mois Prix à déduire d’un modèle personnalisé par unité de modèle par heure (avec une tarification de débit provisionné sans engagement)

Command de Cohere

0,004 USD

1,95 USD

49,5 USD

Command-Light de Cohere 0,001 USD

1,95 USD

8,56 USD

*Nombre total de jetons entraînés = nombre de jetons dans le corpus de données d’entraînement multipliés par le nombre d’époques

Tarification du débit alloué :

Modèles Cohere Prix par heure et par modèle 
sans engagement
Tarif horaire par unité modèle pour un engagement d'un mois

Tarif horaire par unité modèle pour un engagement de six mois

Command de Cohere

49,5 USD

39,60 USD

23,77 USD

Command-Light de Cohere 8,56 USD

6,85 USD

4,11 USD
Embed – anglais 7,12 USD

6,76 USD

6,41 USD
Embed – multilingue 7,12 USD

6,76 USD

6,41 USD

Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles. 

Metal Lama 2

Tarification à la demande et par lots 

Modèles Meta Prix pour 1 000 jetons d’entrée Prix pour 1 000 jetons de sortie

Lama 2 Chat (13B)

0,00075 USD

0,001 USD

Lama 2 Chat (70B)

0,00195 USD

0,00256 USD

Tarification pour la personnalisation du modèle (ajustement)

Modèles Meta Prix pour entraîner 1 000 jetons Prix pour stocker chaque modèle personnalisé* par mois Prix à déduire d’un modèle personnalisé pour une unité de modèle par heure (avec une tarification de débit provisionné sans engagement)

Llama 2 préentraîné (13B)

0,00149 USD

1,95 USD

23,5 USD

Llama 2 préentraîné (70B)

0,00799 USD

1,95 USD 23,5 USD

*Stockage de modèles personnalisés = 1,95 USD

Tarification du débit alloué :

Modèles Meta Tarif horaire par unité modèle pour un engagement d’un mois Tarif horaire par unité modèle pour un engagement de six mois

Llama 2 préentraîné et chat (13B)

21,18 USD

13,08 USD

Llama 2 préentraîné (70B)

21,18 USD

13,08 USD

*Les modèles préentraînés de Llama 2 ne sont disponibles qu’en débit provisionné après personnalisation.

Pour plus de détails sur les unités de modèle, veuillez contacter l’équipe responsable de votre compte AWS ou l’équipe des ventes.

Mistral AI

Tarification à la demande - Régions : USA Est (Virginie du Nord), USA Ouest (Oregon)

Modèles Mistral AI Prix pour 1 000 jetons d'entrée Prix pour 1 000 jetons de sortie
Mistral 7B

0,00015 USD

0,0002 USD

Mixtral 8x7B

0,00045 USD

0,0007 USD
Mistral Large 0,008 USD 0,024 USD

Tarification à la demande – Régions : Europe (Paris), Asie-Pacifique (Sydney) 

Modèle Mistral AI Prix pour 1 000 jetons d'entrée Prix pour 1 000 jetons de sortie
Mistral 7B

0,0002 USD

0,00026 USD

Mixtral 8x7B

0,00059 USD

0,00091 USD
Mistral Large 0,0104 USD 0,0312 USD
Région

Stability AI

Tarification à la demande et par lots

Les modèles d’image proposés par Stability AI sont facturés par image, en fonction du nombre de pas et de la résolution de l’image :

Modèle de Stability AI Résolution de l’image Prix par image générée pour la qualité standard (<=50 étapes) Prix par image générée pour la qualité supérieure (>50 étapes)

 

SDXL 0.8

512 × 512 ou plus petit

0,018 USD par image

0,036 USD par image

Plus grand que 512 × 512

0,036 USD par image

0,072 USD par image

SDXL 1.0

Jusqu’à 1024 × 1024

0,04 USD 0,08 USD

Tarification du débit alloué :

Modèle de Stability AI Tarif horaire par unité modèle pour un engagement d’un mois* Tarif horaire par unité modèle pour un engagement de six mois*

SDXL 1.0

49,86 USD

46,18 USD

**Comprend l’inférence pour les modèles de base et les modèles personnalisés.

Contactez l’équipe responsable de votre compte AWS ou l’équipe des ventes pour plus de détails sur les unités modèles.

Actuellement, la personnalisation des modèles (ajustement) n’est pas prise en charge pour les modèles Stability AI sur Amazon Bedrock.

Exemples de tarification

  • Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Jurrasic-2 Mid d’AI21 pour résumer une entrée de 10 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 10 000 jetons/1 000 x 0,0125 USD + 2 000 jetons/1 000 x 0,0125 USD = 0,15 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Lite d’Amazon Titan Text pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total encouru = 2 000 jetons/1 000 x 0,0003 USD + 1 000 jetons/1 000 x 0,0004 USD = 0,001 USD.

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle de base de Titan Image Generator pour générer 1 000 images de taille 1024 × 1024 au format de qualité standard

    Coût total encouru = 1 000 images x 0,01 USD par image = 10 USD

    Tarification de la personnalisation (ajustement et préentraînement continu)

    Un développeur d’applications personnalise un modèle Titan Image Generation à l’aide de 1 000 paires image-texte. Après l’entraînement, le développeur utilise le débit du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit alloué (engagement d’un mois) pour héberger le modèle personnalisé.

    Le coût mensuel encouru pour l’ajustement est le suivant : entraînement de l’ajustement (0,005 USD x 500 x 64), où 0,005 USD est le prix par image vue, 500 est le nombre d’étapes et 64 est la taille du lot + stockage du modèle personnalisé par mois (1,95 USD) + une heure d’inférence de modèle personnalisé (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Tarification du débit alloué

    Un développeur d’applications achète deux unités de modèles de Titan Text Express avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 2 unités de modèles x 18,4 USD/heure x 24 heures x 31 jours = 27 379,2 USD

    Un développeur d’applications achète une unité de modèle du modèle de base Titan Image Generator avec un engagement d’un mois.

    Coût total encouru = 1 x 16,2 USD x 24 heures x 31 jours = 12 052,8 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock dans la région USA Ouest (Oregon) : une demande au modèle Claude d’Anthropic pour résumer une entrée de 11 000 jetons de texte d’entrée à une sortie de 4 000 jetons.

    Coût total encouru = 11 000 jetons/1 000 x 0,008 USD + 4 000 jetons/1 000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Tarification du débit alloué

    Un développeur d’applications achète une unité de modèle Claude Instant d’Anthropic dans la région USA Ouest (Oregon) :

    Coût mensuel total encouru = 1 unité de modèle x 39,6 USD x 24 heures x 31 jours = 29 462,4 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Command de Cohere pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 6 000 jetons/1 000 x 0,0015 USD + 2 000 jetons/1 000 x 0,002 USD = 0,013 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Command-Light de Cohere pour résumer une entrée de 6 000 jetons de texte d’entrée en une sortie de 2 000 jetons.

    Coût total encouru = 6 000 jetons/1 000 x 0,0003 USD + 2 000 jetons/1 000 x 0,0006 USD = 0,003 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle anglais ou multilingue Embed de Cohere pour générer des intégrations pour 10 000 jetons d’entrée.

    Coût total encouru = 10 000 jetons/1 000 x 0,0001 USD = 0,001 USD

    Tarification de la personnalisation (ajustement)

    Un développeur d’applications personnalise un modèle Command de Cohere à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit alloué du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit alloué (engagement d’un mois) pour héberger le modèle personnalisé.

    Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,004 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (49,5 USD) = 55,45 USD

    Coût mensuel encouru pour le débit alloué (engagement d’un mois) du modèle personnalisé = 39,6 USD

    Tarification du débit alloué

    Un développeur d’applications achète une unité de modèle de Command de Cohere avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 1 unité de modèle x 39,6 USD x 24 heures x 31 jours = 29 462,4 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle Llama 2 Chat (13B) de Meta pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 500 jetons.

    Coût total encouru = 2 000 jetons/1 000 x 0,00075 USD + 500 jetons/1 000 x 0,001 USD = 0,002 USD

    Tarification de la personnalisation (ajustement)

    Un développeur d’applications personnalise le modèle Llama 2 préentraîné (70B) à l’aide de 1 000 jetons de données. Après l’entraînement, il utilise le débit alloué du modèle personnalisé pendant une heure pour évaluer les performances du modèle. Le modèle ajusté est conservé pendant un mois. Après évaluation, le développeur utilise le débit alloué (engagement d’un mois) pour héberger le modèle personnalisé.

    Coût mensuel encouru pour l’ajustement = ajustement de l’entraînement (0,00799 USD x 1 000) + stockage du modèle personnalisé par mois (1,95 USD) + 1 heure d’inférence du modèle personnalisé (23,5 USD) = 33,44 USD

    Coût mensuel encouru pour le débit alloué (engagement d’un mois) du modèle personnalisé = 21,18 USD

    Tarification du débit alloué

    Un développeur d’applications achète une unité de modèle de Meta Llama 2 avec un engagement d’un mois pour son cas d’utilisation de résumé de texte.

    Coût mensuel total encouru = 1 unité de modèle x 21,2 USD x 24 heures x 31 jours = 15 772,8 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mistral 7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total = 2 000 jetons/1000 x 0,00015 USD + 1 000 jetons/1 000 x 0,0002 USD = 0,0005 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock toutes les heures : une demande au modèle Mixtral 8x7B pour résumer une entrée de 2 000 jetons de texte d’entrée en une sortie de 1 000 jetons.

    Coût horaire total = 2 000 jetons/1000 x 0,00045 USD + 1 000 jetons/1 000 x 0,0007 USD = 0,0016 USD

    Un développeur d'application effectue les appels d'API suivants à Amazon Bedrock toutes les heures : Une requête au modèle Mistral Large pour résumer une entrée de 2 000 jetons de texte d'entrée en une sortie de 1 000 jetons. 

    Coût horaire total encouru = 2 000 jetons/1000 x 0,008 USD + 1000 jetons/1 000 x 0,024 USD = 0,04 USD

  • Tarification à la demande

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL pour générer une image de 512 x 512 avec une taille de pas de 70 (qualité supérieure).

    Coût total encouru = 1 image x 0,036 USD par image = 0,036 USD

    Un développeur d’applications effectue les appels d’API suivants à Amazon Bedrock : une demande au modèle SDXL1.0 pour générer une image de 1024 x 1024 avec une taille de pas de 70 (qualité supérieure).

    Coût total encouru = 1 image x 0,08 USD par image = 0,08 USD

    Tarification du débit alloué

    Un développeur d’applications achète une unité de modèle de SDXL1.0 avec un engagement d’un mois.

    Coût total = 1 x 49,86 USD x 24 heures x 31 jours = 37 095,84 USD