Amazon Bedrock – Preisgestaltung

Preisübersicht

Amazon Bedrock ist ein vollständig verwalteter Service, der eine Auswahl an leistungsstarken Basismodellen (FMs) über eine einzige API sowie eine breite Palette von Funktionen bietet, die Sie für die Entwicklung generativer KI-Anwendungen mit Sicherheit, Datenschutz und verantwortungsvoller KI benötigen.

Bei Amazon Bedrock werden Ihnen Modellinferenzen und Anpassungen in Rechnung gestellt. Sie haben die Wahl zwischen zwei Preisplänen für Inferenzen: 1. On-Demand und Batch: In diesem Modus können Sie FMs auf Basis nutzungsabhängiger Preisberechnung verwenden, ohne zeitbasierte Laufzeitverpflichtungen eingehen zu müssen. 2. Bereitgestellter Durchsatz: In diesem Modus können Sie ausreichend Durchsatz bereitstellen, um die Leistungsanforderungen Ihrer Anwendung zu erfüllen, und zwar im Gegenzug für eine zeitbasierte Laufzeitverpflichtigung.

Preismodelle

On-Demand

Im On-Demand-Modus zahlen Sie nur für das, was Sie tatsächlich nutzen, ohne zeitliche Verpflichtungen. Bei Modellen zur Textgenerierung wird Ihnen jedes verarbeitete Eingabe-Token und jedes generierte Ausgabe-Token in Rechnung gestellt. Für eingebettete Modelle wird Ihnen jedes verarbeitete Eingabe-Token in Rechnung gestellt. Ein Token besteht aus wenigen Zeichen und bezieht sich auf die grundlegende Texteinheit, mit der ein Modell lernt, Benutzereingaben und Eingabeaufforderungen zu verstehen. Bei Modellen zur Bildgenerierung wird Ihnen jedes generierte Bild in Rechnung gestellt.

Batch

Im Batch-Modus können Sie eine Reihe von Eingabeaufforderungen als einzelne Eingabedatei bereitstellen und Antworten als eine einzige Ausgabedatei erhalten, sodass Sie gleichzeitig umfangreiche Vorhersagen erhalten können. Die Antworten werden verarbeitet und in Ihrem Amazon-S3-Bucket gespeichert, sodass Sie zu einem späteren Zeitpunkt darauf zugreifen können. Die Preise für den Batch-Modus sind die gleichen wie für den On-Demand-Modus.

Bereitgestellter Durchsatz

Im Modus „Bereitgestellter Durchsatz“ können Sie Modelleinheiten für ein bestimmtes Basismodell oder ein benutzerdefiniertes Modell erwerben. Der Modus „Bereitgestellter Durchsatz“ ist in erster Linie für große konsistente Inferenz-Workloads konzipiert, die einen garantierten Durchsatz benötigen. Auf benutzerdefinierte Modelle kann nur über den Modus „Bereitgestellter Durchsatz“ zugegriffen werden. Eine Modelleinheit bietet einen bestimmten Durchsatz, der an der maximalen Anzahl von Eingabe- oder Ausgabe-Tokens gemessen wird, die pro Minute verarbeitet werden. Bei der Preisgestaltung des Modus „Bereitgestellter Durchsatz“ wird Ihnen stundenweise in Rechnung gestellt. Sie haben die Flexibilität, zwischen 1-monatigen oder 6-monatigen Verpflichtungsfristen zu wählen.

Modellanpassung

Mit Amazon Bedrock können Sie Basismodelle mit Ihren Daten anpassen, um maßgeschneiderte Antworten für bestimmte Aufgaben und Ihren Geschäftskontext zu liefern. Sie können Modelle mit beschrifteten Daten verfeinern oder ein kontinuierliches Vortraining mit unbeschrifteten Daten durchführen. Für die Anpassung eines Textgenerierungsmodells wird Ihnen das Modelltraining basierend auf der Gesamtzahl der vom Modell verarbeiteten Token (Anzahl der Token im Trainingsdatenkorpus multipliziert mit der Anzahl der Epochen) und der Modellspeicher, der pro Monat pro Modell berechnet wird, in Rechnung gestellt. Eine Epoche bezieht sich auf einen vollständigen Durchlauf Ihres Trainingsdatensatzes während der Feinabstimmung oder der Fortsetzung des Vortrainings. Inferenzen, die benutzerdefinierte Modelle verwenden, werden im Rahmen des Plans des bereitgestellten Durchsatzes berechnet und erfordern den Kauf vom bereitgestellten Durchsatz. Eine Modelleinheit wird ohne verbindliche Frist für Inferenzen auf ein kundenspezifisches Modell zur Verfügung gestellt. Ihnen wird die Anzahl der Stunden in Rechnung gestellt, die die erste Modelleinheit für benutzerdefinierte Modellinferenzen verwendet hat. Wenn Sie Ihren Durchsatz über eine Modelleinheit hinaus steigern möchten, müssen Sie eine 1-monatige oder 6-monatige Verpflichtungsfrist erwerben.

Modellevaluierung

Mit der Modellevaluierung in Amazon Bedrock zahlen Sie für das, was Sie nutzen, ohne sich auf die Anzahl der Aufforderungen oder Antworten festlegen zu müssen. Bei der automatischen Bewertung zahlen Sie nur für die Inferenz, die sich aus dem von Ihnen gewählten Modell bei der Bewertung ergibt. Die automatisch generierten algorithmischen Ergebnisse werden ohne Aufpreis zur Verfügung gestellt. Bei einer Bewertung durch Menschen, bei der Sie Ihr eigenes Arbeitsteam mitbringen, wird Ihnen die Modellinferenz in der Bewertung in Rechnung gestellt. Außerdem wird eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Aufgabe berechnet. Eine menschliche Aufgabe ist definiert als das Vorkommen, dass ein menschlicher Mitarbeiter eine Bewertung einer einzelnen Aufforderung und der zugehörigen Inferenzantworten in der Benutzeroberfläche für die menschliche Bewertung abgibt. Der Preis ist derselbe, unabhängig davon, ob Sie ein oder zwei Modelle in Ihrem Bewertungsauftrag verwenden, und auch unabhängig davon, wie viele Bewertungsmetriken und Bewertungsmethoden Sie einbeziehen. Die Gebühren für menschliche Aufgaben werden in Ihrer AWS-Rechnung im Abschnitt Amazon SageMaker angezeigt und sind für alle AWS-Regionen gleich. Für die Belegschaft fallen keine gesonderten Kosten an, da die Belegschaft von Ihnen gestellt wird. Für eine von AWS verwaltete Bewertung werden die Preise in einem privaten Gespräch und in Zusammenarbeit mit dem AWS-Expertenbewertungsteam an Ihre Bewertungsanforderungen angepasst.

Leistungsstarke Tools zum Entwickeln ohne Zusatzgebühr

Wenn Sie Kundendienstmitarbeiter für Amazon Bedrock und Wissensdatenbanken für Amazon Bedrock verwenden, werden Ihnen nur die Modelle und Vektordatenbanken in Rechnung gestellt, die Sie mit diesen Funktionen verwenden.

Preisaufschlüsselung

Die Preisgestaltung hängt von der Modalität, dem Anbieter und dem Modell ab. Bitte wählen Sie den Modellanbieter aus, um die detaillierten Preise zu sehen.

AI21 Labs

On-Demand- und Batch-Preise

AI21-Labs-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic-2 Ultra

0,0188 USD

0,0188 USD

Amazon

Region

Anthropic

On-Demand- und Batch-Preise

Region: USA Ost (Nord-Virginia) und USA West (Oregon)

Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Claude 3 Opus*

0,015 USD

0,075 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

*Claude 3 Opus ist derzeit in der Region USA West (Oregon) verfügbar.

Region: Asien-Pazifik (Mumbai)

Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Region: Asien-Pazifik (Sydney)

Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Region: Europa (Paris)

Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Region: Asien-Pazifik (Tokio)

Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Region: Europa (Frankfurt)

Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0/2.1

0,008 USD

0,024 USD

Preise für bereitgestellten Durchsatz

Region: USA Ost (Nord-Virginia) und USA West (Oregon)

Anthropic-Modelle Preis pro Stunde pro Modell
ohne Verpflichtung
Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Anthropic-Modelle Preis pro Stunde pro Modell
ohne Verpflichtung
Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0/2.1

70,00 USD

63,00 USD

35,00 USD

Region: Asien-Pazifik (Tokio)

Anthropic-Modelle Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten

Claude Instant

53,00 USD

29,00 USD

Claude 2.0/2.1

86,00 USD

48,00 USD

Region: Europa (Frankfurt)

Anthropic-Modelle Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten

Claude Instant

49,00 USD

27,00 USD

Claude 2.0/2.1

79,00 USD

44,00 USD

Für weitere Informationen zu Modelleinheiten wenden Sie sich bitte an Ihr AWS-Kundenteam. 

Cohere

On-Demand- und Batch-Preise

Cohere-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token
Command 0,0015 USD 0,0020 USD
Command-Light 0,0003 USD 0,0006 USD
Command R+ 0,0030 USD 0,0150 USD
Command R 0,0005 USD 0,0015 USD
Embed – Englisch 0,0001 USD
Embed – Mehrsprachig 0,0001 USD

Preise für Anpassungen (Feinabstimmung)

Cohere-Modelle Preis für das Training von 1 000 Token Preis für die Lagerung jedes benutzerdefinierten Modells pro Monat Preis, der von einem benutzerdefinierten Modell pro Modelleinheit pro Stunde abgeleitet werden kann (mit unverbindlichen Preisen für den bereitgestellten Durchsatz)

Cohere Command

0,004 USD

1,95 USD

49,50 USD

Cohere Command-Light 0,001 USD

1,95 USD

8,56 USD

*Gesamtzahl der trainierten Token = Anzahl der Token im Trainingsdatenkorpus x Anzahl der Epochen

Preise für bereitgestellten Durchsatz

Cohere-Modelle Preis pro Stunde pro Modell 
ohne Verpflichtung
Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat

Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten

Cohere Command

49,50 USD

39,60 USD

23,77 USD

Cohere Command – Light 8,56 USD

6,85 USD

4,11 USD
Embed – Englisch 7,12 USD

6,76 USD

6,41 USD
Embed – Mehrsprachig 7,12 USD

6,76 USD

6,41 USD

Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten. 

Meta Llama

Llama 3

On-Demand- und Batch-Preise

Region

Llama 2

On-Demand- und Batch-Preise

Region: USA Ost (Nord-Virginia) und USA West (Oregon)

Meta-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token

Llama 2 Chat (13B)

0,00075 USD

0,001 USD

Llama 2 Chat (70B)

0,00195 USD

0,00256 USD

Preise für die Modellanpassung (Feinabstimmung)

Meta-Modelle Preis für das Training von 1 000 Token Preis für die Lagerung jedes benutzerdefinierten Modells* pro Monat Aus einem benutzerdefinierten Modell abzuleitender Preis für 1 Modelleinheit pro Stunde (mit unverbindlichen Preisen für bereitgestellten Durchsatz)

Lama 2 Vortrainiert (13B)

0,00149 USD

1,95 USD

23,50 USD

Lama 2 Vortrainiert (70B)

0,00799 USD

1,95 USD 23,50 USD

*Benutzerdefinierter Modellspeicher = 1,95 USD

Preise für bereitgestellten Durchsatz

Meta-Modelle Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten

Llama 2 Vortrainiert und Chat (13B)

21,18 USD

13,08 USD

Lama 2 Vortrainiert (70B)

21,18 USD

13,08 USD

*Vortrainierte Llama-2-Modelle sind nach der Anpassung nur im bereitgestellten Durchsatz verfügbar. 

Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.

Mistral AI

Region
Region

Stability AI

On-Demand- und Batch-Preise

Die von Stability AI angebotenen Bildmodelle werden pro Bild berechnet, abhängig von der Anzahl der Schritte und der Bildauflösung.

Stability-AI-Modell Auflösung des Bildes Preis pro generiertem Bild in Standardqualität (<=50 Schritte) Preis pro generiertem Bild in Premium-Qualität (>50 Schritte)

 

SDXL 0.8

512 x 512 oder kleiner

0,018 USD pro Bild

0,036 USD pro Bild

Größer als 512 x 512

0,036 USD pro Bild

0,072 USD pro Bild

SDXL 1.0

Bis zu 1 024 x 1 024

0,04 USD 0,08 USD

Preise für bereitgestellten Durchsatz

Stability-AI-Modell Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat* Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten*

SDXL 1.0

49,86 USD

46,18 USD

*Beinhaltet Inferenzen für Basismodelle und benutzerdefinierte Modelle.

Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.

Derzeit wird die Modellanpassung (Feinabstimmung) für Stability-AI-Modelle in Amazon Bedrock nicht unterstützt.

Integritätsschutz für Amazon Bedrock

On-Demand-Preise

Integritätsschutz-Richtlinie* Preis pro 1 000 Texteinheiten**

Inhaltsfilter

0,75 USD

Abgelehnte Themen

1 USD

Filter für vertraulicher Informationen (PII)

0,10 USD

Filter für vertrauliche Informationen (regulärer Ausdruck)  Kostenlos
Wortfilter

Kostenlos

* Jede Integritätsschutz-Richtlinie ist optional und kann je nach Ihren Anwendungsanforderungen aktiviert werden. Die Gebühren richten sich nach dem Richtlinientyp, der für den Integritätsschutz verwendet wurde. Wenn beispielsweise einen Integritätsschutz mit Inhaltsfiltern und abgelehnten Themen konfiguriert ist, fallen für diese beiden Richtlinien Gebühren an, während für Filter für vertrauliche Informationen keine Gebühren anfallen.

**Eine Texteinheit kann bis zu 1 000 Zeichen enthalten. Wenn eine Texteingabe mehr als 1 000 Zeichen umfasst, wird sie als mehrere Texteinheiten verarbeitet, die jeweils 1 000 Zeichen oder weniger enthalten. Wenn eine Texteingabe beispielsweise 5 600 Zeichen enthält, werden 6 Texteinheiten berechnet.


Integritätsschutz wird für Bilder und Einbettungen nicht unterstützt.

Preisbeispiele

  • Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Jurrasic-2-Mid-Modell von AI21, eine Eingabe von 10 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

    Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0125 USD + 2 000 Token / 1 000 * 0,0125 USD = 0,15 USD

  • On-Demand-Preise

    Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Lite-Modell von Amazon Titan Text, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

    Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,0003 USD + 1 000 Token / 1 000 * 0,0004 USD = 0,001 USD

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Basismodell von Amazon Titan Image Generator, um 1 000 Bilder mit einer Größe von 1024 x 1024 in Standardqualität zu generieren.

    Anfallende Gesamtkosten = 1 000 Bilder * 0,01 USD pro Bild = 10 USD

    Preise für die Anpassung (Feinabstimmung und kontinuierliche Vorschulung)

    Ein Anwendungsentwickler passt ein Amazon-Titan-Image-Generator-Modell mithilfe von 1 000 Bild-Text-Paaren an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

    Für die Feinabstimmung fallen monatlich die folgenden Kosten an = Training der Feinabstimmung (0,005 USD * 500 * 64), wobei 0,005 USD der Preis pro betrachtetes Bild, 500 die Anzahl der Schritte und 64 die Batch-Größe + benutzerdefinierter Modellspeicher pro Monat (1,95 USD) + 1 Stunde benutzerdefinierte Modellinferenz (21 USD) = 160 USD + 1.95 USD + 21 = 182,95 USD

    Preise für bereitgestellten Durchsatz

    Ein Anwendungsentwickler kauft zwei Modelleinheiten von Amazon Titan Text Express mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.

    Anfallende monatliche Gesamtkosten = 2 Modelleinheiten * 18,40 USD / Stunde * 24 Stunden * 31 Tage = 27 379,20 USD

    Ein Anwendungsentwickler kauft eine Modelleinheit des Basismodells von Amazon Titan Image Generator mit 1 Monat Vertragsbindung.

    Anfallende Gesamtkosten = 1 Modelleinheit * 16,20 USD * 24 Stunden * 31 Tage = 12 052,80 USD

  • On-Demand-Preise

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock in der Region USA West (Oregon): Eine Anfrage an das Claude-Modell von Anthropic, eine Eingabe von 11 000 Token an Eingangstext zu einer Ausgabe von 4 000 Token zusammenzufassen.

    Anfallende Gesamtkosten = 11 000 Token / 1 000 * 0,008 USD + 4 000 Token / 1 000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Preise für bereitgestellten Durchsatz

    Ein Anwendungsentwickler kauft eine Modelleinheit von Anthropic Claude Instant in der Region USA West (Oregon):

    Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD

  • On-Demand-Preise

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anforderung an das Command-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

    Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0015 USD + 2 000 Token / 1 000 * 0,0020 USD = 0,013 USD

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Command-Light-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

    Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0003 USD + 2 000 Token / 1 000 * 0,0006 USD = 0,003 USD

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das englische oder mehrsprachige Embed-Modell von Cohere, um Einbettungen für 10 000 Eingabe-Token zu generieren.

    Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0001 USD = 0,001 USD

    Preise für die Anpassung (Feinabstimmung)

    Ein Anwendungsentwickler passt ein Cohere-Command-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

    Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,004 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + eine Stunde Inferenz für benutzerdefinierte Modelle (49,50 USD) = 55,45 USD

    Monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 39,60 USD

    Preise für bereitgestellten Durchsatz

    Ein Anwendungsentwickler kauft eine Modelleinheit von Cohere Command mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.

    Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD

  • On-Demand-Preise

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Chat-Modell von Llama 2 (13B) von Meta, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 500 Token zusammenzufassen.

    Anfallende Gesamtkosten = 2 000 Token / 1 000 * 0,00075 USD + 500 Token / 1 000 * 0,001 USD = 0,002 USD

    Preise für die Anpassung (Feinabstimmung)

    Ein Anwendungsentwickler passt das vortrainierte Llama 2 (70B)-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

    Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,00799 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + 1 Stunde Inferenz für benutzerdefinierte Modelle (23,50 USD) = 33,44 USD

    Anfallende monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 21,18 USD

    Preise für bereitgestellten Durchsatz

    Ein Anwendungsentwickler kauft eine Modelleinheit von Meta Llama 2 mit einer Vertragsbindung von einem Monat für seinen Anwendungsfall zur Textzusammenfassung.

    Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 21,18 USD * 24 Stunden * 31 Tage = 15 757,92 USD

  • On-Demand-Preise

    Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mistral-7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

    Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00015 USD + 1000 Token / 1 000 * 0,0002 USD = 0,0005 USD

    Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mixtral-8x7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

    Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00045 USD + 1 000 Token / 1 000 * 0,0007 USD = 0,0016 USD

    Ein Anwendungsentwickler führt stündlich die folgenden API-Aufrufe an Amazon Bedrock durch: Eine Anfrage an das Mistral-Large-Modell, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 1 000 Token zusammenzufassen. 

    Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,008 USD + 1 000 Token / 1 000 * 0,024 USD = 0,04 USD

  • On-Demand-Preise

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-Modell, ein Bild mit einer Größe von 512 x 512 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).

    Anfallende Gesamtkosten = 1 Bild * 0,036 USD pro Bild = 0,036 USD

    Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-1.0-Modell, ein Bild mit einer Größe von 1024 x 1024 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).

    Anfallende Gesamtkosten = 1 Bild * 0,08 USD pro Bild = 0,08 USD

    Preise für bereitgestellten Durchsatz

    Ein Anwendungsentwickler kauft eine Modelleinheit von SDXL 1.0 mit 1 Monat Vertragsbindung.

    Anfallende Gesamtkosten = 1 * 49,86 USD * 24 Stunden * 31 Tage = 37 095,84 USD

  • Beispiel 1 zur Modellevaluierung:

    On-Demand-Preise
    Ein Anwendungsentwickler übermittelt einen Datensatz zur menschenbasierten Modellevaluierung mit Anthropic Claude 2.1 und Anthropic Claude Instant in der AWS-Region USA Ost (Nord-Virginia).

    Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 1 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“).

    Dieser Evaluierungsauftrag umfasst 50 Aufgaben (1 Aufgabe für jedes Eingabeaufforderungs-/Antwortpaar pro Mitarbeiter). Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.

    Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:

    Element Anzahl der Eingabe-Tokens Preis pro 1 000 Eingabe-Token Kosten der Eingabe Anzahl der Ausgabe-Tokens Preis pro 1 000 Ausgabe-Tokens Kosten der Ausgabe Anzahl menschlicher Aufgaben Preis pro menschlicher Aufgabe Kosten menschlicher Aufgaben Gesamtsumme
    Claude Instant Inference 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Menschliche Aufgaben             50 0,21 USD 10,50 USD 10,50 USD
    Gesamtsumme                   11,06 USD

    Beispiel 2 zur Modellevaluierung:

    On-Demand-Preise
    Ein Anwendungsentwickler übermittelt einen Datensatz zur menschenbasierten Modellevaluierung mit Anthropic Claude 2.1 und Anthropic Claude Instant in der AWS-Region USA Ost (Nord-Virginia).

    Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 2 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“). Dieser Evaluierungsauftrag umfasst 100 Aufgaben (1 Aufgabe für jeden Eingabeaufforderungs-/Antwortsatz pro Mitarbeiter: 2 Mitarbeiter x 50 Eingabeaufforderungs-/Antwortsätze = 100 menschliche Aufgaben).

    Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.

    Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:

    Element Anzahl der Eingabe-Tokens Preis pro 1 000 Eingabe-Token Kosten der Eingabe Anzahl der Ausgabe-Tokens Preis pro 1 000 Ausgabe-Tokens Kosten der Ausgabe Anzahl menschlicher Aufgaben Preis pro menschlicher Aufgabe Kosten menschlicher Aufgaben Gesamtsumme
    Claude Instant Inference 5 000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Menschliche Aufgaben             100 0,21 USD 21,00 USD 21,00 USD
    Gesamtsumme                   21,56 USD
  • Beispiel 1: Chatbot für den Kundensupport
    Ein Anwendungsentwickler erstellt einen Chatbot für den Kundensupport und verwendet Inhaltsfilter, um schädliche Inhalte zu blockieren, und abgelehnte Themen, um unerwünschte Anfragen und Antworten herauszufiltern.

    Der Chatbot bedient 1 000 Benutzeranfragen pro Stunde. Jede Benutzerabfrage hat eine durchschnittliche Eingabelänge von 200 Zeichen und erhält eine FM-Antwort von 1 500 Zeichen.

    Jede Benutzerabfrage von 200 Zeichen entspricht einer Texteinheit.

    Jede FM-Antwort von 1 500 Zeichen entspricht 2 Texteinheiten.

    Pro Stunde verarbeitete Texteinheiten = (1+2) * 1 000 Abfragen = 3 000 Texteinheiten

    Anfallende Gesamtkosten pro Stunde für Inhaltsfilter und abgelehntes Thema = 3 000 * (0,75 USD + 1,00 USD) / 1 000 = 5,25 USD

     

    Beispiel 2: Zusammenfassung des Callcenter-Transkripts
    Ein Anwendungsentwickler erstellt eine Anwendung, um Chat-Transkripte zwischen Benutzern und Support-Kundendienstmitarbeitern zusammenzufassen. Diese verwendet einen Filter für vertrauliche Informationen, um persönlich identifizierbare Informationen (PII) in den generierten Zusammenfassungen für 10 000 Konversationen zu redigieren.

    Jede generierte Zusammenfassung hat durchschnittlich 3 500 Zeichen, was 4 Texteinheiten entspricht.

    Anfallende Gesamtkosten für die Zusammenfassung von 10 000 Konversationen = 10 000 * 4 * (0,1 / 1 000 USD) = 4 USD

    Element Anzahl der Eingabe-Tokens Preis pro 1 000 Eingabe-Token Kosten der Eingabe Anzahl der Ausgabe-Tokens Preis pro 1 000 Ausgabe-Tokens Kosten der Ausgabe Anzahl menschlicher Aufgaben Preis pro menschlicher Aufgabe Kosten menschlicher Aufgaben Gesamtsumme
    Claude Instant Inference 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Menschliche Aufgaben             100 0,21 USD 21,00 USD 21,00 USD
    Gesamtsumme                   21,56 USD