Amazon Bedrock – Preise
Preisübersicht
Amazon Bedrock ist ein vollständig verwalteter Service, der eine Auswahl an leistungsstarken Basismodellen (FMs) über eine einzige API sowie eine breite Palette von Funktionen bietet, die Sie für die Entwicklung generativer KI-Anwendungen mit Sicherheit, Datenschutz und verantwortungsvoller KI benötigen.
Bei Amazon Bedrock werden Ihnen Modellinferenzen und Anpassungen in Rechnung gestellt. Sie haben die Wahl zwischen zwei Preisplänen für Inferenzen: 1. On-Demand und Batch: In diesem Modus können Sie FMs auf Basis nutzungsabhängiger Preisberechnung verwenden, ohne zeitbasierte Laufzeitverpflichtungen eingehen zu müssen. 2. Bereitgestellter Durchsatz: In diesem Modus können Sie ausreichend Durchsatz bereitstellen, um die Leistungsanforderungen Ihrer Anwendung zu erfüllen, und zwar im Gegenzug für eine zeitbasierte Laufzeitverpflichtigung.
Preismodelle
Anpassung und Optimierung
Tools
Preisdetails
Die Preisgestaltung hängt von der Modalität, dem Anbieter und dem Modell ab. Bitte wählen Sie den Modellanbieter aus, um die detaillierten Preise zu sehen.
Amazon Bedrock bietet ausgewählte Basismodelle (FMs) von führenden KI-Anbietern wie Anthropic, Meta, Mistral AI und Amazon für Batch-Inferenz zu einem um 50 % niedrigeren Preis als bei On-Demand-Inferenzpreisen. Bitte beachten Sie die Liste der Modelle hier.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
Meta Llama
-
Mistral AI
-
Stability AI
-
Benutzerdefinierter Modellimport
-
AI21 Labs
-
AI21 Labs
On-Demand-Preise
AI21-Labs-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Jamba 1.5 Large 0,002 USD 0,008 USD Jamba 1.5 Mini 0,0002 USD 0,0004 USD Jurassic-2 Mid 0,0125 USD 0,0125 USD Jurassic-2 Ultra 0,0188 USD 0,0188 USD Jamba-Instruct 0,0005 USD 0,0007 USD -
Amazon
-
-
Amazon Nova
-
Amazon Titan
-
Anderes Amazon
-
Amazon Nova
-
Amazon Nova
Preisgestaltung für Understanding Models
Preise für Modelle zur kreativen Inhaltserstellung
-
Amazon Titan
-
Amazon Titan
-
Anderes Amazon
-
-
-
Anthropic
-
Anthropic
On-Demand- und Batch-Preise
Region: USA Ost (Nord-Virginia) und USA West (Oregon)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1.000 Ausgabe-Token (Batch) Preis pro 1.000 Eingabe-Token (Cache-Schreibvorgang) Preis pro 1.000 Eingabe-Token (Cache-Lesevorgang)
Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
0,00375 USD
0,0003 USD
Claude 3.5 Haiku
0,0008 USD
0,004 USD
0,0005 USD
0,0025 USD
0,001 USD
0,00008 USD
Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Entf.
Entf.
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Entf.
Entf.
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Entf.
Entf.
Claude 2.1
0,008 USD
0,024 USD
Entf.
Nicht angegeben
Nicht angegeben
Entf.
Claude 2.0
0,008 USD
0,024 USD
Entf.
Nicht angegeben
Nicht angegeben
Entf.
Claude Instant
0,0008 USD
0,0024 USD
Entf.
Nicht angegeben
Nicht angegeben
Entf.*Claude 3 Opus ist derzeit in der Region USA West (Oregon) verfügbar **Die Preise für Claude 3.5 Sonnet gelten für jede Version von Claude 3.5 Sonnet (v1 und v2) – Claude 3.5 Sonnet v2 ist derzeit in der Region USA West (Oregon) verfügbar Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1.000 Ausgabe-Token (Batch) Preis pro 1.000 Eingabe-Token (Cache-Schreibvorgang) Preis pro 1.000 Eingabe-Token (Cache-Lesevorgang) Claude 3.5 Sonnet**
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
0,00375 USD 0,0003 USD Claude 3.5 Haiku
0,001 USD
0,005 USD
0,0005 USD
0,0025 USD
0,001 USD 0,00008 USD Claude 3 Opus*
0,015 USD
0,075 USD
0,0075 USD
0,0375 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 2.1
0,008 USD
0,024 USD
–
–
Claude 2.0
0,008 USD
0,024 USD
–
–
Claude Instant
0,0008 USD
0,0024 USD
–
–
*Claude 3 Opus ist derzeit in der Region USA West (Oregon) verfügbar **Die Preise für Claude 3.5 Sonnet gelten für jede Version von Claude 3.5 Sonnet (v1 und v2) – Claude 3.5 Sonnet v2 ist derzeit in der Region USA West (Oregon) verfügbar Region: Europa (London)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD 0,0075 USD Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD 0,000625 USD
Region: Europa (Zürich)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Region: Südamerika (Sao Paulo)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Region: Kanada (Zentral)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Region: Asien-Pazifik (Mumbai)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Region: Asien-Pazifik (Sydney)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Region: Asien-Pazifik (Tokio)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude Instant
0,0008 USD
0,0024 USD
–
–
Claude 2.0/2.1
0,008 USD
0,024 USD
–
–
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Region: Asien-Pazifik (Singapur)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude Instant
0,0008 USD
0,0024 USD
0,0004 USD
0,0012 USD
Claude 2.0/2.1
0,008 USD
0,024 USD
0,004 USD
0,012 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
–
–
Region: Europa (Paris)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Region: Europa (Frankfurt)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude Instant
0,0008 USD
0,0024 USD
–
–
Claude 2.0/2.1
0,008 USD
0,024 USD
–
–
Claude 3 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3.5 Sonnet
0,003 USD
0,015 USD
0,0015 USD
0,0075 USD
Claude 3 Haiku
0,00025 USD
0,00125 USD
0,000125 USD
0,000625 USD
Region: Asien-Pazifik (Seoul)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
–
–
Claude 3 Haiku
0,00025 USD
0,00125 USD
–
–
Region USA Ost (Ohio)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Preis pro 1 000 Eingabe-Token (Batch) Preis pro 1 000 Ausgabe-Token (Batch) Claude 3.5 Sonnet
0,003 USD
0,015 USD
–
–
Claude 3 Haiku
0,00025 USD
0,00125 USD
–
–
Region: AWS GovCloud (USA-West), AWS GovCloud (USA-Ost)
Anthropic-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Claude 3.5 Sonnet
0,0036 USD
0,018 USD
Claude 3 Haiku
0,0003 USD
0,0015 USD
Latenzoptimierte Inferenz
Region USA Ost (Ohio)
Preis pro 1.000 Eingabe-Token Preis pro 1.000 Ausgabe-Token Claude 3.5 Haiku 0,001 USD 0,005 USD Preise für bereitgestellten Durchsatz
Region: USA Ost (Nord-Virginia) und USA West (Oregon)
Anthropic-Modelle Preis pro Stunde pro Modell
ohne VerpflichtungPreis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Anthropic-Modelle Preis pro Stunde pro Modell
ohne VerpflichtungPreis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten Claude Instant
44,00 USD 39,60 USD
22,00 USD
Claude 2.0/2.1
70,00 USD 63,00 USD
35,00 USD
Region: Asien-Pazifik (Tokio)
Anthropic-Modelle Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten Claude Instant
53,00 USD
29,00 USD
Claude 2.0/2.1
86,00 USD
48,00 USD
Region: Europa (Frankfurt)
Anthropic-Modelle Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten Claude Instant
49,00 USD
27,00 USD
Claude 2.0/2.1
79,00 USD
44,00 USD
Für weitere Informationen zu Modelleinheiten wenden Sie sich bitte an Ihr AWS-Kundenteam.
-
Cohere
-
Cohere
On-Demand-Preise
Cohere-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Command 0,0015 USD 0,0020 USD Command-Light 0,0003 USD 0,0006 USD Command R+ 0,0030 USD 0,0150 USD Command R 0,0005 USD 0,0015 USD Embed – Englisch 0,0001 USD – Embed – Mehrsprachig 0,0001 USD – Cohere-Modelle Preis pro 1.000 Abfragen** Rerank 3.5 2,00 USD ** Ihnen wird die Anzahl der Abfragen in Rechnung gestellt, wobei eine Abfrage bis zu 100 Dokumentblöcke enthalten kann. Wenn die Abfrage mehr als 100 Dokumentblöcke enthält, wird sie als mehrere Abfragen gezählt. Wenn eine Anfrage beispielsweise 350 Dokumente enthält, wird sie als 4 Abfragen behandelt. Bitte beachten Sie, dass jedes Dokument nur bis zu 500 Token enthalten kann (einschließlich der Abfrage und der gesamten Tokens des Dokuments). Wenn die Token-Länge höher als 512 Token ist, wird es in mehrere Dokumente aufgeteilt. Preise für Anpassungen (Feinabstimmung)
Cohere-Modelle Preis für das Training von 1 000 Token Preis für die Lagerung jedes benutzerdefinierten Modells pro Monat Preis, der von einem benutzerdefinierten Modell pro Modelleinheit pro Stunde abgeleitet werden kann (mit unverbindlichen Preisen für den bereitgestellten Durchsatz) Cohere Command
0,004 USD
1,95 USD
49,50 USD
Cohere Command-Light 0,001 USD 1,95 USD
8,56 USD *Gesamtzahl der trainierten Token = Anzahl der Token im Trainingsdatenkorpus x Anzahl der Epochen
Preise für bereitgestellten Durchsatz
Cohere-Modelle Preis pro Stunde pro Modell
ohne VerpflichtungPreis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command – Light 8,56 USD 6,85 USD
4,11 USD Embed – Englisch 7,12 USD 6,76 USD
6,41 USD Embed – Mehrsprachig 7,12 USD 6,76 USD
6,41 USD Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.
-
Meta Llama
-
Meta Llama
Llama 3.3
On-Demand- und Batch-Preise
Llama 3.2
On-Demand- und Batch-Preise
Llama 3.1
On-Demand- und Batch-Preise
Preise für die Modellanpassung (Feinabstimmung)
Preise für bereitgestellten Durchsatz
Llama 3
On-Demand-Preise
Llama 2
On-Demand-Preise
Region: USA Ost (Nord-Virginia) und USA West (Oregon)
Meta-Modelle Preis pro 1 000 Eingabe-Token Preis pro 1 000 Ausgabe-Token Llama 2 Chat (13B)
0,00075 USD
0,001 USD
Llama 2 Chat (70B) 0,00195 USD
0,00256 USD Preise für die Modellanpassung (Feinabstimmung)
Meta-Modelle Preis für das Training von 1 000 Token Preis für die Lagerung jedes benutzerdefinierten Modells* pro Monat Aus einem benutzerdefinierten Modell abzuleitender Preis für 1 Modelleinheit pro Stunde (mit unverbindlichen Preisen für bereitgestellten Durchsatz) Lama 2 Vortrainiert (13B)
0,00149 USD
1,95 USD
23,50 USD
Lama 2 Vortrainiert (70B) 0,00799 USD
1,95 USD 23,50 USD *Benutzerdefinierter Modellspeicher = 1,95 USD
Preise für bereitgestellten Durchsatz
Meta-Modelle Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten Llama 2 Vortrainiert und Chat (13B)
21,18 USD
13,08 USD
Lama 2 Vortrainiert (70B) 21,18 USD
13,08 USD *Vortrainierte Llama-2-Modelle sind nach der Anpassung nur im bereitgestellten Durchsatz verfügbar.
Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.
-
Mistral AI
-
Mistral AI
-
Stability AI
-
Stability AI
On-Demand-Preise
Stability-AI-Modell Preis pro generiertem Bild Stable Diffusion 3.5 Large 0,08 USD Stable Image Core 0,04 USD Stable Diffusion 3 Large 0,08 USD Stable Image Ultra 0,14 USD Bei früheren Generationen von Bildmodellen, die von Stability AI angeboten wurden, wird der Preis pro Bild berechnet, abhängig von der Anzahl der Schritte und der Bildauflösung.
Stability-AI-Modell Auflösung des Bildes Preis pro generiertem Bild in Standardqualität (<=50 Schritte) Preis pro generiertem Bild in Premium-Qualität (>50 Schritte) SDXL 1.0 Bis zu 1 024 x 1 024 0,04 USD 0,08 USD Preise für bereitgestellten Durchsatz
Stability-AI-Modell Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat* Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten* SDXL 1.0
49,86 USD
46,18 USD
*Beinhaltet Inferenzen für Basismodelle und benutzerdefinierte Modelle.
Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.
Derzeit wird die Modellanpassung (Feinabstimmung) für Stabilitäts-KI-Modelle in Amazon Bedrock nicht unterstützt.
-
Benutzerdefinierter Modellimport
-
Benutzerdefinierter Modellimport
-
Llama
-
Multimodales Llama
-
Mistral
-
Mixtral
-
Flan
-
Llama
-
Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)
Version mit benutzerdefinierter Modelleinheit v1.0 Preis pro benutzerdefinierter Modelleinheit pro Minute* 0,0785 USD Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit 1,95 USD Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: Das Modell Llama 3.1 8B 128K erfordert 2 benutzerdefinierte Modelleinheiten, ein Modell Llama 3.1 70B 128k erfordert 8 benutzerdefinierte Modelleinheiten. *Abrechnung innerhalb von 5 Minuten -
Multimodales Llama
-
Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)
Version mit benutzerdefinierter Modelleinheit v1.0 Preis pro benutzerdefinierter Modelleinheit pro Minute* 0,0785 USD Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit 1,95 USD Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: Das Modell Llama 3.2 11B 128K erfordert 4 benutzerdefinierte Modelleinheiten. *Abrechnung innerhalb von 5 Minuten -
Mistral
-
Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)
Version mit benutzerdefinierter Modelleinheit v1.0 Preis pro benutzerdefinierter Modelleinheit pro Minute* 0,0785 USD Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit 1,95 USD Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: das Modell Mistral 7B 32K erfordert 1 benutzerdefinierte Modelleinheit. *Abrechnung innerhalb von 5 Minuten -
Mixtral
-
Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)
Version mit benutzerdefinierter Modelleinheit v1.0 Preis pro benutzerdefinierter Modelleinheit pro Minute* 0,0785 USD Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit 1,95 USD Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: das Modell Mixtral 8x7B 32K erfordert 4 benutzerdefinierte Modelleinheiten. *Abrechnung innerhalb von 5 Minuten -
Flan
-
Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)
Version mit benutzerdefinierter Modelleinheit v1.0 Preis pro benutzerdefinierter Modelleinheit pro Minute* 0,0785 USD Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit 1,95 USD Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: das Modell Flan-T5 XL 512 erfordert 1 benutzerdefinierte Modelleinheit. *Abrechnung innerhalb von 5 Minuten
On-Demand-Inferenzpreise:
Die Abrechnung erfolgt in 5-Minuten-Fenstern für die Dauer, in der Ihre Modellkopie aktiv ist, beginnend mit dem ersten erfolgreichen Aufruf. Der maximale Durchsatz und die maximale Parallelitätsgrenze pro Modellkopie hängen von Faktoren wie der Kombination von Eingabe-/Ausgabe-Tokens, Hardwaretyp, Modellgröße, Architektur und Inferenzoptimierungen ab und werden während des Modellimport-Workflows festgelegt.Bedrock skaliert automatisch die Anzahl der Modellkopien je nach Ihren Nutzungsmustern. Wenn über einen Zeitraum von 5 Minuten keine Aufrufe erfolgen, wird Bedrock auf Null herunterskaliert und wieder hochskaliert, wenn Sie Ihr Modell aufrufen. Bei erneuter Skalierung kann es je nach Modellgröße zu einer Kaltstartdauer (in einigen zehn Sekunden) kommen. Bedrock skaliert auch die Anzahl der Modellkopien, wenn Ihr Inferenzvolumen die Parallelitätsgrenzen einer einzelnen Modellkopie durchweg überschreitet. Hinweis: Es gibt standardmäßig ein Maximum von 3 Modellkopien pro Konto und importiertem Modell, das durch Service Quotas erhöht werden kann.
-
Tools zur Preisgestaltung (Einzelheiten)
-
Flows
-
Wissensdatenbanken
-
Integritätsschutz
-
Modellbewertung
-
Datenautomatisierung
-
Flows
-
Amazon Bedrock Flows
Die Gebühren richten sich nach der Anzahl der Knotenübergänge, die zum Ausführen Ihrer Anwendung erforderlich sind. Bedrock Flows zählt jedes Mal, wenn ein Knoten in Ihrem Workflow ausgeführt wird, einen Knotenübergang. Sie werden für die Gesamtzahl der Knotenübergänge in all Ihren Flows berechnet.
Alle Gebühren werden täglich abgerechnet und ab dem 1. Februar 2025 monatlich in Rechnung gestellt.
Preis pro 1 000 Knotenübergänge 0,035 USD Zusätzliche Gebühren
Es können zusätzliche Gebühren anfallen, wenn die Ausführung Ihres Anwendungsworkflows andere AWS-Services nutzt oder Daten überträgt. Wenn Ihr Workflow beispielsweise eine Richtlinie von Amazon Bedrock – Integritätsschutz aufruft, wird Ihnen die Anzahl der von der Richtlinie verarbeiteten Texteinheiten in Rechnung gestellt.
-
Wissensdatenbanken
-
Strukturierter Datenabruf (SQL-Generierung)
Der strukturierte Datenabruf wird für jede Anforderung zur Generierung einer SQL-Abfrage in Rechnung gestellt. Die generierte SQL-Abfrage wird verwendet, um die Daten aus strukturierten Datenspeichern abzurufen.
Rerank-Modelle
Rerank-Modelle wurden entwickelt, um die Relevanz und Genauigkeit von Antworten in RAG-Anwendungen (Retrieval Augmented Generation) zu verbessern. Sie werden pro Anfrage berechnet.
**Ihnen wird die Anzahl der Abfragen in Rechnung gestellt, wobei eine Abfrage bis zu 100 Dokumentblöcke enthalten kann. Wenn die Abfrage mehr als 100 Dokumentblöcke enthält, wird sie als mehrere Abfragen gezählt. Wenn eine Anfrage beispielsweise 350 Dokumente enthält, wird sie als 4 Abfragen behandelt. Bitte beachten Sie, dass jedes Dokument nur bis zu 512 Token enthalten kann (einschließlich der Abfrage und der gesamten Tokens des Dokuments). Wenn die Token-Länge höher als 512 Token ist, wird es in mehrere Dokumente aufgeteilt. Eine Abfrage entspricht einer Sucheinheit.
-
Integritätsschutz
-
Amazon Bedrock – Integritätsschutz
Integritätsschutz-Richtlinie*
Preis pro 1.000 Texteinheiten**
Inhaltsfilter (Textinhalt)****
0,15 USD
Abgelehnte Themen
0,15 USD
Kontextuelle Erdungsprüfung***
0,10 USD
Filter für vertrauliche Informationen (PII)
0,10 USD
Filter für vertrauliche Informationen (regulärer Ausdruck)
Kostenfrei
Wortfilter
Kostenlos
On-Demand-Preise
* Jede Integritätsschutz-Richtlinie ist optional und kann je nach Ihren Anwendungsanforderungen aktiviert werden. Die Gebühren richten sich nach dem Richtlinientyp, der für den Integritätsschutz verwendet wurde. Wenn beispielsweise einen Integritätsschutz mit Inhaltsfiltern und abgelehnten Themen konfiguriert ist, fallen für diese beiden Richtlinien Gebühren an, während für Filter für vertrauliche Informationen keine Gebühren anfallen.
**Eine Texteinheit kann bis zu 1 000 Zeichen enthalten. Wenn eine Texteingabe mehr als 1 000 Zeichen umfasst, wird sie als mehrere Texteinheiten verarbeitet, die jeweils 1 000 Zeichen oder weniger enthalten. Wenn eine Texteingabe beispielsweise 5.600 Zeichen enthält, werden 6 Texteinheiten berechnet.***Die kontextuelle Erdungsprüfung verwendet eine Referenzquelle und eine Abfrage, um zu ermitteln, ob die Modellantwort auf der Quelle basiert und für die Abfrage relevant ist. Die Gesamtzahl der berechneten Texteinheiten wird durch die Kombination aller Zeichen in der Quelle, der Abfrage und der Modellantwort berechnet.
****Die Preise für Inhaltsfilter zum Erkennen und Herausfiltern schädlicher Bildinhalte werden bekannt gegeben, sobald das Feature allgemein verfügbar ist.
-
Modellbewertung
-
Modellbewertung
Die Modellbewertung wird für die Inferenz aus dem von Ihnen ausgewählten Modell in Rechnung gestellt. Die automatisch generierten algorithmischen Ergebnisse werden ohne Aufpreis zur Verfügung gestellt. Bei einer menschenbasierten Bewertung, bei der Sie Ihren eigenen Arbeitsablauf mitbringen, werden Ihnen die Modellinferenz in der Bewertung und eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Aufgabe in Rechnung gestellt.
Modell
Preis pro 1 000 Eingabe-Token
Preis pro 1 000 Ausgabe-Token
Preis pro menschlicher Aufgabe
Zur Bewertung ausgewähltes Modell
Basierend auf dem ausgewählten Modell
Basierend auf dem ausgewählten Modell
0,21 USD
-
Datenautomatisierung
-
Datenautomatisierung
- Amazon Bedrock Knowledge Bases bietet eine Integration mit Bedrock-Data-Automation, um relevantere und genauere Antworten für multimodale Daten bereitzustellen. Wenn Sie eine Wissensdatenbank einrichten, können Sie Bedrock Data Automation als Ihre Analysemethode auswählen, um aussagekräftige Erkenntnisse aus Bildern oder Dokumenten zu analysieren und zu extrahieren, die Zahlen, Diagramme und Diagramme enthalten können. Während der Verarbeitung extrahiert Bedrock Data Automation aussagekräftige Informationen aus aufgenommenen Dokumenten und Bildern, die dann in nachfolgenden Schritten der Knowledge Base zum Chunking, Einbetten und Speichern verwendet werden. Bei der Integration in Knowledge Bases liefert Bedrock Data Automation standardisierte Ergebnisse und berechnet diese.
Preisbeispiele
-
AI21 Labs
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Jurrasic-2-Mid-Modell von AI21, eine Eingabe von 10 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.
Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0125 USD + 2 000 Token / 1 000 * 0,0125 USD = 0,15 USD
-
Amazon
On-Demand-Preise
Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Lite-Modell von Amazon Titan Text, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.
Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,0003 USD + 1 000 Token / 1 000 * 0,0004 USD = 0,001 USD
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Basismodell von Amazon Titan Image Generator, um 1 000 Bilder mit einer Größe von 1024 x 1024 in Standardqualität zu generieren.
Anfallende Gesamtkosten = 1 000 Bilder * 0,01 USD pro Bild = 10 USD
Preise für die Anpassung (Feinabstimmung und kontinuierliche Vorschulung)
Ein Anwendungsentwickler passt ein Amazon-Titan-Image-Generator-Modell mithilfe von 1 000 Bild-Text-Paaren an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.
Für die Feinabstimmung fallen monatlich die folgenden Kosten an = Training der Feinabstimmung (0,005 USD * 500 * 64), wobei 0,005 USD der Preis pro betrachtetes Bild, 500 die Anzahl der Schritte und 64 die Batch-Größe + benutzerdefinierter Modellspeicher pro Monat (1,95 USD) + 1 Stunde benutzerdefinierte Modellinferenz (21 USD) = 160 USD + 1.95 USD + 21 = 182,95 USD
Preise für bereitgestellten Durchsatz
Ein Anwendungsentwickler kauft zwei Modelleinheiten von Amazon Titan Text Express mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.
Anfallende monatliche Gesamtkosten = 2 Modelleinheiten * 18,40 USD / Stunde * 24 Stunden * 31 Tage = 27 379,20 USD
Ein Anwendungsentwickler kauft eine Modelleinheit des Basismodells von Amazon Titan Image Generator mit 1 Monat Vertragsbindung.
Anfallende Gesamtkosten = 1 Modelleinheit * 16,20 USD * 24 Stunden * 31 Tage = 12 052,80 USD
-
Anthropic
On-Demand-Preise
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock in der Region USA West (Oregon): Eine Anfrage an das Claude-Modell von Anthropic, eine Eingabe von 11 000 Token an Eingangstext zu einer Ausgabe von 4 000 Token zusammenzufassen.
Anfallende Gesamtkosten = 11 000 Token / 1 000 * 0,008 USD + 4 000 Token / 1 000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Preise für bereitgestellten Durchsatz
Ein Anwendungsentwickler kauft eine Modelleinheit von Anthropic Claude Instant in der Region USA West (Oregon):
Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD
-
Cohere
On-Demand-Preise
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anforderung an das Command-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.
Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0015 USD + 2 000 Token / 1 000 * 0,0020 USD = 0,013 USD
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Command-Light-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.
Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0003 USD + 2 000 Token / 1 000 * 0,0006 USD = 0,003 USD
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das englische oder mehrsprachige Embed-Modell von Cohere, um Einbettungen für 10 000 Eingabe-Token zu generieren.
Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0001 USD = 0,001 USD
Preise für die Anpassung (Feinabstimmung)
Ein Anwendungsentwickler passt ein Cohere-Command-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.
Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,004 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + eine Stunde Inferenz für benutzerdefinierte Modelle (49,50 USD) = 55,45 USD
Monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 39,60 USD
Preise für bereitgestellten Durchsatz
Ein Anwendungsentwickler kauft eine Modelleinheit von Cohere Command mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.
Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD
-
Meta Llama
On-Demand-Preise
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Chat-Modell von Llama 2 (13B) von Meta, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 500 Token zusammenzufassen.
Anfallende Gesamtkosten = 2 000 Token / 1 000 * 0,00075 USD + 500 Token / 1 000 * 0,001 USD = 0,002 USD
Preise für die Anpassung (Feinabstimmung)
Ein Anwendungsentwickler passt das vortrainierte Llama 2 (70B)-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.
Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,00799 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + 1 Stunde Inferenz für benutzerdefinierte Modelle (23,50 USD) = 33,44 USD
Anfallende monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 21,18 USD
Preise für bereitgestellten Durchsatz
Ein Anwendungsentwickler kauft eine Modelleinheit von Meta Llama 2 mit einer Vertragsbindung von einem Monat für seinen Anwendungsfall zur Textzusammenfassung.
Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 21,18 USD * 24 Stunden * 31 Tage = 15 757,92 USD
-
Mistral AI
On-Demand-Preise
Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mistral-7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.
Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00015 USD + 1000 Token / 1 000 * 0,0002 USD = 0,0005 USD
Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mixtral-8x7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.
Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00045 USD + 1 000 Token / 1 000 * 0,0007 USD = 0,0016 USD
Ein Anwendungsentwickler führt stündlich die folgenden API-Aufrufe an Amazon Bedrock durch: Eine Anfrage an das Mistral-Large-Modell, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 1 000 Token zusammenzufassen.
Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,008 USD + 1 000 Token / 1 000 * 0,024 USD = 0,04 USD
-
Stability AI
On-Demand-Preise
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-Modell, ein Bild mit einer Größe von 512 x 512 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).
Anfallende Gesamtkosten = 1 Bild * 0,036 USD pro Bild = 0,036 USD
Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-1.0-Modell, ein Bild mit einer Größe von 1024 x 1024 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).
Anfallende Gesamtkosten = 1 Bild * 0,08 USD pro Bild = 0,08 USD
Preise für bereitgestellten Durchsatz
Ein Anwendungsentwickler kauft eine Modelleinheit von SDXL 1.0 mit 1 Monat Vertragsbindung.
Anfallende Gesamtkosten = 1 * 49,86 USD * 24 Stunden * 31 Tage = 37 095,84 USD
-
Modellevaluierung
Beispiel 1 zur Modellevaluierung:
On-Demand-Preise
Ein Anwendungsentwickler übermittelt einen Datensatz zur menschenbasierten Modellevaluierung mit Anthropic Claude 2.1 und Anthropic Claude Instant in der AWS-Region USA Ost (Nord-Virginia).Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 1 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“).
Dieser Evaluierungsauftrag umfasst 50 Aufgaben (1 Aufgabe für jedes Eingabeaufforderungs-/Antwortpaar pro Mitarbeiter). Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.
Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:Element Anzahl der Eingabe-Tokens Preis pro 1 000 Eingabe-Token Kosten der Eingabe Anzahl der Ausgabe-Tokens Preis pro 1 000 Ausgabe-Tokens Kosten der Ausgabe Anzahl menschlicher Aufgaben Preis pro menschlicher Aufgabe Kosten menschlicher Aufgaben Gesamtsumme Claude Instant Inference 5 000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Menschliche Aufgaben 50 0,21 USD 10,50 USD 10,50 USD Gesamtsumme 11,06 USD Beispiel 2 zur Modellevaluierung:
On-Demand-Preise
Ein Anwendungsentwickler übermittelt einen Datensatz zur menschenbasierten Modellevaluierung mit Anthropic Claude 2.1 und Anthropic Claude Instant in der AWS-Region USA Ost (Nord-Virginia).
Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 2 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“). Dieser Evaluierungsauftrag umfasst 100 Aufgaben (1 Aufgabe für jeden Eingabeaufforderungs-/Antwortsatz pro Mitarbeiter: 2 Mitarbeiter x 50 Eingabeaufforderungs-/Antwortsätze = 100 menschliche Aufgaben).
Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.
Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:
Element Anzahl der Eingabe-Tokens Preis pro 1 000 Eingabe-Token Kosten der Eingabe Anzahl der Ausgabe-Tokens Preis pro 1 000 Ausgabe-Tokens Kosten der Ausgabe Anzahl menschlicher Aufgaben Preis pro menschlicher Aufgabe Kosten menschlicher Aufgaben Gesamtsumme Claude Instant Inference 5 000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Claude 2.1 Inference 5 000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD 0,52 USD Menschliche Aufgaben 100 0,21 USD 21,00 USD 21,00 USD Gesamtsumme 21,56 USD -
Amazon-Bedrock-Integritätsschutz
Beispiel 1: Chatbot für den Kundensupport
Ein Anwendungsentwickler erstellt einen Chatbot für den Kundensupport und verwendet Inhaltsfilter, um schädliche Inhalte zu blockieren, und abgelehnte Themen, um unerwünschte Anfragen und Antworten herauszufiltern.
Der Chatbot bedient 1 000 Benutzeranfragen pro Stunde. Jede Benutzerabfrage hat eine durchschnittliche Eingabelänge von 200 Zeichen und erhält eine FM-Antwort von 1 500 Zeichen.
Jede Benutzerabfrage von 200 Zeichen entspricht einer Texteinheit.
Jede FM-Antwort von 1 500 Zeichen entspricht 2 Texteinheiten.
Pro Stunde verarbeitete Texteinheiten = (1+2) * 1 000 Abfragen = 3 000 Texteinheiten
Anfallende Gesamtkosten pro Stunde für Inhaltsfilter und abgelehntes Thema = 3000 * (0,15 USD + 0,15 USD)/1000 = 0,90 USD