Amazon Bedrock

Preise für Amazon Bedrock

Kostenloser Einstieg

Preisangebot anfordern

Preise des Modells

Preise des Modells

Die Preisgestaltung hängt von der Modalität, dem Anbieter und dem Modell ab. Bitte wählen Sie den Modellanbieter aus, um die detaillierten Preise zu sehen.

Amazon Bedrock unterstützt eine Vielzahl von Stufen, darunter Standard, Flex, Priority und Reserved. Klicken Sie hier, um mehr über Servicestufen zu erfahren.

Bei Amazon Bedrock finden Sie ausgewählte Basismodelle (FMs) von führenden KI-Anbietern wie Anthropic, Meta, Mistral AI und Amazon für Batch-Inferenz zu einem um 50 % niedrigeren Preis gegenüber Preisen für On-Demand-Inferenz. Um mehr über Batch zu erfahren, klicken Sie hier auf . Bitte beachten Sie die Liste der Modelle hier.

AI21 Labs
AI21 Labs

On-Demand-Preise
Amazon
- Amazon Nova
- Amazon Titan
- Anderes Amazon
- Amazon Nova
- Amazon Nova
  
  Preisgestaltung für Verständnismodelle
  
  Globale regionsübergreifende Inferenz
  
  Geographische Regionen übergreifende Inferenz und Inferenz in der Region
  
  Integrierte Tools
  
  Preise für Modelle zur Generierung kreativer Inhalte
  
  Preisgestaltung für Sprachverständnis- und Sprachgenerierungsmodelle
  
  On-Demand-Preise für Speech-to-Speech-Foundation-Modelle
  
  Hinweis: * Die Preise für Eingabe und Ausgabe von Text-Token gelten für bestimmte Anwendungsfälle wie die Transkription von Sprache in Text, Tool-Aufrufe zur Erledigung von Aufgaben oder Wissensgrundlagen, Hinzufügen eines Gesprächsverlaufs zur Sitzung usw.
  
  On-Demand-Inferenz für benutzerdefinierte Nova-Modelle hat den gleichen Preis wie die Basis-Nova-Inferenz.
  
  Preise für Einbettungsmodelle
- Amazon Titan
- Amazon Titan
- Anderes Amazon
Anthropic

Anthropic

On-Demand- und Batch-Preise

Modelle mit erweitertem Zugriff

Anbieter	Modellname	Regionen	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token	Preis pro 1 Million Eingabe-Token (Batch)	Preis pro 1 Million Ausgabe-Token (Batch)	Preis pro 1 Million Eingabe-Token (Cache-Schreibvorgang)	Preis pro 1 Million Eingabe-Token (Cache-Lesevorgang)
Anthropic	Claude 3.5 Sonnet (Erweiterter öffentlicher Zugriff, gültig ab 1. Dezember 2025)	USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), Europa (Frankfurt), Europa (Irland), Europa (Zürich), Europa (Paris)	6,00 USD	30,00 USD	3,00 USD	15,00 USD	–	–
Anthropic	Claude 3.5 Sonnet v2 (Erweiterter öffentlicher Zugriff, gültig ab 1. Dezember 2025)	USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon)	6,00 USD	30,00 USD	3,00 USD	15,00 USD	7,50 USD	0,60 USD

Preise der Reserved-Stufe

Latenzoptimierte Inferenz

Preise für bereitgestellten Durchsatz

Für Preise für den bereitgestellten Durchsatz wenden Sie sich bitte an Ihr Konto-Team.

Cohere

Cohere

On-Demand-Preise

Cohere-Modelle	Preis pro 1.000 Abfragen**
Rerank 3.5	2,00 USD
** Ihnen wird die Anzahl der Abfragen in Rechnung gestellt, wobei eine Abfrage bis zu 100 Dokumentblöcke enthalten kann. Wenn die Abfrage mehr als 100 Dokumentblöcke enthält, wird sie als mehrere Abfragen gezählt. Wenn eine Anfrage beispielsweise 350 Dokumente enthält, wird sie als 4 Abfragen behandelt. Bitte beachten Sie, dass jedes Dokument nur bis zu 500 Token enthalten kann (einschließlich der Abfrage und der gesamten Tokens des Dokuments). Wenn die Token-Länge höher als 512 Token ist, wird es in mehrere Dokumente aufgeteilt.

Preise für Anpassungen (Feinabstimmung)

*Gesamtzahl der trainierten Token = Anzahl der Token im Trainingsdatenkorpus x Anzahl der Epochen

Preise für bereitgestellten Durchsatz

Cohere-Modelle	Preis pro Stunde pro Modell ohne Verpflichtung	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command – Light	8,56 USD	6,85 USD	4,11 USD
3 Englisch einbetten	7,12 USD	6,76 USD	6,41 USD
3 Mehrsprachig einbetten	7,12 USD	6,76 USD	6,41 USD

Bitte wenden Sie sich an Ihr AWS-Konto- oder Vertriebsteam, um weitere Informationen zu Modelleinheiten zu erhalten.

DeepSeek

DeepSeek

On-Demand-Preise

Standard
Priorität
Flex

Standard

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

DeepSeek-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
DeepSeek-V3.2	0,62 USD	1,85 USD

Regionen: Asien-Pazifik (Mumbai), Südamerika (São Paulo), Asien-Pazifik (Jakarta), Asien-Pazifik (Tokio) und Europa (Stockholm)

DeepSeek-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
DeepSeek-V3.2	0,74 USD	2,22 USD

Region: Asien-Pazifik (Sydney)

DeepSeek-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
DeepSeek-V3.1	0,5974 USD	1,7304 USD
DeepSeek-V3.2	0,6386 USD	1,9055 USD

Priorität

Region: Asien-Pazifik (Sydney)

DeepSeek-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
DeepSeek-V3.1	1,045 USD	3,0282 USD

Flex

Region: Asien-Pazifik (Sydney)

DeepSeek-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
DeepSeek-V3.1	0,2987 USD	0,8652 USD

Google

Google

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Google-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Gemma 3 4B	0,04 USD	0,08 USD
Gemma 3 12B	0,09 USD	0,29 USD
Gemma 3 27B	0,23 USD	0,38 USD

Regionen: Asien-Pazifik (Mumbai), Europa (Irland) und Europa (Mailand)

Google-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Gemma 3 4B	0,05 USD	0,09 USD
Gemma 3 12B	0,11 USD	0,34 USD
Gemma 3 27B	0,27 USD	0,45 USD

Regionen: Südamerika (São Paulo) und Asien-Pazifik (Tokio)

Google-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Gemma 3 4B	0,05 USD	0,10 USD
Gemma 3 12B	0,11 USD	0,35 USD
Gemma 3 27B	0,28 USD	0,46 USD

Region: Europa (London)

Google-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Gemma 3 4B	0,06 USD	0,12 USD
Gemma 3 12B	0,14 USD	0,45 USD
Gemma 3 27B	0,36 USD	0.59 USD

Region: Asien-Pazifik (Sydney)

Google-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Gemma 3 4B	0,0412 USD	0,0824 USD
Gemma 3 12B	0,0927 USD	0,2987 USD
Gemma 3 27B	0,2369 USD	0,3914 USD

* Bei der Priority-Stufe gilt ein Aufschlag von 75 % gegenüber der Standard-Stufe.
* Die Preise für die Flex-Stufe bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

Luma AI
On-Demand-Preise
Meta

MiniMax AI

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Minimax-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Minimax M2	0,30 USD	1,20 USD
Minimax M2.1	0,30 USD	1,20 USD
MiniMax M2.5	0,30 USD	1,20 USD

Regionen: Asien-Pazifik (Mumbai), Europa (Irland) und Europa (Mailand)

Minimax-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Minimax M2	0,35 USD	1,41 USD
Minimax M2.1	0,36 USD	1,44 USD
Minimax M2.5	0,36 USD	1,44 USD

Regionen: Südamerika (São Paulo) und Asien-Pazifik (Tokio)

Minimax-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Minimax M2	0,36 USD	1,45 USD
Minimax M2.1	0,36 USD	1,44 USD
Minimax M2.5	0,36 USD	1,44 USD

Region: Europa (London)

Minimax-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Minimax M2	0,47 USD	1,86 USD
Minimax M2.1	0,47 USD	1,86 USD
Minimax M2.5	0,47 USD	1,86 USD

Regionen: Europa (Frankfurt), Europa (Stockholm), Asien-Pazifik (Jakarta)

Minimax-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Minimax M2.1	0,36 USD	1,44 USD
Minimax M2.5	0,36 USD	1,44 USD

Region: Asien-Pazifik (Sydney)

Minimax-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Minimax M2	0,3090 USD	1,2360 USD
Minimax M2.1	0,3090 USD	1,2360 USD
Minimax M2.5	0,31 USD	1,24 USD

* Die Preise für die Priority-Stufe enthalten einen Aufschlag von 75 % gegenüber den Preisen für die Standard-Stufe.
* Die Preise für die Flex-Stufe bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

Mistral AI

Mistral AI

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,40 USD	2,00 USD
Magistral Small 1.2	Danach 0,50 USD	1,50 USD
Voxtral Mini 1.0	0,04 USD	0,04 USD
Voxtral Small 1.0	0,10 USD	0,30 USD
Ministral 3B 3.0	0,10 USD	0,10 USD
Ministral 8B 3.0	0,15 USD	0,15 USD
Ministral 14B 3.0	0,20 USD	0,20 USD
Mistral Large 3	Danach 0,50 USD	1,50 USD

Regionen: Asien-Pazifik (Mumbai)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,48 USD	2,40 USD
Magistral Small 1.2	0.59 USD	1,76 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,35 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD
Mistral Large 3	0.59 USD	1,76 USD

Regionen: Südamerika (São Paulo) und Asien-Pazifik (Tokio)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,48 USD	2,40 USD
Magistral Small 1.2	0,61 USD	1,82 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,36 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD
Mistral Large 3	0,61 USD	1,82 USD

Regionen: Europa (Irland) und Europa (Mailand)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,48 USD	2,40 USD
Magistral Small 1.2	0.59 USD	1,76 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,35 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD

Region: Europa (London)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,62 USD	3,10 USD
Magistral Small 1.2	0,78 USD	2,33 USD
Voxtral Mini 1.0	0,06 USD	0,06 USD
Voxtral Small 1.0	0,16 USD	0,47 USD
Ministral 3B 3.0	0,16 USD	0,16 USD
Ministral 8B 3.0	0,23 USD	0,23 USD
Ministral 14B 3.0	0,31 USD	0,31 USD

Region: Asien-Pazifik (Sydney)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,41 USD	2,06 USD
Magistral Small 1.2	0,5150 USD	1.5450 USD
Voxtral Mini 1.0	0,0412 USD	0,0412 USD
Voxtral Small 1.0	0,1030 USD	0,3090 USD
Ministral 3B 3.0	0,1030 USD	0,1030 USD
Ministral 8B 3.0	0,1545 USD	0,1545 USD
Ministral 14B 3.0	0,2060 USD	0,2060 USD
Mistral Large 3	0,5150 USD	1.5450 USD

Regionen: Asien-Pazifik (Jakarta), Europa (Frankfurt), Europa (Stockholm)

Modelle von Mistral	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Destral 2 123B	0,48 USD	2,40 USD

* Bei der Priority-Stufe gilt ein Aufschlag von 75 % gegenüber der Standard-Stufe.
* Die Preise für die Flex-Stufe bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

Moonshot AI

Moonshot AI

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Kimi-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Kimi K2 Thinking	0,60 USD	2,50 USD
Kimi K2.5	0,60 USD	3,00 USD

Region: Asien-Pazifik (Mumbai)

Kimi-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Kimi K2 Thinking	0,71 USD	2,94 USD
Kimi K2.5	0,72 USD	3,60 USD

Regionen: Südamerika (São Paulo) und Asien-Pazifik (Tokio)

Kimi-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Kimi K2 Thinking	0,73 USD	3,03 USD
Kimi K2.5	0,72 USD	3,60 USD

Regionen: Europa (Stockholm), Asien-Pazifik (Jakarta)

Kimi-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Kimi K2.5	0,72 USD	3,60 USD

Region: Asien-Pazifik (Sydney)

Kimi-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Kimi K2 Thinking	0,6180 USD	2,5750 USD
Kimi K2.5	0,6180 USD	3,0900 USD

* Bei der Priority-Stufe gilt ein Aufschlag von 75 % gegenüber der Standard-Stufe.
* Die Preise für die Flex-Stufe bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

NVIDIA

NVIDIA

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

NVIDIA-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
NVIDIA Nemotron Nano 2	0,06 USD	0,23 USD
NVIDIA Nemotron Nano 2 VL	0,20 USD	0,60 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,06 USD	0,24 USD
NVIDIA Nemotron 3 Super 120B A12B	0,15 USD	0,65 USD

Regionen: Asien-Pazifik (Mumbai), Europa (Irland) und Europa (Mailand)

NVIDIA-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
NVIDIA Nemotron Nano 2	0,07 USD	0,27 USD
NVIDIA Nemotron Nano 2 VL	0,24 USD	0,71 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,07 USD	0,28 USD
NVIDIA Nemotron 3 Super 120B A12B	0,18 USD	0,78 USD

Regionen: Südamerika (São Paulo) und Asien-Pazifik (Tokio)

NVIDIA-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
NVIDIA Nemotron Nano 2	0,07 USD	0,28 USD
NVIDIA Nemotron Nano 2 VL	0,24 USD	0,73 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,07 USD	0,29 USD
NVIDIA Nemotron 3 Super 120B A12B	0,18 USD	0,78 USD

Region: Europa (London)

NVIDIA-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
NVIDIA Nemotron Nano 2	0,09 USD	0,36 USD
NVIDIA Nemotron Nano 2 VL	0,31 USD	0,93 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,09 USD	0,37 USD
NVIDIA Nemotron 3 Super 120B A12B	0,23 USD	1,01 USD

Region: Asien-Pazifik (Sydney)

NVIDIA-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
NVIDIA Nemotron Nano 2	0,0618 USD	0,2369 USD
NVIDIA Nemotron Nano 2 VL	0,2060 USD	0,6180 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,0618 USD	0,2472 USD
NVIDIA Nemotron 3 Super 120B A12B	0,15 USD	0,67 USD

Regionen: Asien-Pazifik (Jakarta), Europa (Frankfurt) und Europa (Stockholm)

NVIDIA-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
NVIDIA Nemotron 3 Super 120B A12B	0,18 USD	0,78 USD

* Die Preise für die Priority-Stufe enthalten einen Aufschlag von 75 % gegenüber den Preisen für die Standard-Stufe.
* Die Preise für die Flex-Stufe und für Batch bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

OpenAI-OSS-Modelle

OpenAI-OSS-Modelle

gpt-oss-20b, 120b
gpt-oss-safeguard 20b, 120b

gpt-oss-20b, 120b

Standard
Priorität
Flex
Batch
Anpassung des Modells

Standard

Region: Asien-Pazifik (Sydney)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
gpt-oss-20b	0,0721 USD	0,3090 USD
gpt-oss-120b	0,1545 USD	0,6180 USD

Priorität

Region: Asien-Pazifik (Sydney)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
gpt-oss-20b	0,1262 USD	0,5408 USD
gpt-oss-120b	0,2704 USD	1,0815 USD

Flex

Region: Asien-Pazifik (Sydney)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
gpt-oss-20b	0,0361 USD	0,1545 USD
gpt-oss-120b	0,0773 USD	0,3090 USD

Batch

Region: Asien-Pazifik (Sydney)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
gpt-oss-20b	0,0361 USD	0,1545 USD
gpt-oss-120b	0,0773 USD	0,3090 USD

Anpassung des Modells

Anpassung des Modells

Preise für Reinforcement Fine Tuning

Mit Reinforcement Fine Tuning in Amazon Bedrock können Sie die Modellgenauigkeit verbessern, ohne über fundierte Kenntnisse im Bereich Deep Machine Learning oder große Mengen an beschrifteten Daten zu verfügen. Amazon Bedrock automatisiert den Workflow von Reinforcement Fine Tuning: Der Service nimmt Ihre Beispiel-Prompts auf, generiert Modellantworten und bewertet diese anhand Ihrer Belohnungsfunktion. Diese Prompts, Antworten und Bewertungen werden dann verwendet, um Ihr Modell durch einen iterativen RFT-Workflow zu trainieren.

Der gesamte Trainings-Workflow wird zu einem Stundensatz abgerechnet. Nach Abschluss des Trainings können Kunden das daraus resultierende, fein abgestimmte Modell sofort für On-Demand-Inferenzen verwenden. Für die Option On-Demand-Inferenz gilt ein Token-basiertes Preismodell. Bei diesem Modell werden die Gebühren anhand der Anzahl der während der Inferenz verarbeiteten Token berechnet.

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

OpenAI-Modelle	Preis pro Trainingsstunde	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token	Preis für die Speicherung jedes trainierten Modells pro Monat
gpt-oss-20b	80,00 USD	0,09 USD	0,39 USD	1,95 USD

gpt-oss-safeguard 20b, 120b

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GPT OSS Safeguard 20B	0,07 USD	0,20 USD
GPT OSS Safeguard 120B	0,15 USD	0,60 USD

Regionen: Asien-Pazifik (Mumbai), Südamerika (São Paulo) und Asien-Pazifik (Tokio)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GPT OSS Safeguard 20B	0,08 USD	0,24 USD
GPT OSS Safeguard 120B	0,18 USD	0,71 USD

Regionen: Europa (Irland) und Europa (Mailand)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GPT OSS Safeguard 20B	0,08 USD	0,23 USD
GPT OSS Safeguard 120B	0,18 USD	0,70 USD

Region: Europa (London)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GPT OSS Safeguard 20B	0,11 USD	0,31 USD
GPT OSS Safeguard 120B	0,23 USD	0,93 USD

Region: Asien-Pazifik (Sydney)

OpenAI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GPT OSS Safeguard 20B	0,0721 USD	0,2060 USD
GPT OSS Safeguard 120B	0,1545 USD	0,6180 USD

* Bei der Priority-Stufe gilt ein Aufschlag von 75 % gegenüber der Standard-Stufe.
* Die Preise für die Flex-Stufe und Batch bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

Qwen

Amazon Bedrock

Qwen

Qwen3 Coder, 32B, 235B
Qwen 3 Weiter, VL, Coder Weiter

Qwen3 Coder, 32B, 235B

Standard
Priorität
Flex
Batch
Anpassung des Modells

Standard

Region: Asien-Pazifik (Sydney)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Coder 30B A3B	0,1545 USD	0,6180 USD
Qwen3 32B	0,1545 USD	0,6180 USD
Qwen3 235B A22B 2507	0,226 USD	0,9064 USD

Priorität

Region: Asien-Pazifik (Sydney)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Coder 30B A3B	0,2704 USD	1,0815 USD
Qwen3 32B	0,2704 USD	1,0815 USD
Qwen3 235B A22B 2507	0,3966 USD	1,5862 USD

Flex

Region: Asien-Pazifik (Sydney)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Coder 30B A3B	0,0773 USD	0,3090 USD
Qwen3 32B	0,0773 USD	0,3090 USD
Qwen3 235B A22B 2507	0,1133 USD	0,4532 USD

Batch

Region: Asien-Pazifik (Sydney)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Coder 30B A3B	0,0773 USD	0,3090 USD
Qwen3 32B	0,0773 USD	0,3090 USD
Qwen3 235B A22B 2507	0,1133 USD	0,4532 USD

Anpassung des Modells

Anpassung des Modells

Preise für Reinforcement Fine Tuning

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Qwen-Modelle	Preis pro Trainingsstunde	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token	Preis für die Speicherung jedes trainierten Modells pro Monat
Qwen3 32B	80,00 USD	0,20 USD	0,78 USD	1,95 USD

Qwen 3 Weiter, VL, Coder Weiter

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Next 80B A3B	0,15 USD	1,20 USD
Qwen3 VL 235B A22B	0,53 USD	2,66 USD
Qwen3 Coder Weiter	Danach 0,50 USD	1,20 USD

Regionen: Asien-Pazifik (Mumbai), Europa (Irland) und Europa (Mailand)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Next 80B A3B	0,18 USD	1,41 USD
Qwen3 VL 235B A22B	0,62 USD	3,13 USD
Qwen3 Coder Weiter	0,60 USD	1,44 USD

Regionen: Südamerika (São Paulo) und Asien-Pazifik (Tokio)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Next 80B A3B	0,18 USD	1,45 USD
Qwen3 VL 235B A22B	0,64 USD	3,22 USD
Qwen3 Coder Weiter	0,60 USD	1,44 USD

Region: Europa (London)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Next 80B A3B	0,23 USD	1,86 USD
Qwen3 VL 235B A22B	0,82 USD	4,12 USD
Qwen3 Coder Weiter	0,78 USD	1,86 USD

Regionen: Europa (Frankfurt) und Asien-Pazifik (Jakarta)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Coder Weiter	0,60 USD	1,44 USD

Region: Asien-Pazifik (Sydney)

Qwen-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Qwen3 Next 80B A3B	0,1545 USD	1,2360 USD
Qwen3 VL 235B A22B	0,5459 USD	2,7398 USD
Qwen3 Coder Weiter	0,5150 USD	1,2360 USD

Stability AI

Stability AI

On-Demand-Preise

Bei früheren Generationen von Bildmodellen, die von Stability AI angeboten wurden, wird der Preis pro Bild berechnet, abhängig von der Anzahl der Schritte und der Bildauflösung.

Region: Oregon, Nord-Virginia, Ohio

Stability AI Image Services	Preis pro Generation für jedes Modell
Stable Image Remove Background	0,07 USD
Stable Image Erase Object	0,07 USD
Stable Image Control Structure	0,07 USD
Stable Image Control Sketch	0,07 USD
Stable Image Style Guide	0,07 USD
Stable Image Search and Replace	0,07 USD
Stable Image Inpaint	0,07 USD
Stable Image Search and Recolor	0,07 USD
Stable Image Style Transfer	0,08 USD
Stable Image Conservative Upscale	0,40 USD
Stable Image Creative Upscale	0,60 USD
Stable Image Fast Upscale	0,03 USD
Stable Image Outpaint	0,06 USD

TwelveLabs
TwelveLabs

On-Demand-Preise
Globale regionsübergreifende Inferenz

Geographisch und in der Region, regionsübergreifende Inferenz

Globale regionsübergreifende Inferenz

Geographisch und in der Region, regionsübergreifende Inferenz
Writer

Writer

On-Demand-Preise

Writer-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Palmyra X4	2,50 USD	10,00 USD
Palmyra X5	0,60 USD	6,00 USD
Palmyra Vision 7B	0,15 USD	0,60 USD

Z AI

Amazon Bedrock

Z AI

GLM 5
GLM 4.7
GLM 4.7 Flash

GLM 5

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 5	1,00 USD	3,20 USD

Regionen: Asien-Pazifik (Jakarta), Asien-Pazifik (Mumbai), Asien-Pazifik (Tokio), Südamerika (São Paulo) und Europa (Stockholm)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 5	1,20 USD	3,84 USD

Region: Europa (London)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 5	1,55 USD	4,96 USD

Region: Asien-Pazifik (Sydney)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 5	1,03 USD	3,30 USD

* Die Preise für die Priority-Stufe enthalten einen Aufschlag von 75 % gegenüber den Preisen für die Standard-Stufe.
* Die Preise für die Flex-Stufe und Batch bieten einen Rabatt von 50 % gegenüber den Preisen für die Standard-Stufe.

GLM 4.7

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7	0,60 USD	2,20 USD

Regionen: Asien-Pazifik (Jakarta), Asien-Pazifik (Mumbai), Asien-Pazifik (Tokio), Südamerika (São Paulo) und Europa (Stockholm)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7	0,72 USD	2,64 USD

Region: Asien-Pazifik (Sydney)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7	0,6180 USD	2,260 USD

GLM 4.7 Flash

On-Demand-Preise

Regionen: USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7 Flash	0,07 USD	0,40 USD
GLM 5	1,00 USD	3,20 USD

Regionen: Asien-Pazifik (Jakarta), Asien-Pazifik (Mumbai), Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland), Europa (Mailand), Europa (Stockholm) und Südamerika (São Paulo)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7 Flash	0,08 USD	0,48 USD

Regionen: Asien-Pazifik (Jakarta), Asien-Pazifik (Mumbai), Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Stockholm) und Südamerika (São Paulo)

Z-AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 5	1,20 USD	3,84 USD

Region: Europa (London)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7 Flash	0,11 USD	0,62 USD
GLM 5	1,55 USD	4,96 USD

Region: Asien-Pazifik (Sydney)

Z AI-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
GLM 4.7 Flash	0,0721 USD	0,4120 USD
GLM 5	1,03 USD	3,30 USD

Import benutzerdefinierter Modelle

Benutzerdefinierter Modellimport

Llama

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,05718 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,07144 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Bitte beachten Sie: Die zum Hosten eines Modells benötigten benutzerdefinierten Modelleinheiten hängen von einer Vielzahl von Faktoren ab – insbesondere von der Modellarchitektur, der Anzahl der Modellparameter und der Kontextlänge. Die genaue Anzahl der benötigten benutzerdefinierten Modelleinheiten wird zum Zeitpunkt des Imports festgelegt. Als Referenz: Das Modell Llama 3.1 8B 128K erfordert 2 benutzerdefinierte Modelleinheiten, ein Modell Llama 3.1 70B 128k erfordert 8 benutzerdefinierte Modelleinheiten.

*Abrechnung innerhalb von 5 Minuten

Multimodales Llama

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,05718 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,07144 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Mistral

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,05718 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,07144 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Mixtral

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,05718 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,07144 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Flan

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,05718 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,07144 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

On-Demand-Inferenzpreise:
Die Abrechnung erfolgt in 5-Minuten-Fenstern für die Dauer, in der Ihre Modellkopie aktiv ist, beginnend mit dem ersten erfolgreichen Aufruf. Der maximale Durchsatz und die maximale Parallelitätsgrenze pro Modellkopie hängen von Faktoren wie der Kombination von Eingabe-/Ausgabe-Tokens, Hardwaretyp, Modellgröße, Architektur und Inferenzoptimierungen ab und werden während des Modellimport-Workflows festgelegt.

Bedrock skaliert automatisch die Anzahl der Modellkopien je nach Ihren Nutzungsmustern. Wenn über einen Zeitraum von 5 Minuten keine Aufrufe erfolgen, wird Bedrock auf Null herunterskaliert und wieder hochskaliert, wenn Sie Ihr Modell aufrufen. Bei erneuter Skalierung kann es je nach Modellgröße zu einer Kaltstartdauer (in einigen zehn Sekunden) kommen. Bedrock skaliert auch die Anzahl der Modellkopien, wenn Ihr Inferenzvolumen die Parallelitätsgrenzen einer einzelnen Modellkopie durchweg überschreitet. Hinweis: Es gibt standardmäßig ein Maximum von 3 Modellkopien pro Konto und importiertem Modell, das durch Service Quotas erhöht werden kann.

Qwen

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,05718 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

Region: Europa (Frankfurt)

Version mit benutzerdefinierter Modelleinheit	v1.0
Preis pro benutzerdefinierter Modelleinheit pro Minute*	0,07144 USD
Monatliche Lagerkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

OpenAI

Regionen: USA Ost (Nord-Virginia) und USA West (Oregon)

Version der benutzerdefinierten Modelleinheit	v2.0
Preis pro benutzerdefinierter Modelleinheit und Minute*	0,1433 USD
Monatliche Speicherkosten pro benutzerdefinierter Modelleinheit	1,95 USD

*Abrechnung innerhalb von 5 Minuten

Wissensdatenbanken
Strukturierter Datenabruf (SQL-Generierung)

Der strukturierte Datenabruf wird für jede Anforderung zur Generierung einer SQL-Abfrage in Rechnung gestellt. Die generierte SQL-Abfrage wird verwendet, um die Daten aus strukturierten Datenspeichern abzurufen.

Rerank-Modelle

Rerank-Modelle wurden entwickelt, um die Relevanz und Genauigkeit von Antworten in RAG-Anwendungen (Retrieval Augmented Generation) zu verbessern. Sie werden pro Anfrage berechnet.

**Ihnen wird die Anzahl der Abfragen in Rechnung gestellt, wobei eine Abfrage bis zu 100 Dokumentblöcke enthalten kann. Wenn die Abfrage mehr als 100 Dokumentblöcke enthält, wird sie als mehrere Abfragen gezählt. Wenn eine Anfrage beispielsweise 350 Dokumente enthält, wird sie als 4 Abfragen behandelt. Bitte beachten Sie, dass jedes Dokument nur bis zu 512 Token enthalten kann (einschließlich der Abfrage und der gesamten Tokens des Dokuments). Wenn die Token-Länge höher als 512 Token ist, wird es in mehrere Dokumente aufgeteilt. Eine Abfrage entspricht einer Sucheinheit.
Integritätsschutz

Amazon-Bedrock-Integritätsschutz

Die Preise für den Amazon-Bedrock-Integritätsschutz basieren auf den Gebühren, die für den im Integritätsschutz genutzten Filter anfallen. Die Preise für die Standard- und die Classic-Stufe sind gleich.

Filter für Integritätsschutz*	Preis
Inhaltsfilter für Standard- und Classic-Stufe (Textinhalt)	0,15 USD pro 1 000 Texteinheiten
Inhaltsfilter (Bildinhalt)	0,00075 USD pro verarbeitetem Bild
Abgelehnte Themen für Standard- und Classic-Stufe	0,15 USD pro 1 000 Texteinheiten
Filter für vertrauliche Informationen	0,10 USD pro 1 000 Texteinheiten
Filter für vertrauliche Informationen (regulärer Ausdruck)	Kostenlos
Wortfilter	Kostenlos
Überprüfung der kontextuellen Begründung	0,10 USD pro 1 000 Texteinheiten
Automated-Reasoning-Prüfungen	0,17 USD pro 1 000 Texteinheiten pro Automated-Reasoning-Richtlinie

On-Demand-Preise

* Filter für den Integritätsschutz sind jeweils optional und können je nach Anwendungsanforderungen aktiviert werden. Die Gebühren richten sich nach dem im Integritätsschutz genutzten Filtertyp. Wenn beispielsweise ein Integritätsschutz mit Inhaltsfiltern und Filtern für abgelehnte Themen konfiguriert ist, fallen für diese beiden Filtertypen Gebühren an, während für Filter für vertrauliche Informationen keine Gebühren anfallen.

Hinweis: Eine Texteinheit kann bis zu 1 000 Zeichen enthalten. Wenn eine Texteingabe mehr als 1 000 Zeichen umfasst, wird sie als mehrere Texteinheiten verarbeitet, die jeweils 1 000 Zeichen oder weniger enthalten. Wenn eine Texteingabe beispielsweise 5600 Zeichen enthält, werden 6 Texteinheiten berechnet.

Die kontextuelle Begründungsprüfung verwendet eine Referenzquelle und eine Abfrage, um zu ermitteln, ob die Modellantwort auf der Quelle basiert und für die Abfrage relevant ist. Die Gesamtzahl der berechneten Texteinheiten wird durch die Kombination aller Zeichen in der Quelle, der Abfrage und der Modellantwort berechnet.

Modellbewertung

Modellbewertung

Die Modellbewertung wird für die Inferenz aus dem von Ihnen ausgewählten Modell in Rechnung gestellt. Die automatisch generierten algorithmischen Ergebnisse werden ohne Aufpreis zur Verfügung gestellt. Bei einer menschenbasierten Bewertung, bei der Sie Ihren eigenen Arbeitsablauf mitbringen, werden Ihnen die Modellinferenz in der Bewertung und eine Gebühr von 0,21 USD pro abgeschlossener menschlicher Aufgabe in Rechnung gestellt.

Wenn Sie die RAG-Bewertung oder LLM-as-a-Judge in der Modellbewertung verwenden, werden die vom Judge-Modell verwendeten Token auf der Grundlage der On-Demand-Preise der Standard-Stufe berechnet. Die Judge-Prompts werden im Rahmen Ihrer Token-Nutzung berechnet und sind in der öffentlichen Dokumentation verfügbar. Für die Bewertung von RAG auf einer Bedrock-Wissensdatenbank fallen auch alle regulären Nutzungsgebühren aus den Bedrock-Wissensdatenbanken an.

Modell

Preis pro 1 000 Eingabe-Token

Preis pro 1 000 Ausgabe-Token

Preis pro menschlicher Aufgabe

Zur Bewertung ausgewähltes Modell

Basierend auf dem ausgewählten Modell

0,21 USD

Datenautomatisierung
Datenautomatisierung

Amazon Bedrock Data Automation wandelt unstrukturierte, multimodale Inhalte in strukturierte Datenformate für Anwendungsfälle wie intelligente Dokumentenverarbeitung, Videoanalyse und RAG um. Bedrock Data Automation kann Standardausgabeinhalte unter Verwendung vordefinierter Standards generieren, die modalitätsspezifisch sind, wie etwa Szenenbeschreibungen von Videos, Audiotranskripte oder automatisierte Dokumentenanalysen. Kunden können zusätzlich benutzerdefinierte Ausgaben erstellen, indem sie ihre Ausgabeanforderungen in Vorlagen auf der Grundlage ihres eigenen Datenschemas angeben, die sie dann einfach in eine vorhandene Datenbank oder ein Data Warehouse laden können. Durch die Integration in Wissensdatenbanken kann Bedrock Data Automation auch zum Parsen von Inhalten für RAG-Anwendungen verwendet werden. Dadurch wird die Genauigkeit und Relevanz der Ergebnisse durch die Einbeziehung von Informationen, die in Bildern und Texten eingebettet sind, verbessert.

Wissensdatenbanken in Amazon Bedrock ermöglichen eine Integration mit Bedrock Data Automation. Dadurch können für multimodale Daten Antworten besserer Relevanz und Genauigkeit bereitgestellt werden. Wenn Sie eine Wissensdatenbank einrichten, können Sie Bedrock Data Automation als Ihre Analysemethode auswählen, um aussagekräftige Erkenntnisse aus Bildern oder Dokumenten zu analysieren und zu extrahieren, die Zahlen, Diagramme und Diagramme enthalten können. Während der Verarbeitung extrahiert Bedrock Data Automation aussagekräftige Informationen aus aufgenommenen Dokumenten und Bildern, die dann in nachfolgenden Schritten der Knowledge Base zum Chunking, Einbetten und Speichern verwendet werden. Bei der Integration in Knowledge Bases liefert Bedrock Data Automation standardisierte Ergebnisse und berechnet diese.
Intelligentes Prompt Routing

Preispunkt	Preisdimension	Preisplan
Intelligentes Prompt Routing	1 USD pro 1.000 Aufrufe	On-Demand

Intelligentes Prompt Routing

Intelligentes Prompt Routing ermöglicht es Ihnen, eine Kombination von Basismodellen (FMs) aus derselben Modellfamilie zu verwenden, um Qualität und Kosten zu optimieren. Mit der Claude-Modellfamilie von Anthropic kann Amazon Bedrock beispielsweise Anfragen je nach Komplexität der Aufforderung intelligent zwischen Claude 3.5 Sonnet und Claude 3 Haiku weiterleiten. Auf ähnliche Weise kann Amazon Bedrock Anfragen zwischen Meta Llama 3.3 70B und 3.18B sowie Nova Pro und Nova Lite weiterleiten. Der Prompt-Router sagt voraus, welches Modell für jede Anfrage die beste Leistung bietet, und hilft gleichzeitig, die Antwortqualität und die Kosten zu optimieren. Dies ist besonders nützlich für Anwendungen wie Kundendienstassistenten, bei denen unkomplizierte Anfragen von kleineren, schnelleren und kostengünstigeren Modellen bearbeitet werden können und komplexe Anfragen an leistungsfähigere Modelle weitergeleitet werden. Intelligentes Prompt Routing kann die Kosten um bis zu 30 % senken, ohne die Genauigkeit zu beeinträchtigen.

Prompt-Optimierung

Prompt-Optimierung für Amazon Bedrock

Die Gebühren richten sich nach der Anzahl der Token in den Eingabe-Prompts und in den optimierten Prompts.

Alle Gebühren werden ab dem 23. April 2025 monatlich in Rechnung gestellt.

Preis pro 1 000 Tokens

0,030 USD

Preisbeispiele

AI21 Labs

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Jurrasic-2-Mid-Modell von AI21, eine Eingabe von 10 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0125 USD + 2 000 Token / 1 000 * 0,0125 USD = 0,15 USD
Amazon

On-Demand-Preise

Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Lite-Modell von Amazon Titan Text, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,0003 USD + 1 000 Token / 1 000 * 0,0004 USD = 0,001 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Basismodell von Amazon Titan Image Generator, um 1 000 Bilder mit einer Größe von 1024 x 1024 in Standardqualität zu generieren.

Anfallende Gesamtkosten = 1 000 Bilder * 0,01 USD pro Bild = 10 USD

Preise für die Anpassung (Feinabstimmung und kontinuierliche Vorschulung)

Ein Anwendungsentwickler passt ein Amazon-Titan-Image-Generator-Modell mithilfe von 1 000 Bild-Text-Paaren an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

Für die Feinabstimmung fallen monatlich die folgenden Kosten an = Training der Feinabstimmung (0,005 USD * 500 * 64), wobei 0,005 USD der Preis pro betrachtetes Bild, 500 die Anzahl der Schritte und 64 die Batch-Größe + benutzerdefinierter Modellspeicher pro Monat (1,95 USD) + 1 Stunde benutzerdefinierte Modellinferenz (21 USD) = 160 USD + 1.95 USD + 21 = 182,95 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft zwei Modelleinheiten von Amazon Titan Text Express mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.

Anfallende monatliche Gesamtkosten = 2 Modelleinheiten * 18,40 USD / Stunde * 24 Stunden * 31 Tage = 27 379,20 USD

Ein Anwendungsentwickler kauft eine Modelleinheit des Basismodells von Amazon Titan Image Generator mit 1 Monat Vertragsbindung.

Anfallende Gesamtkosten = 1 Modelleinheit * 16,20 USD * 24 Stunden * 31 Tage = 12 052,80 USD
Amazon-Bedrock-Integritätsschutz
Beispiel 1: Chatbot für den Kundensupport
Ein Anwendungsentwickler erstellt einen Chatbot für den Kundensupport und verwendet Inhaltsfilter, um schädliche Inhalte zu blockieren, und abgelehnte Themen, um unerwünschte Anfragen und Antworten herauszufiltern.

Der Chatbot bedient 1 000 Benutzeranfragen pro Stunde. Jede Benutzerabfrage hat eine durchschnittliche Eingabelänge von 200 Zeichen und erhält eine FM-Antwort von 1 500 Zeichen.

Jede Benutzerabfrage von 200 Zeichen entspricht einer Texteinheit.

Jede FM-Antwort von 1 500 Zeichen entspricht 2 Texteinheiten.

Pro Stunde verarbeitete Texteinheiten = (1+2) * 1 000 Abfragen = 3 000 Texteinheiten

Anfallende Gesamtkosten pro Stunde für Inhaltsfilter und abgelehntes Thema = 3000 * (0,15 USD + 0,15 USD)/1000 = 0,90 USD

Beispiel 2: Zusammenfassung des Callcenter-Transkripts
Ein Anwendungsentwickler erstellt eine Anwendung, um Chat-Transkripte zwischen Benutzern und Support-Kundendienstmitarbeitern zusammenzufassen. Diese verwendet einen Filter für vertrauliche Informationen, um persönlich identifizierbare Informationen (PII) in den generierten Zusammenfassungen für 10 000 Konversationen zu redigieren.

Jede generierte Zusammenfassung hat durchschnittlich 3 500 Zeichen, was 4 Texteinheiten entspricht.

Anfallende Gesamtkosten für die Zusammenfassung von 10 000 Konversationen = 10 000 * 4 * (0,1 / 1 000 USD) = 4 USD
Beispiel 3: Engine zur Überprüfung medizinischer Protokolle
Ein Unternehmen für Gesundheitstechnologie implementiert Automated-Reasoning-Prüfungen in seinem System zur klinischen Entscheidungsunterstützung, um Behandlungsvorschläge anhand medizinischer Richtlinien zu validieren.

Das System verarbeitet 5 000 Patientenfälle pro Monat. Jeder Fall beinhaltet:
- Zusammenfassung der Patientendaten: 500 Zeichen (1 Texteinheit)
- Diagnostische Bewertung: 2 000 Zeichen (2 Texteinheiten)
- Behandlungsempfehlung: 4 500 Zeichen (5 Texteinheiten)
Pro Monat verarbeitete Texteinheiten = (1 + 2 + 5) * 5 000 Fälle = 40 000 Texteinheiten
Gesamtkosten, die pro Monat für Automated-Reasoning-Prüfungen anfallen = 40 000 (0,17 USD)/1 000 = 6,80 USD
Amazon-Bedrock-Wissensdatenbanken

Preisbeispiel 1 (Reranking mit dem Modell Amazon Rerank 1.0)

In einem bestimmten Monat stellen Sie mithilfe des Modells Amazon Rerank 1.0 2 Millionen Anfragen an die Rerank API. 1 Million Anfragen enthalten jeweils weniger als 100 Dokumente und werden daher für jeweils eine Anfrage in Rechnung gestellt. Die verbleibenden 1 Million Anfragen enthalten 120 -150 Dokumente, weshalb für jede Anfrage 2 Anfragen berechnet werden.

Preis für eine Anfrage = 0,001 USD
Gesamtgebühr = 1.000.000 * 0,001 USD + 1.000.000 * 2 * 0,001 USD = 3000 USD

Preisbeispiel 2: (Abruf strukturierter Daten)

Ein Anwendungsentwickler erstellt einen Support-Chatbot, der in Amazon Redshift gespeicherte strukturierte Daten abfragt. Der Entwickler erstellt eine Bedrock Knowledge Base und stellt eine Verbindung zu Amazon Redshift her. Der Chatbot bedient 10000 Benutzeranfragen pro Stunde. Jede Benutzerabfrage kostet 0,002 USD pro GenerateQuery-API, um SQL aus einer Benutzerabfrage zu generieren.

Gesamtkosten für die Generierung von SQL pro Stunde = 0,002 USD * 10000 = 20 USD.
Im Monat angefallene Gesamtkosten = 20 USD * 24 * 30 = 1440 USD
Anthropic

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock in der Region USA West (Oregon): Eine Anfrage an das Claude-Modell von Anthropic, eine Eingabe von 11 000 Token an Eingangstext zu einer Ausgabe von 4 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 11 000 Token / 1 000 * 0,008 USD + 4 000 Token / 1 000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von Anthropic Claude Instant in der Region USA West (Oregon):

Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD
Cohere

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anforderung an das Command-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0015 USD + 2 000 Token / 1 000 * 0,0020 USD = 0,013 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Command-Light-Modell von Cohere, eine Eingabe von 6 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 6 000 Token / 1 000 * 0,0003 USD + 2 000 Token / 1 000 * 0,0006 USD = 0,003 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das englische oder mehrsprachige Embed-Modell von Cohere, um Einbettungen für 10 000 Eingabe-Token zu generieren.

Anfallende Gesamtkosten = 10 000 Token / 1 000 * 0,0001 USD = 0,001 USD

Preise für die Anpassung (Feinabstimmung)

Ein Anwendungsentwickler passt ein Cohere-Command-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,004 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + eine Stunde Inferenz für benutzerdefinierte Modelle (49,50 USD) = 55,45 USD

Monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 39,60 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von Cohere Command mit 1 Monat Vertragsbindung für seinen Anwendungsfall zur Textzusammenfassung.

Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 39,60 USD * 24 Stunden * 31 Tage = 29 462,40 USD
Benutzerdefinierter Modellimport

Preisbeispiel: Ein Anwendungsentwickler importiert ein angepasstes Modell vom Typ Llama 3.1 mit einer Größe von 8 B Parametern und einer Sequenzlänge von 128 K in der Region us-east-1 und löscht das Modell nach einem Monat. Dies erfordert 2 benutzerdefinierte Modelleinheiten. Der Preis pro Minute beträgt also 0,1570 USD, da 2 benutzerdefinierte Modelleinheiten erforderlich sind. Die Lagerkosten für 2 benutzerdefinierte Modelleinheiten würden sich für den Monat auf 3,90 USD belaufen.

Der Import des Modells ist kostenlos. Der erste erfolgreiche Aufruf erfolgt um 8:03 Uhr. Zu diesem Zeitpunkt beginnt die Messung. Die 5-Minuten-Messfenster sind von 8:03 Uhr bis 8:07 Uhr; 8:07 Uhr bis 8:11 Uhr usw. Wenn innerhalb eines Zeitraums von 5 Minuten mindestens ein Aufruf erfolgt, wird das Fenster für die Abrechnung als aktiv betrachtet. Wenn um 8:03 Uhr ein Aufruf erfolgt und nach 8:07 Uhr keine weiteren Aufrufe erfolgen, stoppt die Messung um 8:07 Uhr. In diesem Fall würde die Rechnung wie folgt berechnet werden: 0,1570 USD x 5 Minuten x 1 Fünf-Minuten-Fenster = 0,785 USD.
Datenautomatisierung

Preisbeispiel 1:
Nehmen wir an, Sie verarbeiten ein 1.000-seitiges Dokument mit BDA Custom Output. Alle 1.000 Seiten werden mit Vorlage 1 verarbeitet, die 15 Felder enthält. Der Preis pro Seite für jede Vorlage mit 30 Feldern oder weniger beträgt 0,040 USD. Die Gesamtkosten belaufen sich auf 40 USD.

Gesamtanzahl bearbeiteter Seiten = 1.000
Preis pro Seite für Vorlagen mit weniger als 30 Feldern = 0,040 USD
Gesamtgebühr = 1,000 USD * 0.040 USD = 40 USD

Preisbeispiel 2:
Nehmen wir an, Sie verarbeiten 2 Dokumente mit BDA Custom Output. Dokument 1 hat 40 Seiten und wird mit Vorlage 1 verarbeitet, die 20 Felder enthält. Dokument 2 hat 10 Seiten und wird mit Vorlage 2 verarbeitet, die 40 Felder enthällt. Der Preis pro Seite von Vorlage 1 beträgt 0,040 USD, da sie 30 Felder oder weniger enthält. Der Preis pro Seite von Vorlage 2 beträgt 0,045 USD. Die Verarbeitungskosten für Dokument 1 unter Verwendung von Vorlage 1 betragen 1,60 USD. Die Verarbeitungskosten für Dokument 2 unter Verwendung von Vorlage 2 betragen 0,45 USD. Die Gesamtkosten für die Bearbeitung beider Dokumente würden sich auf 2,05 USD belaufen.

Gesamtanzahl bearbeiteter Seiten = 50
Preis pro Seite für Vorlage 1 mit weniger als 30 Feldern = 0,040 USD
Preis pro Seite für Vorlage 2 mit 40 Feldern = 0,040 USD + (Anzahl zusätzlicher Felder über 30 * 0,0005 USD pro Feld)
Anzahl zusätzlicher Felder über 30 = 40 - 30 = 10
Preis pro Seite für Vorlage 2 mit 40 Feldern = 0,040 USD + (10 * 0,0005 USD pro Feld) = 0,045 USD
Gebühr für Dokument 1 mit Vorlage 1 = 40 Seiten x 0,040 USD pro Seite = 1,6 USD
Gebühr für Dokument 2 mit Vorlage 2 = 10 Seiten x 0,045 USD pro Seite = 0,45 USD
Gesamtgebühr = Gebühr für Dokument 1 + Gebühr für Dokument 2 = 1,6 USD + 0,45 USD = 2,05 USD

Preisbeispiel 3:
Nehmen wir an, Sie richten Bedrock-Wissensdatenbanken ein, um Bedrock Data Automation als Parser zu verwenden, und nehmen dann ein 1 000-seitiges Dokument auf. Beachten Sie, dass sich die Kostenstrukturen zwischen den Parsing-Optionen der Wissensdatenbanken unterscheiden. BDA verwendet Preise pro Seite, während Basismodell-Parser Gebühren auf der Grundlage von Eingabe- und Ausgabe-Token berechnen. Für den Kontext sind für die Verarbeitung von 1 000 Seiten, von denen 30 % Tabellen und 30 % Zahlen enthalten, in der Regel 2 900 Eingabe-Token und 750 Ausgabe-Token erforderlich. Der Token-Verbrauch variiert je nach Inhaltstyp.Es wird den Kunden daher ermpfohlen, anhand ihrer eigenen Daten zu testen, um genauere Schätzungen zu erhalten. Die Integration von Bedrock-Wissensdatenbanken und Bedrock Data Automation verwendet die Standardausgabe, wobei der Preis pro Seite 0,010 USD beträgt. Die Gesamtkosten würden sich auf 10 USD belaufen.

Gesamtanzahl bearbeiteter Seiten = 1.000
Preis pro Seite für Standardausgabe = 0,010 USD
Gesamtgebühr = 1 000 * 0,010 USD = 10 USD

Preisbeispiel 4:
Nehmen wir an, Sie verarbeiten ein 60-minütiges Video mit BDA-Standard-Ausgabe. Der Preis pro Minute für die Videostandardausgabe beträgt 0,050 USD. Die Gesamtkosten belaufen sich auf 3,00 USD.

Insgesamt verarbeitete Minuten = 60
Preis pro Minute für die Videostandardausgabe = 0,050 USD
Gesamtgebühr = 60 * 0,050 USD = 3,00 USD

Preisbeispiel 5:
Nehmen wir an, Sie verarbeiten 2 000 Bilder mit benutzerdefinierter BDA-Ausgabe. Die ersten 1.000 Bilder werden mit Vorlage 1 verarbeitet, die 10 Felder enthält. Die letzten 1.000 Seiten werden mit Vorlage 2 verarbeitet, die 40 Felder enthält. Der Preis pro Bild für Vorlage 1 beträgt 0,005 USD, da sie 30 Felder oder weniger enthält. Der Preis pro Bild von Vorlage 2 beträgt 0,01 USD. Die Verarbeitungskosten für die ersten 1.000 Bilder mit Vorlage 1 betragen 5,00 USD. Die Verarbeitungskosten für die zweiten 1.000 Bilder mit Vorlage 2 betragen 10,00 USD. Die Gesamtkosten für die Verarbeitung aller 2.000 Bilder würden 15,00 USD betragen

Kosten für die ersten 1000 Bilder = 1.000 Bilder * 0,005 USD pro Bild = 5,00 USD
Kosten für 1.000 Bilder pro Sekunde = 1.000 Bilder * (0,005 USD + (Anzahl zusätzlicher Felder über 30 * 0,0005 USD pro Feld))
'= 1.000 * (0,005 USD + ((40 - 30) * 0,0005 USD))
= 1,000 * (0,005 USD + (10 * 0,0005 USD)) = 10.00 USD
Gesamtkosten = 5,00 USD + 10,00 USD = 15,00 USD

Preisbeispiel 6:
Nehmen wir an, Sie möchten die Standard-Ausgabe von Bedrock Data Automation verwenden, um 15 000 Minuten an Meeting-Audioaufzeichnungen in Ihrem Unternehmen zu verarbeiten. Die Gesamtkosten für die Verarbeitung aller 15.000 Audiominuten würden sich auf 90 USD belaufen.

Insgesamt verarbeitete Minuten = 15.000 Minuten
Gesamtgebühr = 15 000 Min. * 0,006 USD = 90 USD
DeepSeek

On-Demand-Preise

Ein Anwendungsentwickler ruft stündlich die folgenden API-Aufrufe bei Amazon Bedrock auf: eine Anfrage an das DeepSeek-R1-Modell, eine Eingabe von 2 000 Token von Eingabetext in eine Ausgabe von 1 000 Token (einschließlich Argumentationstoken) zusammenzufassen:

Anfallende stündliche Gesamtkosten = 2 000 Token / 1000 * 0,00135 USD + 1000 Token / 1 000 * 0,0054 USD = 0,0081 USD
Flows

Beispiel: Zusammenfassung von Nachrichten
Ein Anwendungsentwickler erstellt einen Flow, um die Zusammenfassung von Nachrichten für Händler zu automatisieren. Der Flow umfasst einen Eingabeknoten, der einen S3-Speicherorte aufnimmt, und einen S3-Abrufknoten, der 10 Dateien abruft, die Artikel von 10 großen Nachrichtenagenturen in S3 enthalten (2 Knotenübergänge). Anschließend wird ein Iteratorknoten verwendet, um ein Modell mit einem Prompt-Knoten aufzurufen, damit jede Datei zusammengefasst wird (+ 10 Dateien x 2 Knotenübergänge). Anschließend werden alle Ergebnisse mithilfe eines Kollektorknotens gesammelt, die Ergebnisse mithilfe des S3-Speicherknotens in S3 geschrieben und in einem Ausgabeknoten abgeschlossen (+ 3 Knotenübergänge). Sie führen diesen Flow an jedem Wochentag jede halbe Stunde durch.

Die Anzahl der Knotenübergänge pro Flow-Ausführung ist: 2 + 1 + 10 * 2 + 3 = 25 Knotenübergänge/Flow-Ausführung

Die Anzahl der Flow-Ausführungen pro Monat ist: 24 Stunden *2* 5 Tage * 4 Wochen = 960 Flow-Ausführungen/Monat.

Die monatliche Gesamtrechnung beträgt: 25 * 960 * 0,035/1000 USD = 0,84 USD

Zusätzliche Gebühren
Die Rechnung enthält auch zusätzliche Gebühren für AWS-Services, die bei der Ausführung des Workflows verwendet werden, einschließlich der Nutzung von Amazon S3 in den Abruf- und Speicherknoten und der Nutzung des Amazon Bedrock Foundation Model im Prompt-Knoten.
Meta

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Chat-Modell von Llama 2 (13B) von Meta, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 500 Token zusammenzufassen.

Anfallende Gesamtkosten = 2 000 Token / 1 000 * 0,00075 USD + 500 Token / 1 000 * 0,001 USD = 0,002 USD

Preise für die Anpassung (Feinabstimmung)

Ein Anwendungsentwickler passt das vortrainierte Llama 2 (70B)-Modell mithilfe von 1 000 Datentokens an. Nach der Schulung verwendet der Entwickler eine Stunde lang den vom benutzerdefinierten Modell bereitgestellten Durchsatz, um die Leistung des Modells zu bewerten. Das fein abgestimmte Modell wird einen Monat lang gespeichert. Nach der Auswertung verwendet der Entwickler den bereitgestellten Durchsatz (1 Monat Vertragsbindung), um das benutzerdefinierte Modell zu hosten.

Anfallende monatliche Kosten für die Feinabstimmung = Training zur Feinabstimmung (0,00799 USD * 1 000) + Speicherplatz für benutzerdefinierte Modelle pro Monat (1,95 USD) + 1 Stunde Inferenz für benutzerdefinierte Modelle (23,50 USD) = 33,44 USD

Anfallende monatliche Kosten für den bereitgestellten Durchsatz (1 Monat Vertragsbindung) des benutzerdefinierten Modells = 21,18 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von Meta Llama 2 mit einer Vertragsbindung von einem Monat für seinen Anwendungsfall zur Textzusammenfassung.

Anfallende monatliche Gesamtkosten = 1 Modelleinheit * 21,18 USD * 24 Stunden * 31 Tage = 15 757,92 USD
Mistral AI

On-Demand-Preise

Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mistral-7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00015 USD + 1000 Token / 1 000 * 0,0002 USD = 0,0005 USD

Ein Anwendungsentwickler sendet stündlich die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Mixtral-8x7B-Modell, um eine Eingabe von 2 000 Token an Eingangstext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,00045 USD + 1 000 Token / 1 000 * 0,0007 USD = 0,0016 USD

Ein Anwendungsentwickler führt stündlich die folgenden API-Aufrufe an Amazon Bedrock durch: Eine Anfrage an das Mistral-Large-Modell, um eine Eingabe von 2 000 Token an Eingabetext zu einer Ausgabe von 1 000 Token zusammenzufassen.

Anfallende stündliche Gesamtkosten = 2 000 Token / 1 000 * 0,008 USD + 1 000 Token / 1 000 * 0,024 USD = 0,04 USD

Modellbewertung

Beispiel 1 zur Modellbewertung:

Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 1 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“).

Dieser Evaluierungsauftrag umfasst 50 Aufgaben (1 Aufgabe für jedes Eingabeaufforderungs-/Antwortpaar pro Mitarbeiter). Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.

Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:

Element	Anzahl der Eingabe-Tokens	Preis pro 1 000 Eingabe-Token	Kosten der Eingabe	Anzahl der Ausgabe-Tokens	Preis pro 1 000 Ausgabe-Tokens	Kosten der Ausgabe	Anzahl menschlicher Aufgaben	Preis pro menschlicher Aufgabe	Kosten menschlicher Aufgaben	Gesamtsumme
Claude Instant Inference	5 000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5 000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Menschliche Aufgaben							50	0,21 USD	10,50 USD	10,50 USD
Gesamtsumme										11,06 USD

Beispiel 2 zur Modellevaluierung:

On-Demand-Preise
Ein Anwendungsentwickler übermittelt einen Datensatz zur menschenbasierten Modellevaluierung mit Anthropic Claude 2.1 und Anthropic Claude Instant in der AWS-Region USA Ost (Nord-Virginia).

Der Datensatz enthält 50 Eingabeaufforderungen, und der Entwickler benötigt 2 Mitarbeiter, um jeden Eingabeaufforderungs-/Antwortsatz zu bewerten (konfigurierbar bei der Erstellung des Bewertungsauftrags als Parameter „Mitarbeiter pro Eingabeaufforderung“). Dieser Evaluierungsauftrag umfasst 100 Aufgaben (1 Aufgabe für jeden Eingabeaufforderungs-/Antwortsatz pro Mitarbeiter: 2 Mitarbeiter x 50 Eingabeaufforderungs-/Antwortsätze = 100 menschliche Aufgaben).

Die 50 Eingabeaufforderungen ergeben zusammen 5 000 Eingabe-Token und die zugehörigen Antworten ergeben zusammen 15 000 Token für Anthropic Claude Instant und 20 000 Token für Anthropic Claude 2.1.

Für diesen Modellevaluierungsauftrag fallen folgende Kosten an:

Element	Anzahl der Eingabe-Tokens	Preis pro 1 000 Eingabe-Token	Kosten der Eingabe	Anzahl der Ausgabe-Tokens	Preis pro 1 000 Ausgabe-Tokens	Kosten der Ausgabe	Anzahl menschlicher Aufgaben	Preis pro menschlicher Aufgabe	Kosten menschlicher Aufgaben	Gesamtsumme
Claude Instant Inference	5 000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Claude 2.1 Inference	5 000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Menschliche Aufgaben							100	0,21 USD	21,00 USD	21,00 USD
Gesamtsumme										21,56 USD

Prompt-Optimierung

Beispiel: Zusammenfassung von Nachrichten
Ein Anwendungsentwickler erstellt einen Prompt, um Nachrichten für Händler mit Claude 3.5 zusammenzufassen. Der ursprüngliche Prompt enthält 429 Token. Der optimierte Prompt enthält 511 Token und spezifischere Anweisungen und Beispiele, um präzisere Antworten von den FMs zu erhalten. Er verwendet den optimierten Prompt mit 511 Token als Eingabe für den Prompt-Optimierer und erstellt zwei neue Varianten für Claude 3.7 und Nova Pro mit 582 und 579 Token.

Die Gesamtzahl der Eingabe- und Ausgabe-Tokens für die Prompt-Optimierung: 429 + 511 + 511 + 582 + 511 + 579 = 3.123

Die monatliche Gesamtrechnung beträgt: 3,123 / 1000 * 0,03 USD = 0,09 USD
Stability AI

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-Modell, ein Bild mit einer Größe von 512 x 512 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).

Anfallende Gesamtkosten = 1 Bild * 0,036 USD pro Bild = 0,036 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das SDXL-1.0-Modell, ein Bild mit einer Größe von 1024 x 1024 mit einer Schrittgröße von 70 zu generieren (Premium-Qualität).

Anfallende Gesamtkosten = 1 Bild * 0,08 USD pro Bild = 0,08 USD

Preise für bereitgestellten Durchsatz

Ein Anwendungsentwickler kauft eine Modelleinheit von SDXL 1.0 mit 1 Monat Vertragsbindung.

Anfallende Gesamtkosten = 1 * 49,86 USD * 24 Stunden * 31 Tage = 37 095,84 USD
TwelveLabs

On-Demand-Preise

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: eine Anfrage an das Pegasus-1.2-Modell, um zu beschreiben, was ein 10 Sekunden langes Video beinhaltet, das eine Ausgabe von 2 000 Token bietet.

Anfallende Gesamtkosten = 10 Sekunden * 0,00049 USD + 2 000 Token / 1 000 * 0,0075 USD = 0,0199 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: eine Anfrage an das Marengo Embed [3.0 oder 2.7]-Modell zum Einbetten von 10 Videos mit einer Gesamtdauer von 100 Minuten.

Anfallende Gesamtkosten = 100 Minuten (d. h. 6 000 Sekunden) * 0,00070 USD = 4,2 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: eine Anfrage an das Marengo-Embed-3.0-Modell, indem er einen Text und ein Bild zusammen bereitstellt, um eine Einbettung zu generieren, mit der er den Clip finden kann, der die Tasche aus dem angegebenen Bild enthält, und zwar in dem Einbettungs-Repository, das er anhand des obigen Beispiels erstellt hätte.

Anfallende Gesamtkosten = 1 Textanforderung * 0,00007 USD +1 Bildanforderung * 0,0001 USD = 0,00017 USD

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: eine Anfrage an das Marengo Embed [3.0 oder 2.7]-Modell, um einen Text zur Generierung einer Einbettung bereitzustellen, mit der er passende Clips aus einem Einbettungs-Repository finden könnte, das er anhand des obigen Beispiels erstellt hätte.

Anfallende Gesamtkosten = 1 Textanforderung * 0,00007 USD = 0,00007 USD
Writer

Ein Anwendungsentwickler sendet die folgenden API-Aufrufe an Amazon Bedrock: Eine Anfrage an das Writer-Palmyra-Modell von X5, eine Eingabe von 10 000 Token an Eingabetext zu einer Ausgabe von 2 000 Token zusammenzufassen.

Anfallende Gesamtkosten = 10 000 Token / 1000 * 0,003 USD + 2 000 Token / 1000 * 0,015 USD = 0,06 USD

Nächste Schritte

Workshop

Gängige Anwendungsfälle von Amazon Bedrock in einem geführten Workshop erkunden

Workshop anzeigen

Demo

Demonstrationen der Funktionen von Amazon Bedrock anzeigen

Demo-Bibliothek erkunden

Meta-Modelle	Preis pro 1 Million Eingabe-Token	Preis pro 1 Million Ausgabe-Token
Llama 2 Chat (13B)	0,75 USD	1,00 USD
Llama 2 Chat (70B)	1,95 USD	2,56 USD

Meta-Modelle	Preis für das Training von 1 Million Token	*Preis für die Lagerung jedes benutzerdefinierten Modells pro Monat**	Aus einem benutzerdefinierten Modell abzuleitender Preis für 1 Modelleinheit pro Stunde (mit unverbindlichen Preisen für bereitgestellten Durchsatz)
Lama 2 Vortrainiert (13B)	1.49 USD	1,95 USD	23,50 USD
Lama 2 Vortrainiert (70B)	7,99 USD	1,95 USD	23,50 USD

Meta-Modelle	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von einem Monat	Preis pro Stunde pro Modelleinheit bei einer Laufzeit von 6 Monaten
Llama 2 Vortrainiert und Chat (13B)	21,18 USD	13,08 USD
Lama 2 Vortrainiert (70B)	21,18 USD	13,08 USD

Preise für Amazon Bedrock

Preise des Modells

AI21 Labs

Amazon Nova

Preisgestaltung für Verständnismodelle

Globale regionsübergreifende Inferenz

Geographische Regionen übergreifende Inferenz und Inferenz in der Region

Integrierte Tools

Preise für Modelle zur Generierung kreativer Inhalte

Preisgestaltung für Sprachverständnis- und Sprachgenerierungsmodelle

On-Demand-Preise für Speech-to-Speech-Foundation-Modelle

Preise für Einbettungsmodelle

Amazon Titan

Anthropic

Preise der Reserved-Stufe

Cohere

DeepSeek

Google

On-Demand-Preise

Meta

MiniMax AI

Mistral AI

Moonshot AI

NVIDIA

OpenAI-OSS-Modelle

Qwen

Stability AI

TwelveLabs

Writer

Z AI

Benutzerdefinierter Modellimport

Amazon-Bedrock-Integritätsschutz

Modellbewertung

Datenautomatisierung

Prompt-Optimierung für Amazon Bedrock

Preisbeispiele

AI21 Labs

Amazon

On-Demand-Preise

Preise für die Anpassung (Feinabstimmung und kontinuierliche Vorschulung)

Preise für bereitgestellten Durchsatz

Amazon-Bedrock-Integritätsschutz

Amazon-Bedrock-Wissensdatenbanken

Anthropic

On-Demand-Preise

Preise für bereitgestellten Durchsatz

Cohere

On-Demand-Preise

Preise für die Anpassung (Feinabstimmung)

Benutzerdefinierter Modellimport

Datenautomatisierung

DeepSeek

Flows

Meta

On-Demand-Preise

Preise für die Anpassung (Feinabstimmung)

Preise für bereitgestellten Durchsatz

Mistral AI

On-Demand-Preise

Modellbewertung

Beispiel 1 zur Modellbewertung:

Beispiel 2 zur Modellevaluierung:

Prompt-Optimierung

Stability AI

On-Demand-Preise

Preise für bereitgestellten Durchsatz

TwelveLabs

Writer

Nächste Schritte

Gängige Anwendungsfälle von Amazon Bedrock in einem geführten Workshop erkunden

Demonstrationen der Funktionen von Amazon Bedrock anzeigen

Lernen

Ressourcen

Entwickler

Hilfe