Amazon Bedrock

Precios de Amazon Bedrock

Comience de forma gratuita

Solicite un presupuesto

Precios de los modelos
Bases de conocimiento
Barreras de protección
Evaluación del modelo
Automatización de datos
Direccionamiento de peticiones inteligente
Optimización de peticiones

Precios de los modelos

Precios de los modelos

El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

Amazon Bedrock admite una variedad de niveles, tales como Standard, Flex, Priority y Reserved. Haga clic para obtener más información sobre los niveles de servicio.

Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia en lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Para obtener más información sobre los lotes, haga clic aquí. Consulte la lista de modelos aquí.

AI21 Labs
AI21 Labs

Precios bajo demanda
Amazon
- Amazon Nova
- Amazon Titan
- Otro Amazon
- Amazon Nova
- Amazon Nova
  
  Precios para comprender los modelos
  
  Inferencia interregional global
  
  Inferencia geográfica entre regiones y dentro de una región
  
  Herramientas integradas
  
  Precios por modelos de generación de contenido creativo
  
  Precios de los modelos de generación y comprensión del habla
  
  Precios bajo demanda para los modelos fundacionales de conversión de voz a voz
  
  Nota: *Los precios de entrada y salida de los tokens de texto se aplican a casos de uso específicos, como la transcripción de voz a texto, las llamadas a herramientas para completar tareas o la base de conocimientos, agregar el historial de conversaciones a la sesión, etc.
  
  La inferencia bajo demanda para los modelos Nova personalizados tiene el mismo precio que la inferencia Nova básica.
  
  Precios de los modelos de incrustación
- Amazon Titan
- Amazon Titan
- Otro Amazon
Anthropic

Anthropic

Precios bajo demanda y por lotes

Modelos con acceso ampliado

Proveedor	Nombre de modelo	Regiones	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida	Precio por cada millón de tokens de entrada (por lotes)	Precio por cada millón de tokens de salida (por lotes)	Precio por cada millón de tokens de entrada (escritura en caché)	Precio por cada millón de tokens de entrada (lectura de caché)
Anthropic	Claude 3.5 Sonnet (acceso público ampliado, en vigor desde el 1 de diciembre de 2025)	Este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio), oeste de EE. UU. (Oregón), Europa (Fráncfort), Europa (Irlanda), Europa (Zúrich), Europa (París)	6,00 USD	30,00 USD	3,00 USD	15,00 USD	N/D	N/D
Anthropic	Claude 3.5 Sonnet v2 (acceso público ampliado, en vigor desde el 1 de diciembre de 2025)	Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón)	6,00 USD	30,00 USD	3,00 USD	15,00 USD	7,50 USD	0,60 USD

Precios del nivel Reserved

Inferencia optimizada para la latencia

Precios del rendimiento aprovisionado

Para conocer los precios del rendimiento aprovisionado, contacte con su equipo de cuentas.

Cohere

Cohere

Precios bajo demanda

Modelos de Cohere	Precio por cada 1000 consultas**
Rerank 3.5	2,00 USD
**Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 500 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos.

Precios por la personalización (ajuste preciso)

*El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

Precios del rendimiento aprovisionado

Modelos de Cohere	Precio por hora y modelo sin compromiso	Precio por hora por unidad de modelo con un compromiso de 1 mes	Precio por hora por unidad de modelo con un compromiso de 6 mes
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command: Light	8,56 USD	6,85 USD	4,11 USD
Insertar 3 inglés	7,12 USD	6,76 USD	6,41 USD
Insertar 3 multilingüe	7,12 USD	6,76 USD	6,41 USD

Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

DeepSeek

DeepSeek

Precios bajo demanda

Standard
Priority
Flex

Standard

Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de DeepSeek	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
DeepSeek v3.2	0,62 USD	1,85 USD

Regiones: Asia-Pacífico (Mumbai), América del Sur (São Paulo), Asia-Pacífico (Yakarta), Asia-Pacífico (Tokio) y Europa (Estocolmo)

Modelos de DeepSeek	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
DeepSeek v3.2	0,74 USD	2,22 USD

Región: Asia-Pacífico (Sídney)

Modelos de DeepSeek	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
DeepSeek v3.1	0,5974 USD	1,7304 USD
DeepSeek v3.2	0,6386 USD	1,9055 USD

Priority

Región: Asia-Pacífico (Sídney)

Modelos de DeepSeek	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
DeepSeek v3.1	1,0455 USD	3,0282 USD

Flex

Región: Asia-Pacífico (Sídney)

Modelos de DeepSeek	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
DeepSeek v3.1	0,2987 USD	0,8652 USD

Google

Google

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Google	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Gemma 3 4B	0,04 USD	0,08 USD
Gemma 3 12B	0,09 USD	0,29 USD
Gemma 3 27B	0,23 USD	0,38 USD

Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

Modelos de Google	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Gemma 3 4B	0,05 USD	0,09 USD
Gemma 3 12B	0,11 USD	0,34 USD
Gemma 3 27B	0,27 USD	0,45 USD

Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de Google	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Gemma 3 4B	0,05 USD	0,10 USD
Gemma 3 12B	0,11 USD	0,35 USD
Gemma 3 27B	0,28 USD	0,46 USD

Región: Europa (Londres)

Modelos de Google	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Gemma 3 4B	0,06 USD	0,12 USD
Gemma 3 12B	0,14 USD	0,45 USD
Gemma 3 27B	0,36 USD	0,59 USD

Región: Asia-Pacífico (Sídney)

Modelos de Google	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Gemma 3 4B	0,0412 USD	0,0824 USD
Gemma 3 12B	0,0927 USD	0,2987 USD
Gemma 3 27B	0,2369 USD	0,3914 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

Luma AI
Precios bajo demanda
Meta

MiniMax AI

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Minimax	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Minimax M2	0,30 USD	1,20 USD
Minimax M2.1	0,30 USD	1,20 USD
Minimax M2.5	0,30 USD	1,20 USD

Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

Modelos de Minimax	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Minimax M2	0,35 USD	1,41 USD
Minimax M2.1	0,36 USD	1,44 USD
Minimax M2.5	0,36 USD	1,44 USD

Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de Minimax	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Minimax M2	0,36 USD	1,45 USD
Minimax M2.1	0,36 USD	1,44 USD
Minimax M2.5	0,36 USD	1,44 USD

Región: Europa (Londres)

Modelos de Minimax	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Minimax M2	0,47 USD	1,86 USD
Minimax M2.1	0,47 USD	1,86 USD
Minimax M2.5	0,47 USD	1,86 USD

Regiones: Europa (Fráncfort), Europa (Estocolmo) y Asia-Pacífico (Yakarta)

Modelos de Minimax	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Minimax M2.1	0,36 USD	1,44 USD
Minimax M2.5	0,36 USD	1,44 USD

Región: Asia-Pacífico (Sídney)

Modelos de Minimax	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Minimax M2	0,3090 USD	1,2360 USD
Minimax M2.1	0,3090 USD	1,2360 USD
Minimax M2.5	0,31 USD	1,24 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

Mistral AI

Mistral AI

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,40 USD	2,00 USD
Magistral Small 1.2	0,50 USD	1,50 USD
Voxtral Mini 1.0	0,04 USD	0,04 USD
Voxtral Small 1.0	0,10 USD	0,30 USD
Ministral 3B 3.0	0,10 USD	0,10 USD
Ministral 8B 3.0	0,15 USD	0,15 USD
Ministral 14B 3.0	0,20 USD	0,20 USD
Mistral Large 3	0,50 USD	1,50 USD

Regiones: Asia-Pacífico (Mumbai)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,48 USD	2,40 USD
Magistral Small 1.2	0,59 USD	1,76 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,35 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD
Mistral Large 3	0,59 USD	1,76 USD

Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,48 USD	2,40 USD
Magistral Small 1.2	0,61 USD	1,82 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,36 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD
Mistral Large 3	0,61 USD	1,82 USD

Regiones: Europa (Irlanda) y Europa (Milán)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,48 USD	2,40 USD
Magistral Small 1.2	0,59 USD	1,76 USD
Voxtral Mini 1.0	0,05 USD	0,05 USD
Voxtral Small 1.0	0,12 USD	0,35 USD
Ministral 3B 3.0	0,12 USD	0,12 USD
Ministral 8B 3.0	0,18 USD	0,18 USD
Ministral 14B 3.0	0,24 USD	0,24 USD

Región: Europa (Londres)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,62 USD	3,10 USD
Magistral Small 1.2	0,78 USD	2,33 USD
Voxtral Mini 1.0	0,06 USD	0,06 USD
Voxtral Small 1.0	0,16 USD	0,47 USD
Ministral 3B 3.0	0,16 USD	0,16 USD
Ministral 8B 3.0	0,23 USD	0,23 USD
Ministral 14B 3.0	0,31 USD	0,31 USD

Región: Asia-Pacífico (Sídney)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,41 USD	2,06 USD
Magistral Small 1.2	0,5150 USD	1,5450 USD
Voxtral Mini 1.0	0,0412 USD	0,0412 USD
Voxtral Small 1.0	0,1030 USD	0,3090 USD
Ministral 3B 3.0	0,1030 USD	0,1030 USD
Ministral 8B 3.0	0,1545 USD	0,1545 USD
Ministral 14B 3.0	0,2060 USD	0,2060 USD
Mistral Large 3	0,5150 USD	1,5450 USD

Regiones: Asia-Pacífico (Yakarta), Europa (Fráncfort) y Europa (Estocolmo)

Modelos de Mistral	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Devstral 2 123B	0,48 USD	2,40 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

Moonshot AI

Moonshot AI

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Kimi	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Kimi K2 Thinking	0,60 USD	2,50 USD
Kimi K2.5	0,60 USD	3,00 USD

Región: Asia-Pacífico (Mumbai)

Modelos de Kimi	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Kimi K2 Thinking	0,71 USD	2,94 USD
Kimi K2.5	0,72 USD	3,60 USD

Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de Kimi	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Kimi K2 Thinking	0,73 USD	3,03 USD
Kimi K2.5	0,72 USD	3,60 USD

Regiones: Europa (Estocolmo) y Asia-Pacífico (Yakarta)

Modelos de Kimi	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Kimi K2.5	0,72 USD	3,60 USD

Región: Asia-Pacífico (Sídney)

Modelos de Kimi	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Kimi K2 Thinking	0,6180 USD	2,5750 USD
Kimi K2.5	0,6180 USD	3,0900 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

NVIDIA

NVIDIA

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de NVIDIA	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
NVIDIA Nemotron Nano 2	0,06 USD	0,23 USD
NVIDIA Nemotron Nano 2 VL	0,20 USD	0,60 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,06 USD	0,24 USD
NVIDIA Nemotron 3 Super 120B A12B	0,15 USD	0,65 USD

Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

Modelos de NVIDIA	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
NVIDIA Nemotron Nano 2	0,07 USD	0,27 USD
NVIDIA Nemotron Nano 2 VL	0,24 USD	0,71 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,07 USD	0,28 USD
NVIDIA Nemotron 3 Super 120B A12B	0,18 USD	0,78 USD

Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de NVIDIA	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
NVIDIA Nemotron Nano 2	0,07 USD	0,28 USD
NVIDIA Nemotron Nano 2 VL	0,24 USD	0,73 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,07 USD	0,29 USD
NVIDIA Nemotron 3 Super 120B A12B	0,18 USD	0,78 USD

Región: Europa (Londres)

Modelos de NVIDIA	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
NVIDIA Nemotron Nano 2	0,09 USD	0,36 USD
NVIDIA Nemotron Nano 2 VL	0,31 USD	0,93 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,09 USD	0,37 USD
NVIDIA Nemotron 3 Super 120B A12B	0,23 USD	1,01 USD

Región: Asia-Pacífico (Sídney)

Modelos de NVIDIA	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
NVIDIA Nemotron Nano 2	0,0618 USD	0,2369 USD
NVIDIA Nemotron Nano 2 VL	0,2060 USD	0,6180 USD
NVIDIA Nemotron 3 Nano 30B A3B	0,0618 USD	0,2472 USD
NVIDIA Nemotron 3 Super 120B A12B	0,15 USD	0,67 USD

Región: Asia-Pacífico (Yakarta), Europa (Fráncfort) y Europa (Estocolmo)

Modelos de NVIDIA	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
NVIDIA Nemotron 3 Super 120B A12B	0,18 USD	0,78 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

Modelos OpenAI OSS

Modelos OpenAI OSS

gpt-oss-20b, 120b
gpt-oss-safeguard 20b, 120b

gpt-oss-20b, 120b

Standard
Priority
Flex
Por lotes
Personalización de modelos

Standard

Región: Asia-Pacífico (Sídney)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
gpt-oss-20b	0,0721 USD	0,3090 USD
gpt-oss-120b	0,1545 USD	0,6180 USD

Priority

Región: Asia-Pacífico (Sídney)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
gpt-oss-20b	0,1262 USD	0,5408 USD
gpt-oss-120b	0,2704 USD	1,0815 USD

Flex

Región: Asia-Pacífico (Sídney)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
gpt-oss-20b	0,0361 USD	0,1545 USD
gpt-oss-120b	0,0773 USD	0,3090 USD

Por lotes

Región: Asia-Pacífico (Sídney)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
gpt-oss-20b	0,0361 USD	0,1545 USD
gpt-oss-120b	0,0773 USD	0,3090 USD

Personalización de modelos

Personalización de modelos

Precios de refinamiento de refuerzo

Con la capacidad de refinamiento de refuerzo de Amazon Bedrock, puede mejorar la precisión de los modelos sin necesidad de contar con una profunda experiencia en machine learning o grandes cantidades de datos etiquetados. Amazon Bedrock automatiza el flujo de trabajo de refinamiento de refuerzo: toma las peticiones de muestra, genera respuestas modelo y las puntúa mediante la función de recompensa. Estas peticiones, respuestas y puntuaciones se utilizan luego para entrenar su modelo mediante un flujo de trabajo de RFT iterativo.

Todo el flujo de trabajo de entrenamiento se factura por hora. Una vez finalizado el entrenamiento, los clientes pueden usar de inmediato el modelo refinado resultante para la inferencia bajo demanda. La opción de inferencia bajo demanda incluye un modelo de precios basado en tokens por el que se paga en función de la cantidad de tokens procesados durante la inferencia.

Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

Modelos de OpenAI	Precio por horas de entrenamiento	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida	Precio por el almacenamiento mensual de cada modelo entrenado
gpt-oss-20b	80,00 USD	0,09 USD	0,39 USD	1,95 USD

gpt-oss-safeguard 20b, 120b

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GPT OSS Safeguard 20B	0,07 USD	0,20 USD
GPT OSS Safeguard 120B	0,15 USD	0,60 USD

Regiones: Asia-Pacífico (Mumbai), América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GPT OSS Safeguard 20B	0,08 USD	0,24 USD
GPT OSS Safeguard 120B	0,18 USD	0,71 USD

Regiones: Europa (Irlanda) y Europa (Milán)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GPT OSS Safeguard 20B	0,08 USD	0,23 USD
GPT OSS Safeguard 120B	0,18 USD	0,70 USD

Región: Europa (Londres)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GPT OSS Safeguard 20B	0,11 USD	0,31 USD
GPT OSS Safeguard 120B	0,23 USD	0,93 USD

Región: Asia-Pacífico (Sídney)

Modelos de OpenAI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GPT OSS Safeguard 20B	0,0721 USD	0,2060 USD
GPT OSS Safeguard 120B	0,1545 USD	0,6180 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

Qwen

Amazon Bedrock

Qwen

Qwen3 Coder, 32B, 235B
Qwen 3 Next, VL, Coder Next

Qwen3 Coder, 32B, 235B

Standard
Priority
Flex
Por lotes
Personalización de modelos

Standard

Región: Asia-Pacífico (Sídney)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Coder 30B A3B	0,1545 USD	0,6180 USD
Qwen3 32B	0,1545 USD	0,6180 USD
Qwen3 235B A22B 2507	0,2266 USD	0,9064 USD

Priority

Región: Asia-Pacífico (Sídney)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Coder 30B A3B	0,2704 USD	1,0815 USD
Qwen3 32B	0,2704 USD	1,0815 USD
Qwen3 235B A22B 2507	0,3966 USD	1,5862 USD

Flex

Región: Asia-Pacífico (Sídney)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Coder 30B A3B	0,0773 USD	0,3090 USD
Qwen3 32B	0,0773 USD	0,3090 USD
Qwen3 235B A22B 2507	0,1133 USD	0,4532 USD

Por lotes

Región: Asia-Pacífico (Sídney)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Coder 30B A3B	0,0773 USD	0,3090 USD
Qwen3 32B	0,0773 USD	0,3090 USD
Qwen3 235B A22B 2507	0,1133 USD	0,4532 USD

Personalización de modelos

Personalización de modelos

Precios de refinamiento de refuerzo

Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

Modelos de Qwen	Precio por horas de entrenamiento	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida	Precio por el almacenamiento mensual de cada modelo entrenado
Qwen3 32B	80,00 USD	0,20 USD	0,78 USD	1,95 USD

Qwen 3 Next, VL, Coder Next

Precios bajo demanda

Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Next 80B A3B	0,15 USD	1,20 USD
Qwen3 VL 235B A22B	0,53 USD	2,66 USD
Qwen3 Coder Next	0,50 USD	1,20 USD

Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Next 80B A3B	0,18 USD	1,41 USD
Qwen3 VL 235B A22B	0,62 USD	3,13 USD
Qwen3 Coder Next	0,60 USD	1,44 USD

Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Next 80B A3B	0,18 USD	1,45 USD
Qwen3 VL 235B A22B	0,64 USD	3,22 USD
Qwen3 Coder Next	0,60 USD	1,44 USD

Región: Europa (Londres)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Next 80B A3B	0,23 USD	1,86 USD
Qwen3 VL 235B A22B	0,82 USD	4,12 USD
Qwen3 Coder Next	0,78 USD	1,86 USD

Regiones: Europa (Fráncfort) y Asia-Pacífico (Yakarta)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Coder Next	0,60 USD	1,44 USD

Región: Asia-Pacífico (Sídney)

Modelos de Qwen	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Qwen3 Next 80B A3B	0,1545 USD	1,2360 USD
Qwen3 VL 235B A22B	0,5459 USD	2,7398 USD
Qwen3 Coder Next	0,5150 USD	1,2360 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

Stability AI

Stability AI

Precios bajo demanda

Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.

Región: Oregón, Norte de Virginia, Ohio

Servicios de imágenes de Stability AI	Precio por generación para cada modelo
Eliminar fondo en imágenes de Stable	0,07 USD
Borrar objeto en imágenes de Stable	0,07 USD
Control de estructura en imágenes de Stable	0,07 USD
Control de boceto en imágenes de Stable	0,07 USD
Guía de estilo de imágenes de Stable	0,07 USD
Búsqueda y reemplazo de imágenes de Stable	0,07 USD
Relleno de imágenes de Stable	0,07 USD
Búsqueda y cambio de color de imágenes de Stable	0,07 USD
Transferencia de estilos de imágenes de Stable	0,08 USD
Ampliación conservadora de imágenes de Stable	0,40 USD
Ampliación creativa de imágenes de Stable	0,60 USD
Ampliación rápida de imágenes de Stable	0,03 USD
Extensión de imágenes de Stable	0,06 USD

TwelveLabs
TwelveLabs

Precios bajo demanda
Inferencia interregional global

Inferencia interregional geográfica y dentro de una región

Inferencia interregional global

Inferencia interregional geográfica y dentro de una región
Writer

Writer

Precios bajo demanda

Modelos de Writer	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
Palmyra X4	2,50 USD	10,00 USD
Palmyra X5	0,60 USD	6,00 USD
Palmyra Vision 7B	0,15 USD	0,60 USD

Z AI

Amazon Bedrock

Z AI

GLM 5
GLM 4.7
GLM 4.7 Flash

GLM 5

Precios bajo demanda

Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 5	1,00 USD	3,20 USD

Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), América del Sur (São Paulo) y Europa (Estocolmo)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 5	1,20 USD	3,84 USD

Región: Europa (Londres)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 5	1,55 USD	4,96 USD

Región: Asia-Pacífico (Sídney)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 5	1,03 USD	3,30 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

GLM 4.7

Precios bajo demanda

Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7	0,60 USD	2,20 USD

Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), América del Sur (São Paulo) y Europa (Estocolmo)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7	0,72 USD	2,64 USD

Región: Asia-Pacífico (Sídney)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7	0,6180 USD	2,2660 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

GLM 4.7 Flash

Precios bajo demanda

Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7 Flash	0,07 USD	0,40 USD
GLM 5	1,00 USD	3,20 USD

Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), Europa (Fráncfort), Europa (Irlanda), Europa (Milán), Europa (Estocolmo) y América del Sur (São Paulo)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7 Flash	0,08 USD	0,48 USD

Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), Europa (Fráncfort), Europa (Estocolmo) y América del Sur (São Paulo)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 5	1,20 USD	3,84 USD

Región: Europa (Londres)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7 Flash	0,11 USD	0,62 USD
GLM 5	1,55 USD	4,96 USD

Región: Asia-Pacífico (Sídney)

Modelos de Z AI	Precio por cada millón de tokens de entrada	Precio por cada millón de tokens de salida
GLM 4.7 Flash	0,0721 USD	0,4120 USD
GLM 5	1,03 USD	3,30 USD

* El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

Importación de modelos personalizados

Importación de modelos personalizados

Llama

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,05718 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,07144 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

*Facturado en intervalos de 5 minutos

Llama multimodal

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,05718 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,07144 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Mistral

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,05718 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,07144 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Mixtral

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,05718 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,07144 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Flan

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,05718 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,07144 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Precios de inferencia bajo demanda:
Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

Qwen

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,05718 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

Región: Europa (Fráncfort)

Versión de unidad modelo personalizada	v1.0
Precio por unidad modelo personalizada por minuto*	0,07144 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

OpenAI

Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Versión de unidad de modelos personalizados	v2.0
Precio por unidad de modelos personalizados por minuto*	0,1433 USD
Costo de almacenamiento mensual por unidad de modelos personalizados	1,95 USD

*Facturado en intervalos de 5 minutos

Bases de conocimiento
Recuperación de datos estructurados (generación de SQL)

La recuperación de datos estructurados se cobra por cada solicitud para generar una consulta SQL. La consulta SQL generada se usa para recuperar los datos de los almacenes de datos estructurados.

Modelos de Rerank

Los modelos de Rerank están diseñados para mejorar la relevancia y precisión de las respuestas en las aplicaciones de generación aumentada por recuperación (RAG). Se cobran por consulta.

**Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 512 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos. Una consulta equivale a una unidad de búsqueda.
Barreras de protección

Barreras de protección de Amazon Bedrock

El precio de Barreras de protección de Amazon Bedrock se basa en los cargos incurridos por el filtro usado en la barrera de protección. El precio es el mismo para el nivel estándar y el nivel clásico.

Filtro de las barreras de protección*	Precio
Filtros de contenido tanto para el nivel estándar como para el nivel clásico (contenido de texto)	0,15 USD por 1000 unidades de texto
Filtros de contenido (contenido de imágenes)	0,00075 USD por imagen procesada
Temas rechazados tanto para el nivel estándar como para el nivel clásico	0,15 USD por 1000 unidades de texto
Filtros de información confidencial	0,10 USD por 1000 unidades de texto
Filtros de información confidencial (expresión regular)	Gratis
Filtros de palabras	Gratis
Verificaciones de la base contextual	0,10 USD por 1000 unidades de texto
Verificaciones del razonamiento automatizado	0,17 USD por cada 1000 unidades de texto por política de razonamiento automatizado

Precios bajo demanda

* Cada filtro de barreras de protección es opcional y se puede activar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de filtro usado en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estos dos filtros, pero no habrá cargos asociados a los filtros de información confidencial.

Nota: Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.

La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.

Evaluación del modelo

Evaluación del modelo

La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos en la que aporta su propio flujo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.

Si utiliza la evaluación de RAG o LLM como juez en la evaluación del modelo, los tokens que utiliza el modelo juez se cobran en función de los precios de los niveles estándar bajo demanda. Las peticiones del juez se cobran como parte del uso de tokens y están disponibles en la documentación pública. La evaluación de RAG en una base de conocimientos de Bedrock también conlleva los cargos por uso habituales de Bases de conocimiento de Bedrock.

Modelo

Precio por cada 1000 tokens de entrada

Precio por cada 1000 tokens de salida

Precio por tarea humana

Modelo seleccionado para la evaluación

Basado en el modelo seleccionado

0,21 USD

Automatización de datos
Automatización de Datos

Automatización de Datos de Amazon Bedrock transforma contenido no estructurado y multimodal en formatos de datos estructurados, para casos de uso como el procesamiento inteligente de documentos, el análisis de video y la RAG. La Automatización de datos de Bedrock puede generar contenido de salida estándar con valores predeterminados específicos según la modalidad, como descripciones escena por escena de videos, transcripciones de audio o análisis automatizado de documentos. Además, los clientes pueden crear salidas personalizadas al especificar los requisitos de salida en esquemas basados en su propia estructura de datos, que luego se cargan fácilmente en una base de datos o almacén de datos existente. A través de su integración con Bases de conocimiento, Automatización de Datos de Bedrock también permite analizar contenido en aplicaciones de RAG, lo que mejora la precisión y la relevancia de los resultados al incorporar información incrustada tanto en imágenes como en texto.

Bases de conocimiento de Amazon Bedrock ofrece una integración de Automatización de Datos de Bedrock para proporcionar respuestas más relevantes y precisas para los datos multimodales. Al configurar una base de conocimientos, puede seleccionar Bedrock Data Automation como método de análisis para analizar y extraer información significativa de imágenes o documentos, que pueden incluir figuras, gráficos y diagramas. Durante el procesamiento, Bedrock Data Automation extrae información significativa de los documentos e imágenes ingeridos, que luego se utiliza en los pasos posteriores de la base de conocimientos para fragmentar, incrustar y almacenar. Cuando se integra con las bases de conocimiento, Automatización de Datos de Bedrock entrega y cobra por los resultados estandarizados.
Direccionamiento de peticiones inteligente

Punto de precio	Dimensión de precios	Plan de precios
Direccionamiento de peticiones inteligente	1 USD por 1000 solicitudes	Bajo demanda

Direccionamiento de peticiones inteligente

El direccionamiento de peticiones inteligente le permite usar una combinación de modelos fundacionales (FM) de la misma familia de modelos para ayudar a optimizar la calidad y el costo. Por ejemplo, con la familia de modelos Claude de Anthropic, Amazon Bedrock puede enrutar de forma inteligente las peticiones entre Claude 3.5 Sonnet y Claude 3 Haiku, en función de la complejidad del mensaje. Del mismo modo, Amazon Bedrock puede enrutar solicitudes entre Meta Llama 3.3 70B y 3.18B, y Nova Pro y Nova Lite. El direccionamiento de peticiones predice qué modelo proporcionará el mejor rendimiento para cada solicitud y, al mismo tiempo, ayuda a optimizar la calidad de la respuesta y el costo. Esto es particularmente útil para aplicaciones como los asistentes de servicio al cliente, donde las consultas sencillas se pueden gestionar mediante modelos más pequeños, rápidos y rentables, y las consultas complejas se dirigen a modelos más capaces. El direccionamiento de peticiones inteligente puede reducir los costos hasta en un 30 % sin comprometer la precisión.

Optimización de peticiones

Optimización de peticiones para Amazon Bedrock

Se le cobra en función del número de tokens en las peticiones de entrada y en las peticiones optimizadas.

Todos los cargos se facturan mensualmente a partir del 23 de abril de 2025.

Precio por cada 1000 tokens

0,030 USD

Ejemplos de precios

AI21 Labs

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD
Amazon

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD

Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.

Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.

Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD
Barreras de protección de Amazon Bedrock
Ejemplo 1: chatbot de atención al cliente
Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.

El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.

Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.

Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.

Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto

Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

Ejemplo 2: resumen de la transcripción del centro de llamadas
Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.

Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.

Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USD
Ejemplo 3: Motor de verificación de protocolos médicos
Una empresa de tecnología sanitaria implementa verificaciones de razonamiento automatizado en su sistema de apoyo a la toma de decisiones clínicas para validar las sugerencias de tratamiento según las directrices médicas.

El sistema procesa 5000 casos de pacientes al mes. Cada caso implica:
- Resumen de datos del paciente: 500 caracteres (1 unidad de texto)
- Evaluación diagnóstica: 2000 caracteres (2 unidades de texto)
- Recomendación de tratamiento: 4500 caracteres (5 unidades de texto)
Unidades de texto procesadas por mes = (1 + 2 + 5) 5000 casos = 40 000 unidades de texto
Costo total incurrido por mes para las verificaciones de razonamiento automatizado = 40 000 (0,17 USD)/1000 = 6,80 USD
Bases de conocimiento de Amazon Bedrock

Ejemplo de precios 1 (cambio de clasificación mediante el modelo Amazon Rerank 1.0)

En un mes determinado, realiza 2 millones de solicitudes a la API de Rerank con el modelo Amazon Rerank 1.0; 1 millón de solicitudes contienen menos de 100 documentos cada una y, por lo tanto, se cobrará una solicitud por cada una. El millón de solicitudes restantes contienen entre 120 y 150 documentos y, por lo tanto, a cada solicitud se le cobrarán 2 solicitudes.

Precio de una solicitud = 0,001 USD
Costo total = 1,000,000 USD × 0.001 + 1,000,000 USD × 2 = 0.001 USD = 3000 USD

Ejemplo de precios 2: (Recuperación de datos estructurados)

Un desarrollador de aplicaciones crea un chatbot de soporte que consulta los datos estructurados almacenados en Amazon Redshift. El desarrollador crea una base de conocimientos de Bedrock y se conecta a Amazon Redshift. El chatbot atiende 10000 consultas de usuarios por hora. Cada consulta de usuario costará 0,002 USD por API de GenerateQuery para generar SQL a partir de la consulta del usuario.

Costo total incurrido para generar SQL por hora = 0,002 USD*10000 = 20 USD.
Costo total incurrido en el mes = 20 USD*24 USD*30 USD = 1440 USD
Anthropic

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
Cohere

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.

Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

Precios de la personalización (ajuste preciso)

Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.

Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
Importación de modelos personalizados

Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.

La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un periodo de 5 minutos, el intervalo se considerará activa para la facturación. Si hay una invocación a las 8:03 a. m. y no hay más invocaciones después de las 8:07 a. m., la medición se detendrá a las 8:07 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 1 intervalo de cinco minutos = 0,785 USD.
Automatización de datos

Ejemplo de precios 1:
Supongamos que procesa un documento de 1000 páginas con BDA Custom Output. Las 1000 páginas se procesan mediante el esquema 1, que tiene 15 campos. El precio por página de cualquier esquema con 30 campos o menos es de 0,040 USD. El costo total sería de 40 USD.

Total de páginas procesadas = 1000
Precio por página para esquemas con menos de 30 campos = 0,040 USD
Costo total = 1000 × 0.040 USD = 40 USD

Ejemplo de precios 2:
Supongamos que procesa 2 documentos con BDA Custom Output. El documento 1 tiene 40 páginas y se procesa con el esquema 1, que tiene 20 campos. El documento 2 tiene 10 páginas y se procesa con el esquema 2, que tiene 40 campos. El precio por página del esquema 1 es de 0,040 USD, ya que contiene 30 campos o menos. El precio por página del esquema 2 es de 0,045 USD. El costo de procesamiento del documento 1 con el esquema 1 es de 1,60 USD. El costo de procesamiento del documento 2 con el esquema 2 es de 0,45 USD. El costo total de procesar ambos documentos sería de 2,05 USD.

Total de páginas procesadas = 50
Precio por página para el esquema 1 con menos de 30 campos = 0,040 USD
Precio por página para el esquema 2 con 40 campos = 0,040 USD + (número de campos adicionales superiores a 30 *0,0005 USD por campo)
Número de campos adicionales por encima de 30 = 40 - 30 = 10
Precio por página para el esquema 2 con 40 campos = 0,040 USD + (10 *0,0005 USD por campo) = 0,045 USD
Cargo por el documento 1 con el esquema 1 = 40 páginas x 0,040 USD por página = 1,6 USD
Cargo por el documento 2 con el esquema 2 = 10 páginas x 0,045 USD por página = 0,45 USD
Cargo total = cargo por el documento 1 + cargo por el documento 2 = 1,6 USD + 0,45 USD = 2,05 USD

Ejemplo 3 de precios.
Supongamos que configura las bases de conocimiento de Bedrock para usar Bedrock Data Automation como analizador y, a continuación, ingiere un documento de 1000 páginas. Tenga en cuenta que las estructuras de costos difieren entre las opciones de análisis de las bases de conocimiento. BDA usa precios por página, mientras que los analizadores de Foundational Model cobran en función de los tokens de entrada y salida. Para dar contexto, el procesamiento de 1000 páginas, de las que el 30 % contiene tablas y el 30 % contiene figuras, normalmente requiere 2900 tokens de entrada y 750 tokens de salida. El consumo de tokens varía según el tipo de contenido, por lo que se recomienda a los clientes que prueben con sus propios datos para obtener estimaciones más precisas. La integración de las bases de conocimiento de Bedrock y Bedrock Data Automation utiliza una salida estándar, donde precio por página es 0,010 USD. El costo total sería de 10 USD.

Total de páginas procesadas = 1000
Precio por página para la salida estándar = 0,010 USD
Costo total = 1000 x 0,010 USD = 10 USD

Ejemplo de precios 4:
Supongamos que procesa un video de 60 minutos con la salida estándar BDA. El precio por minuto de la salida estándar de video es de 0,050 USD. El costo total sería de 3.00 USD.

Total de minutos procesados = 60
Precio por minuto para la salida estándar de video = 0,050 USD
Costo total = 60 × 0,050 USD = 3,00 USD

Ejemplo de precios 5:
Supongamos que procesa 2000 imágenes con BDA Custom Output. Las primeras 1000 imágenes se procesan con el esquema 1, que tiene 10 campos. Las últimas 1000 páginas se procesan con el esquema 2, que tiene 40 campos. El precio por imagen del esquema 1 es de 0,005 USD, ya que contiene 30 campos o menos. El precio por imagen del esquema 2 es de 0,01 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 1 es de 5,00 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 2 es de 10,00 USD. El costo total de procesar las 2000 imágenes sería de 15,00 USD

Costo de las primeras 1000 imágenes = 1000 imágenes* 0,005 USD por imagen = 5,00 USD
Costo de 1000 imágenes secundarias = 1000 imágenes * (0,005 USD + [número de campos adicionales superiores a 30 x 0,0005 USD por campo])
= 1000 x (0,005 USD + ([40-30] x 0,0005 USD))
= 1000 x (0,005 USD + [10 x 0,0005 USD]) = 10,00 USD
Costo total = 5,00 USD + 10,00 USD = 15,00 USD

Ejemplo de precios 6:
Supongamos que desea utilizar Bedrock Data Automation Standard Output para procesar 15 000 minutos de grabaciones de audio de reuniones en su organización. El costo total de procesar los 15 000 minutos de audio sería de 90 USD.

Total de minutos procesados = 15 000 minutos
Carga total = 15 000 minutos × 0,006 USD = 90 USD
DeepSeek

Precios bajo demanda

Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo DeepSeek-R1 para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens (incluidos los tokens de razonamiento):

Costo total por hora = 2000 tokens/1000 * 0,00135 USD + 1000 tokens/1000 * 0,0054 USD = 0,0081 USD
Flujos

Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea un flujo para automatizar el resumen de noticias para los comerciantes. El flujo incluye un nodo de entrada que ocupa una ubicación de S3 y un nodo de recuperación de S3 que recupera 10 archivos que incluyen artículos de 10 de las principales agencias de noticias de S3 (transiciones de 2 nodos). A continuación, utiliza un nodo iterador para invocar un modelo con un nodo de petición para resumir cada archivo (+ 10 archivos x 2 transiciones de nodos). A continuación, recopila todos los resultados mediante un nodo recopilador, escribe los resultados en S3 mediante el nodo de almacenamiento de S3 y los completa en un nodo de salida (+ 3 transiciones de nodo). El desarrollador ejecuta este flujo cada media hora de cada día de la semana.

La cantidad de transiciones de nodo por ejecución de flujo es: 2+1+10*2 + 3 = 25 transiciones de nodo/ejecución de flujo

La cantidad de ejecuciones de flujo por mes es: 24 horas *2* 5 días * 4 semanas = 960 ejecuciones de flujo/mes.

La factura mensual total es: 25 * 960 * 0,035 USD/1000 = 0,84 USD

Cargos adicionales
La factura también incluirá cargos adicionales por los servicios de AWS que se utilicen en la ejecución del flujo de trabajo, incluidos los usos de Amazon S3 en los nodos de recuperación y almacenamiento, y el uso del modelo fundacional de Amazon Bedrock en el nodo de petición.
Meta

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

Precios de la personalización (ajuste preciso)

Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD
Mistral AI

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD

Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD

Evaluación del modelo

Ejemplo 1 de evaluación del modelo:

El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).

Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

Elemento	Número de tokens de entrada	Precio por cada 1000 tokens de entrada	Costo de entrada	Número de tokens de salida	Precio por cada 1000 tokens de salida	Costo de salida	Número de tareas humanas	Precio por tarea humana	Costo de las tareas humanas	Total
Inferencia de Claude Instant	5000	0,0008 USD	0,004 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Inferencia de Claude 2.1	5000	0,008 USD	0,04 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Tareas humanas							50	0,21 USD	10,50 USD	10,50 USD
Total										11,06 USD

Ejemplo 2 de evaluación del modelo:

Precios bajo demanda
Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).

Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

Elemento	Número de tokens de entrada	Precio por cada 1000 tokens de entrada	Costo de entrada	Número de tokens de salida	Precio por cada 1000 tokens de salida	Costo de salida	Número de tareas humanas	Precio por tarea humana	Costo de las tareas humanas	Total
Inferencia de Claude Instant	5000	0,0008 USD	0,0040 USD	15 000	0,0024 USD	0,036 USD				0,04 USD
Inferencia de Claude 2.1	5000	0,008 USD	0,0400 USD	20 000	0,024 USD	0,48 USD				0,52 USD
Tareas humanas							100	0,21 USD	21,00 USD	21,00 USD
Total										21,56 USD

Optimización de peticiones

Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea una petición para resumir las noticias para los operadores que usan Claude 3.5. La petición original incluye 429 tokens. La petición optimizada tiene 511 tokens e incluye instrucciones y ejemplos más específicos para que los modelos fundacionales generen respuestas más concisas. Usa la petición optimizada con 511 tokens como entrada para el optimizador de peticiones y crea 2 variantes nuevas para Claude 3.7 y Nova Pro con 582 y 579 tokens.

La cantidad total de tokens de entrada y salida para la optimización de peticiones es: 429 + 511 + 511 + 582 + 511 + 579 = 3123

La factura mensual total es: 3123 / 1000 * 0,03 USD = 0,09 USD
Stability AI

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).

Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).

Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD

Precios del rendimiento aprovisionado

Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.

Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD
TwelveLabs

Precios bajo demanda

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Pegasus 1.2 para describir lo que implica un video de 10 segundos de duración, que proporciona una salida de 2000 tokens.

Costo total incurrido = 10 segundos * 0,00049 USD + 2000 tokens / 1000 * 0,0075 = USD = 0,0199 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed [3.0 o 2.7] para incrustar 10 vídeos, con una duración combinada de 100 minutos.

Coste total incurrido = 100 minutos (es decir, 6000 segundos) * 0,00070 USD = 4,2 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed 3.0 para que, al proporcionar un texto y una imagen juntos, genere una incrustación que pueda usar para encontrar el clip que tiene la bolsa que se muestra en la imagen dada, en el repositorio de incrustaciones que habría creado con el ejemplo anterior.

Coste total incurrido = 1 solicitud de texto * 0,00007 USD +1 solicitud de imagen * 0,0001 USD = 0,00017 USD

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed [3.0 o 2.7] para proporcionar un texto para generar una incrustación que pueda usar para encontrar clips coincidentes en el repositorio de incrustaciones que habría creado con el ejemplo anterior.

Coste total incurrido = 1 solicitud de texto * 0,00007 = 0,00007 USD
Escritor

Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Palmyra X5 de Writer para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

Costo total incurrido = 10 000 tokens/1000 * 0,003 USD + 2000 tokens/1000 * 0,015 USD = 0,06 USD

Pasos siguientes

Taller

Descubra los casos de uso comunes de Amazon Bedrock con un taller guiado

Vea el taller

Demostración

Vea demostraciones de las capacidades de Amazon Bedrock

Explore la biblioteca de demostraciones

Modelos de Meta	Precio por el entrenamiento de 1 millón de tokens	Precio por el almacenamiento mensual de cada modelo personalizado*	Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)
Llama 2 Pretrained (13B)	1,49 USD	1,95 USD	23,50 USD
Llama 2 Pretrained (70B)	7,99 USD	1,95 USD	23,50 USD

Precios de Amazon Bedrock

Precios de los modelos

AI21 Labs

Amazon Nova

Precios para comprender los modelos

Inferencia interregional global

Inferencia geográfica entre regiones y dentro de una región

Herramientas integradas

Precios por modelos de generación de contenido creativo

Precios de los modelos de generación y comprensión del habla

Precios bajo demanda para los modelos fundacionales de conversión de voz a voz

Precios de los modelos de incrustación

Amazon Titan

Anthropic

Precios del nivel Reserved

Cohere

DeepSeek

Google

Precios bajo demanda

Meta

MiniMax AI

Mistral AI

Moonshot AI

NVIDIA

Modelos OpenAI OSS

Qwen

Stability AI

TwelveLabs

Writer

Z AI

Importación de modelos personalizados

Barreras de protección de Amazon Bedrock

Evaluación del modelo

Automatización de Datos

Optimización de peticiones para Amazon Bedrock

Ejemplos de precios

AI21 Labs

Amazon

Precios bajo demanda

Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

Precios del rendimiento aprovisionado

Barreras de protección de Amazon Bedrock

Bases de conocimiento de Amazon Bedrock

Anthropic

Precios bajo demanda

Precios del rendimiento aprovisionado

Cohere

Precios bajo demanda

Precios de la personalización (ajuste preciso)

Importación de modelos personalizados

Automatización de datos

DeepSeek

Flujos

Meta

Precios bajo demanda

Precios de la personalización (ajuste preciso)

Precios del rendimiento aprovisionado

Mistral AI

Precios bajo demanda

Evaluación del modelo

Ejemplo 1 de evaluación del modelo:

Ejemplo 2 de evaluación del modelo:

Optimización de peticiones

Stability AI

Precios bajo demanda

Precios del rendimiento aprovisionado

TwelveLabs

Escritor

Pasos siguientes

Descubra los casos de uso comunes de Amazon Bedrock con un taller guiado

Vea demostraciones de las capacidades de Amazon Bedrock

Aprender

Recursos

Desarrolladores

Ayuda