- AWS
- Amazon Bedrock
- Precios
Precios de Amazon Bedrock
-
Precios de los modelos
-
Bases de conocimiento
-
Barreras de protección
-
Evaluación del modelo
-
Automatización de datos
-
Direccionamiento de peticiones inteligente
-
Optimización de peticiones
-
Precios de los modelos
-
Precios de los modelos
El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.
Amazon Bedrock admite una variedad de niveles, tales como Standard, Flex, Priority y Reserved. Haga clic para obtener más información sobre los niveles de servicio.
Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia en lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Para obtener más información sobre los lotes, haga clic aquí. Consulte la lista de modelos aquí.
-
AI21 Labs
-
Amazon
-
Anthropic
-
Cohere
-
DeepSeek
-
Google
-
Luma AI
-
Meta
-
MiniMax AI
-
Mistral AI
-
Moonshot AI
-
NVIDIA
-
OpenAI
-
Qwen
-
Stability AI
-
TwelveLabs
-
Writer
-
Z AI
-
Importación de modelos personalizados
-
AI21 Labs
-
AI21 Labs
Precios bajo demanda
-
Amazon
-
-
Amazon Nova
-
Amazon Titan
-
Otro Amazon
-
Amazon Nova
-
Amazon Nova
Precios para comprender los modelos
Inferencia interregional global
Inferencia geográfica entre regiones y dentro de una región
Herramientas integradas
Precios por modelos de generación de contenido creativo
Precios de los modelos de generación y comprensión del habla
Precios bajo demanda para los modelos fundacionales de conversión de voz a voz
Nota: *Los precios de entrada y salida de los tokens de texto se aplican a casos de uso específicos, como la transcripción de voz a texto, las llamadas a herramientas para completar tareas o la base de conocimientos, agregar el historial de conversaciones a la sesión, etc.
La inferencia bajo demanda para los modelos Nova personalizados tiene el mismo precio que la inferencia Nova básica.
Precios de los modelos de incrustación
-
Amazon Titan
-
Amazon Titan
-
Otro Amazon
-
-
-
Anthropic
-
Anthropic
Precios bajo demanda y por lotes
Modelos con acceso ampliado
Proveedor Nombre de modelo Regiones Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Precio por cada millón de tokens de entrada (por lotes) Precio por cada millón de tokens de salida (por lotes) Precio por cada millón de tokens de entrada (escritura en caché) Precio por cada millón de tokens de entrada (lectura de caché) Anthropic Claude 3.5 Sonnet (acceso público ampliado, en vigor desde el 1 de diciembre de 2025) Este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio), oeste de EE. UU. (Oregón), Europa (Fráncfort), Europa (Irlanda), Europa (Zúrich), Europa (París) 6,00 USD 30,00 USD 3,00 USD 15,00 USD N/D N/D Anthropic Claude 3.5 Sonnet v2 (acceso público ampliado, en vigor desde el 1 de diciembre de 2025) Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón) 6,00 USD 30,00 USD 3,00 USD 15,00 USD 7,50 USD 0,60 USD Precios del nivel Reserved
Inferencia optimizada para la latencia
Precios del rendimiento aprovisionado
Para conocer los precios del rendimiento aprovisionado, contacte con su equipo de cuentas.
-
Cohere
-
Cohere
Precios bajo demanda
Modelos de Cohere Precio por cada 1000 consultas** Rerank 3.5 2,00 USD **Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 500 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos. Precios por la personalización (ajuste preciso)
*El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas
Precios del rendimiento aprovisionado
Modelos de Cohere Precio por hora y modelo
sin compromisoPrecio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes
Cohere Command
49,50 USD 39,60 USD
23,77 USD
Cohere Command: Light 8,56 USD 6,85 USD
4,11 USD Insertar 3 inglés 7,12 USD 6,76 USD
6,41 USD Insertar 3 multilingüe 7,12 USD 6,76 USD
6,41 USD Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.
-
DeepSeek
-
DeepSeek
Precios bajo demanda
-
Standard
-
Priority
-
Flex
-
Standard
-
Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida DeepSeek v3.2 0,62 USD 1,85 USD Regiones: Asia-Pacífico (Mumbai), América del Sur (São Paulo), Asia-Pacífico (Yakarta), Asia-Pacífico (Tokio) y Europa (Estocolmo)
Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida DeepSeek v3.2 0,74 USD 2,22 USD Región: Asia-Pacífico (Sídney)
Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida DeepSeek v3.1 0,5974 USD 1,7304 USD DeepSeek v3.2 0,6386 USD 1,9055 USD -
Priority
-
Región: Asia-Pacífico (Sídney)
Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida DeepSeek v3.1 1,0455 USD 3,0282 USD -
Flex
-
Región: Asia-Pacífico (Sídney)
Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida DeepSeek v3.1 0,2987 USD 0,8652 USD
-
-
Google
-
Google
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Gemma 3 4B 0,04 USD 0,08 USD Gemma 3 12B 0,09 USD 0,29 USD Gemma 3 27B 0,23 USD 0,38 USD Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)
Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Gemma 3 4B 0,05 USD 0,09 USD Gemma 3 12B 0,11 USD 0,34 USD Gemma 3 27B 0,27 USD 0,45 USD Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Gemma 3 4B 0,05 USD 0,10 USD Gemma 3 12B 0,11 USD 0,35 USD Gemma 3 27B 0,28 USD 0,46 USD Región: Europa (Londres)
Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Gemma 3 4B 0,06 USD 0,12 USD Gemma 3 12B 0,14 USD 0,45 USD Gemma 3 27B 0,36 USD 0,59 USD Región: Asia-Pacífico (Sídney)
Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Gemma 3 4B 0,0412 USD 0,0824 USD Gemma 3 12B 0,0927 USD 0,2987 USD Gemma 3 27B 0,2369 USD 0,3914 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard -
Luma AI
-
Precios bajo demanda
-
Meta
-
Meta
Llama 4
Precios bajo demanda y por lotes
Llama 3.3
Precios bajo demanda y por lotes
Llama 3.2
Precios bajo demanda y por lotes
Precios por la personalización del modelo (refinamiento)
Precios del rendimiento aprovisionado
Llama 3.1
Precios bajo demanda y por lotes
Precios por la personalización del modelo (ajuste preciso)
Precios del rendimiento aprovisionado
Llama 3
Precios bajo demanda
Llama 2
Precios bajo demanda
Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Modelos de Meta Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Llama 2 Chat (13B)
0,75 USD
1,00 USD
Llama 2 Chat (70B) 1,95 USD
2,56 USD Precios por la personalización del modelo (refinamiento)
Modelos de Meta Precio por el entrenamiento de 1 millón de tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso) Llama 2 Pretrained (13B)
1,49 USD
1,95 USD
23,50 USD
Llama 2 Pretrained (70B) 7,99 USD
1,95 USD 23,50 USD * Almacenamiento de modelo personalizado = 1,95 USD
Precios del rendimiento aprovisionado
Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes Llama 2 Pretrained y Chat (13B)
21,18 USD
13,08 USD
Llama 2 Pretrained (70B) 21,18 USD
13,08 USD * Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización.
Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.
-
MiniMax AI
-
MiniMax AI
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2 0,30 USD 1,20 USD Minimax M2.1 0,30 USD 1,20 USD Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2.5 0,30 USD 1,20 USD Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2 0,35 USD 1,41 USD Minimax M2.1 0,36 USD 1,44 USD Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2 0,36 USD 1,45 USD Minimax M2.1 0,36 USD 1,44 USD Región: Europa (Londres)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2 0,47 USD 1,86 USD Minimax M2.1 0,47 USD 1,86 USD Regiones: Europa (Fráncfort), Europa (Estocolmo) y Asia-Pacífico (Yakarta)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2.1 0,36 USD 1,44 USD Región: Asia-Pacífico (Sídney)
Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Minimax M2 0,3090 USD 1,2360 USD Minimax M2.1 0,3090 USD 1,2360 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard -
Mistral AI
-
Mistral AI
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,40 USD 2,00 USD Magistral Small 1.2 0,50 USD 1,50 USD Voxtral Mini 1.0 0,04 USD 0,04 USD Voxtral Small 1.0 0,10 USD 0,30 USD Ministral 3B 3.0 0,10 USD 0,10 USD Ministral 8B 3.0 0,15 USD 0,15 USD Ministral 14B 3.0 0,20 USD 0,20 USD Mistral Large 3 0,50 USD 1,50 USD Regiones: Asia-Pacífico (Mumbai)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,48 USD 2,40 USD Magistral Small 1.2 0,59 USD 1,76 USD Voxtral Mini 1.0 0,05 USD 0,05 USD Voxtral Small 1.0 0,12 USD 0,35 USD Ministral 3B 3.0 0,12 USD 0,12 USD Ministral 8B 3.0 0,18 USD 0,18 USD Ministral 14B 3.0 0,24 USD 0,24 USD Mistral Large 3 0,59 USD 1,76 USD Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,48 USD 2,40 USD Magistral Small 1.2 0,61 USD 1,82 USD Voxtral Mini 1.0 0,05 USD 0,05 USD Voxtral Small 1.0 0,12 USD 0,36 USD Ministral 3B 3.0 0,12 USD 0,12 USD Ministral 8B 3.0 0,18 USD 0,18 USD Ministral 14B 3.0 0,24 USD 0,24 USD Mistral Large 3 0,61 USD 1,82 USD Regiones: Europa (Irlanda) y Europa (Milán)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,48 USD 2,40 USD Magistral Small 1.2 0,59 USD 1,76 USD Voxtral Mini 1.0 0,05 USD 0,05 USD Voxtral Small 1.0 0,12 USD 0,35 USD Ministral 3B 3.0 0,12 USD 0,12 USD Ministral 8B 3.0 0,18 USD 0,18 USD Ministral 14B 3.0 0,24 USD 0,24 USD Región: Europa (Londres)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,62 USD 3,10 USD Magistral Small 1.2 0,78 USD 2,33 USD Voxtral Mini 1.0 0,06 USD 0,06 USD Voxtral Small 1.0 0,16 USD 0,47 USD Ministral 3B 3.0 0,16 USD 0,16 USD Ministral 8B 3.0 0,23 USD 0,23 USD Ministral 14B 3.0 0,31 USD 0,31 USD Región: Asia-Pacífico (Sídney)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,41 USD 2,06 USD Magistral Small 1.2 0,5150 USD 1,5450 USD Voxtral Mini 1.0 0,0412 USD 0,0412 USD Voxtral Small 1.0 0,1030 USD 0,3090 USD Ministral 3B 3.0 0,1030 USD 0,1030 USD Ministral 8B 3.0 0,1545 USD 0,1545 USD Ministral 14B 3.0 0,2060 USD 0,2060 USD Mistral Large 3 0,5150 USD 1,5450 USD Regiones: Asia-Pacífico (Yakarta), Europa (Fráncfort) y Europa (Estocolmo)
Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Devstral 2 135B 0,48 USD 2,40 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard -
Moonshot AI
-
Moonshot AI
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Kimi K2 Thinking 0,60 USD 2,50 USD Kimi K2.5 0,60 USD 3,00 USD Región: Asia-Pacífico (Mumbai)
Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Kimi K2 Thinking 0,71 USD 2,94 USD Kimi K2.5 0,72 USD 3,60 USD Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Kimi K2 Thinking 0,73 USD 3,03 USD Kimi K2.5 0,72 USD 3,60 USD Regiones: Europa (Estocolmo) y Asia-Pacífico (Yakarta)
Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Kimi K2.5 0,72 USD 3,60 USD Región: Asia-Pacífico (Sídney)
Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Kimi K2 Thinking 0,6180 USD 2,5750 USD Kimi K2.5 0,6180 USD 3,0900 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard -
NVIDIA
-
NVIDIA
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida NVIDIA Nemotron Nano 2 0,06 USD 0,23 USD NVIDIA Nemotron Nano 2 VL 0,20 USD 0,60 USD NVIDIA Nemotron 3 Nano 30B A3B 0,06 USD 0,24 USD Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)
Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida NVIDIA Nemotron 3 Super 120B A12B 0,15 USD 0,65 USD Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)
Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida NVIDIA Nemotron Nano 2 0,07 USD 0,27 USD NVIDIA Nemotron Nano 2 VL 0,24 USD 0,71 USD NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,28 USD Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida NVIDIA Nemotron Nano 2 0,07 USD 0,28 USD NVIDIA Nemotron Nano 2 VL 0,24 USD 0,73 USD NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,29 USD Región: Europa (Londres)
Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida NVIDIA Nemotron Nano 2 0,09 USD 0,36 USD NVIDIA Nemotron Nano 2 VL 0,31 USD 0,93 USD NVIDIA Nemotron 3 Nano 30B A3B 0,09 USD 0,37 USD Región: Asia-Pacífico (Sídney)
Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida NVIDIA Nemotron Nano 2 0,0618 USD 0,2369 USD NVIDIA Nemotron Nano 2 VL 0,2060 USD 0,6180 USD NVIDIA Nemotron 3 Nano 30B A3B 0,0618 USD 0,2472 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard -
OpenAI
-
OpenAI
-
gpt-oss-20b, 120b
-
gpt-oss-safeguard 20b, 120b
-
gpt-oss-20b, 120b
-
-
Standard
-
Priority
-
Flex
-
Por lotes
-
Personalización de modelos
-
Standard
-
Región: Asia-Pacífico (Sídney)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida gpt-oss-20b 0,0721 USD 0,3090 USD gpt-oss-120b 0,1545 USD 0,6180 USD -
Priority
-
Región: Asia-Pacífico (Sídney)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida gpt-oss-20b 0,1262 USD 0,5408 USD gpt-oss-120b 0,2704 USD 1,0815 USD -
Flex
-
Región: Asia-Pacífico (Sídney)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida gpt-oss-20b 0,0361 USD 0,1545 USD gpt-oss-120b 0,0773 USD 0,3090 USD -
Por lotes
-
Región: Asia-Pacífico (Sídney)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida gpt-oss-20b 0,0361 USD 0,1545 USD gpt-oss-120b 0,0773 USD 0,3090 USD -
Personalización de modelos
-
Personalización de modelos
Precios de refinamiento de refuerzo
Con la capacidad de refinamiento de refuerzo de Amazon Bedrock, puede mejorar la precisión de los modelos sin necesidad de contar con una profunda experiencia en machine learning o grandes cantidades de datos etiquetados. Amazon Bedrock automatiza el flujo de trabajo de refinamiento de refuerzo: toma las peticiones de muestra, genera respuestas modelo y las puntúa mediante la función de recompensa. Estas peticiones, respuestas y puntuaciones se utilizan luego para entrenar su modelo mediante un flujo de trabajo de RFT iterativo.
Todo el flujo de trabajo de entrenamiento se factura por hora. Una vez finalizado el entrenamiento, los clientes pueden usar de inmediato el modelo refinado resultante para la inferencia bajo demanda. La opción de inferencia bajo demanda incluye un modelo de precios basado en tokens por el que se paga en función de la cantidad de tokens procesados durante la inferencia.
Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)
Modelos de OpenAI Precio por horas de entrenamiento Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Precio por el almacenamiento mensual de cada modelo entrenado gpt-oss-20b 80,00 USD 0,09 USD 0,39 USD 1,95 USD
-
-
gpt-oss-safeguard 20b, 120b
-
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GPT OSS Safeguard 20B 0,07 USD 0,20 USD GPT OSS Safeguard 120B 0,15 USD 0,60 USD Regiones: Asia-Pacífico (Mumbai), América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GPT OSS Safeguard 20B 0,08 USD 0,24 USD GPT OSS Safeguard 120B 0,18 USD 0,71 USD Regiones: Europa (Irlanda) y Europa (Milán)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GPT OSS Safeguard 20B 0,08 USD 0,23 USD GPT OSS Safeguard 120B 0,18 USD 0,70 USD Región: Europa (Londres)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GPT OSS Safeguard 20B 0,11 USD 0,31 USD GPT OSS Safeguard 120B 0,23 USD 0,93 USD Región: Asia-Pacífico (Sídney)
Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GPT OSS Safeguard 20B 0,0721 USD 0,2060 USD GPT OSS Safeguard 120B 0,1545 USD 0,6180 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard
-
-
Qwen
-
Qwen
-
Qwen3 Coder, 32B, 235B
-
Qwen 3 Next, VL, Coder Next
-
Qwen3 Coder, 32B, 235B
-
-
Standard
-
Priority
-
Flex
-
Por lotes
-
Personalización de modelos
-
Standard
-
Región: Asia-Pacífico (Sídney)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Coder 30B A3B 0,1545 USD 0,6180 USD Qwen3 32B 0,1545 USD 0,6180 USD Qwen3 235B A22B 2507 0,2266 USD 0,9064 USD -
Priority
-
Región: Asia-Pacífico (Sídney)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Coder 30B A3B 0,2704 USD 1,0815 USD Qwen3 32B 0,2704 USD 1,0815 USD Qwen3 235B A22B 2507 0,3966 USD 1,5862 USD -
Flex
-
Región: Asia-Pacífico (Sídney)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD Qwen3 32B 0,0773 USD 0,3090 USD Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD -
Por lotes
-
Región: Asia-Pacífico (Sídney)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD Qwen3 32B 0,0773 USD 0,3090 USD Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD -
Personalización de modelos
-
Personalización de modelos
Precios de refinamiento de refuerzo
Con la capacidad de refinamiento de refuerzo de Amazon Bedrock, puede mejorar la precisión de los modelos sin necesidad de contar con una profunda experiencia en machine learning o grandes cantidades de datos etiquetados. Amazon Bedrock automatiza el flujo de trabajo de refinamiento de refuerzo: toma las peticiones de muestra, genera respuestas modelo y las puntúa mediante la función de recompensa. Estas peticiones, respuestas y puntuaciones se utilizan luego para entrenar su modelo mediante un flujo de trabajo de RFT iterativo.
Todo el flujo de trabajo de entrenamiento se factura por hora. Una vez finalizado el entrenamiento, los clientes pueden usar de inmediato el modelo refinado resultante para la inferencia bajo demanda. La opción de inferencia bajo demanda incluye un modelo de precios basado en tokens por el que se paga en función de la cantidad de tokens procesados durante la inferencia.
Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)
Modelos de Qwen Precio por horas de entrenamiento Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Precio por el almacenamiento mensual de cada modelo entrenado Qwen3 32B 80,00 USD 0,20 USD 0,78 USD 1,95 USD
-
-
Qwen 3 Next, VL, Coder Next
-
Precios bajo demanda
Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Next 80B A3B 0,15 USD 1,20 USD Qwen3 VL 235B A22B 0,53 USD 2,66 USD Qwen3 Coder Next 0,50 USD 1,20 USD Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Next 80B A3B 0,18 USD 1,41 USD Qwen3 VL 235B A22B 0,62 USD 3,13 USD Qwen3 Coder Next 0,60 USD 1,44 USD Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Next 80B A3B 0,18 USD 1,45 USD Qwen3 VL 235B A22B 0,64 USD 3,22 USD Qwen3 Coder Next 0,60 USD 1,44 USD Región: Europa (Londres)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Next 80B A3B 0,23 USD 1,86 USD Qwen3 VL 235B A22B 0,82 USD 4,12 USD Qwen3 Coder Next 0,78 USD 1,86 USD Regiones: Europa (Fráncfort) y Asia-Pacífico (Yakarta)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Coder Next 0,60 USD 1,44 USD Región: Asia-Pacífico (Sídney)
Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Qwen3 Next 80B A3B 0,1545 USD 1,2360 USD Qwen3 VL 235B A22B 0,5459 USD 2,7398 USD Qwen3 Coder Next 0,5150 USD 1,2360 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard
-
-
Stability AI
-
Stability AI
Precios bajo demanda
Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.
Región: Oregón, Norte de Virginia, Ohio
Servicios de imágenes de Stability AI Precio por generación para cada modelo Eliminar fondo en imágenes de Stable 0,07 USD Borrar objeto en imágenes de Stable 0,07 USD Control de estructura en imágenes de Stable 0,07 USD Control de boceto en imágenes de Stable 0,07 USD Guía de estilo de imágenes de Stable 0,07 USD Búsqueda y reemplazo de imágenes de Stable 0,07 USD Relleno de imágenes de Stable 0,07 USD Búsqueda y cambio de color de imágenes de Stable 0,07 USD Transferencia de estilos de imágenes de Stable 0,08 USD Ampliación conservadora de imágenes de Stable 0,40 USD Ampliación creativa de imágenes de Stable 0,60 USD Ampliación rápida de imágenes de Stable 0,03 USD Extensión de imágenes de Stable 0,06 USD -
TwelveLabs
-
TwelveLabs
Precios bajo demanda
-
Inferencia interregional global
-
Inferencia interregional geográfica y dentro de una región
-
Inferencia interregional global
-
-
Inferencia interregional geográfica y dentro de una región
-
-
-
Writer
-
Writer
Precios bajo demanda
Modelos de Writer Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Palmyra X4 2,50 USD 10,00 USD Palmyra X5 0,60 USD 6,00 USD -
Z AI
-
Z AI
-
GLM 5
-
GLM 4.7
-
GLM 4.7 Flash
-
GLM 5
-
Precios bajo demanda
Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 5 1,00 USD 3,20 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard -
GLM 4.7
-
Precios bajo demanda
Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 0,60 USD 2,20 USD Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), América del Sur (São Paulo) y Europa (Estocolmo)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 0,72 USD 2,64 USD Región: Asia-Pacífico (Sídney)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 0,6180 USD 2,2660 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard -
GLM 4.7 Flash
-
Precios bajo demanda
Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 Flash 0,07 USD 0,40 USD Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), Europa (Fráncfort), Europa (Irlanda), Europa (Milán), Europa (Estocolmo) y América del Sur (São Paulo)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 Flash 0,08 USD 0,48 USD Región: Europa (Londres)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 Flash 0,11 USD 0,62 USD Región: Asia-Pacífico (Sídney)
Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida GLM 4.7 Flash 0,0721 USD 0,4120 USD * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
* Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard
-
-
Importación de modelos personalizados
-
Importación de modelos personalizados
-
Llama
-
Llama multimodal
-
Mistral
-
Mixtral
-
Flan
-
Qwen
-
OpenAI
-
Llama
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,05718 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Región: Europa (Fráncfort)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,07144 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
-
Llama multimodal
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,05718 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Región: Europa (Fráncfort)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,07144 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
-
Mistral
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,05718 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Región: Europa (Fráncfort)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,07144 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
-
Mixtral
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,05718 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Región: Europa (Fráncfort)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,07144 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
-
Flan
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,05718 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Región: Europa (Fráncfort)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,07144 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
Precios de inferencia bajo demanda:
Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.
-
Qwen
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,05718 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Región: Europa (Fráncfort)
Versión de unidad modelo personalizada v1.0 Precio por unidad modelo personalizada por minuto* 0,07144 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
Precios de inferencia bajo demanda:
Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.
-
OpenAI
-
Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)
Versión de unidad de modelos personalizados v2.0 Precio por unidad de modelos personalizados por minuto* 0,1433 USD Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.
*Facturado en intervalos de 5 minutos
Precios de inferencia bajo demanda:
Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.
-
-
-
Bases de conocimiento
-
Recuperación de datos estructurados (generación de SQL)
La recuperación de datos estructurados se cobra por cada solicitud para generar una consulta SQL. La consulta SQL generada se usa para recuperar los datos de los almacenes de datos estructurados.
Modelos de Rerank
Los modelos de Rerank están diseñados para mejorar la relevancia y precisión de las respuestas en las aplicaciones de generación aumentada por recuperación (RAG). Se cobran por consulta.
**Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 512 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos. Una consulta equivale a una unidad de búsqueda.
-
Barreras de protección
-
Barreras de protección de Amazon Bedrock
El precio de Barreras de protección de Amazon Bedrock se basa en los cargos incurridos por el filtro usado en la barrera de protección. El precio es el mismo para el nivel estándar y el nivel clásico.
Filtro de las barreras de protección*
Precio
Filtros de contenido tanto para el nivel estándar como para el nivel clásico (contenido de texto) 0,15 USD por 1000 unidades de texto
Filtros de contenido (contenido de imágenes)
0,00075 USD por imagen procesada
Temas rechazados tanto para el nivel estándar como para el nivel clásico
0,15 USD por 1000 unidades de texto
Filtros de información confidencial
0,10 USD por 1000 unidades de texto
Filtros de información confidencial (expresión regular)
Gratis
Filtros de palabras
Gratis
Verificaciones de la base contextual
0,10 USD por 1000 unidades de texto
Verificaciones del razonamiento automatizado
0,17 USD por cada 1000 unidades de texto por política de razonamiento automatizado
Precios bajo demanda
* Cada filtro de barreras de protección es opcional y se puede activar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de filtro usado en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estos dos filtros, pero no habrá cargos asociados a los filtros de información confidencial.
Nota: Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.
-
Evaluación del modelo
-
Evaluación del modelo
La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos en la que aporta su propio flujo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.
Si utiliza la evaluación de RAG o LLM como juez en la evaluación del modelo, los tokens que utiliza el modelo juez se cobran en función de los precios de los niveles estándar bajo demanda. Las peticiones del juez se cobran como parte del uso de tokens y están disponibles en la documentación pública. La evaluación de RAG en una base de conocimientos de Bedrock también conlleva los cargos por uso habituales de Bases de conocimiento de Bedrock.
Modelo
Precio por cada 1000 tokens de entrada
Precio por cada 1000 tokens de salida
Precio por tarea humana
Modelo seleccionado para la evaluación
Basado en el modelo seleccionado
Basado en el modelo seleccionado
0,21 USD
-
Automatización de datos
-
Automatización de Datos
Automatización de Datos de Amazon Bedrock transforma contenido no estructurado y multimodal en formatos de datos estructurados, para casos de uso como el procesamiento inteligente de documentos, el análisis de video y la RAG. La Automatización de datos de Bedrock puede generar contenido de salida estándar con valores predeterminados específicos según la modalidad, como descripciones escena por escena de videos, transcripciones de audio o análisis automatizado de documentos. Además, los clientes pueden crear salidas personalizadas al especificar los requisitos de salida en esquemas basados en su propia estructura de datos, que luego se cargan fácilmente en una base de datos o almacén de datos existente. A través de su integración con Bases de conocimiento, Automatización de Datos de Bedrock también permite analizar contenido en aplicaciones de RAG, lo que mejora la precisión y la relevancia de los resultados al incorporar información incrustada tanto en imágenes como en texto.
Bases de conocimiento de Amazon Bedrock ofrece una integración de Automatización de Datos de Bedrock para proporcionar respuestas más relevantes y precisas para los datos multimodales. Al configurar una base de conocimientos, puede seleccionar Bedrock Data Automation como método de análisis para analizar y extraer información significativa de imágenes o documentos, que pueden incluir figuras, gráficos y diagramas. Durante el procesamiento, Bedrock Data Automation extrae información significativa de los documentos e imágenes ingeridos, que luego se utiliza en los pasos posteriores de la base de conocimientos para fragmentar, incrustar y almacenar. Cuando se integra con las bases de conocimiento, Automatización de Datos de Bedrock entrega y cobra por los resultados estandarizados.
-
Direccionamiento de peticiones inteligente
-
Punto de precio Dimensión de precios Plan de precios Direccionamiento de peticiones inteligente 1 USD por 1000 solicitudes Bajo demanda Direccionamiento de peticiones inteligente
El direccionamiento de peticiones inteligente le permite usar una combinación de modelos fundacionales (FM) de la misma familia de modelos para ayudar a optimizar la calidad y el costo. Por ejemplo, con la familia de modelos Claude de Anthropic, Amazon Bedrock puede enrutar de forma inteligente las peticiones entre Claude 3.5 Sonnet y Claude 3 Haiku, en función de la complejidad del mensaje. Del mismo modo, Amazon Bedrock puede enrutar solicitudes entre Meta Llama 3.3 70B y 3.18B, y Nova Pro y Nova Lite. El direccionamiento de peticiones predice qué modelo proporcionará el mejor rendimiento para cada solicitud y, al mismo tiempo, ayuda a optimizar la calidad de la respuesta y el costo. Esto es particularmente útil para aplicaciones como los asistentes de servicio al cliente, donde las consultas sencillas se pueden gestionar mediante modelos más pequeños, rápidos y rentables, y las consultas complejas se dirigen a modelos más capaces. El direccionamiento de peticiones inteligente puede reducir los costos hasta en un 30 % sin comprometer la precisión.
-
Optimización de peticiones
-
Optimización de peticiones para Amazon Bedrock
Se le cobra en función del número de tokens en las peticiones de entrada y en las peticiones optimizadas.
Todos los cargos se facturan mensualmente a partir del 23 de abril de 2025.
Precio por cada 1000 tokens 0,030 USD
Ejemplos de precios
-
AI21 Labs
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD
-
Amazon
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.
Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD
Precios de la personalización (ajuste preciso y entrenamiento previo continuo)
Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.
Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.
Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD
Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.
Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD
-
Barreras de protección de Amazon Bedrock
Ejemplo 1: chatbot de atención al cliente
Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.
El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.
Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.
Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.
Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto
Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USDEjemplo 2: resumen de la transcripción del centro de llamadas
Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.
Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.
Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USDEjemplo 3: Motor de verificación de protocolos médicos
Una empresa de tecnología sanitaria implementa verificaciones de razonamiento automatizado en su sistema de apoyo a la toma de decisiones clínicas para validar las sugerencias de tratamiento según las directrices médicas.El sistema procesa 5000 casos de pacientes al mes. Cada caso implica:
- Resumen de datos del paciente: 500 caracteres (1 unidad de texto)
- Evaluación diagnóstica: 2000 caracteres (2 unidades de texto)
- Recomendación de tratamiento: 4500 caracteres (5 unidades de texto)
Unidades de texto procesadas por mes = (1 + 2 + 5) 5000 casos = 40 000 unidades de texto
Costo total incurrido por mes para las verificaciones de razonamiento automatizado = 40 000 (0,17 USD)/1000 = 6,80 USD -
Bases de conocimiento de Amazon Bedrock
Ejemplo de precios 1 (cambio de clasificación mediante el modelo Amazon Rerank 1.0)
En un mes determinado, realiza 2 millones de solicitudes a la API de Rerank con el modelo Amazon Rerank 1.0; 1 millón de solicitudes contienen menos de 100 documentos cada una y, por lo tanto, se cobrará una solicitud por cada una. El millón de solicitudes restantes contienen entre 120 y 150 documentos y, por lo tanto, a cada solicitud se le cobrarán 2 solicitudes.
Precio de una solicitud = 0,001 USD
Costo total = 1,000,000 USD × 0.001 + 1,000,000 USD × 2 = 0.001 USD = 3000 USDEjemplo de precios 2: (Recuperación de datos estructurados)
Un desarrollador de aplicaciones crea un chatbot de soporte que consulta los datos estructurados almacenados en Amazon Redshift. El desarrollador crea una base de conocimientos de Bedrock y se conecta a Amazon Redshift. El chatbot atiende 10000 consultas de usuarios por hora. Cada consulta de usuario costará 0,002 USD por API de GenerateQuery para generar SQL a partir de la consulta del usuario.
Costo total incurrido para generar SQL por hora = 0,002 USD*10000 = 20 USD.
Costo total incurrido en el mes = 20 USD*24 USD*30 USD = 1440 USD -
Anthropic
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.
Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):
Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
-
Cohere
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.
Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD
Precios de la personalización (ajuste preciso)
Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.
Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD
El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.
Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD
-
Importación de modelos personalizados
Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.
La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un periodo de 5 minutos, el intervalo se considerará activa para la facturación. Si hay una invocación a las 8:03 a. m. y no hay más invocaciones después de las 8:07 a. m., la medición se detendrá a las 8:07 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 1 intervalo de cinco minutos = 0,785 USD.
-
Automatización de datos
Ejemplo de precios 1:
Supongamos que procesa un documento de 1000 páginas con BDA Custom Output. Las 1000 páginas se procesan mediante el esquema 1, que tiene 15 campos. El precio por página de cualquier esquema con 30 campos o menos es de 0,040 USD. El costo total sería de 40 USD.
Total de páginas procesadas = 1000
Precio por página para esquemas con menos de 30 campos = 0,040 USD
Costo total = 1000 × 0.040 USD = 40 USDEjemplo de precios 2:
Supongamos que procesa 2 documentos con BDA Custom Output. El documento 1 tiene 40 páginas y se procesa con el esquema 1, que tiene 20 campos. El documento 2 tiene 10 páginas y se procesa con el esquema 2, que tiene 40 campos. El precio por página del esquema 1 es de 0,040 USD, ya que contiene 30 campos o menos. El precio por página del esquema 2 es de 0,045 USD. El costo de procesamiento del documento 1 con el esquema 1 es de 1,60 USD. El costo de procesamiento del documento 2 con el esquema 2 es de 0,45 USD. El costo total de procesar ambos documentos sería de 2,05 USD.
Total de páginas procesadas = 50
Precio por página para el esquema 1 con menos de 30 campos = 0,040 USD
Precio por página para el esquema 2 con 40 campos = 0,040 USD + (número de campos adicionales superiores a 30 *0,0005 USD por campo)
Número de campos adicionales por encima de 30 = 40 - 30 = 10
Precio por página para el esquema 2 con 40 campos = 0,040 USD + (10 *0,0005 USD por campo) = 0,045 USD
Cargo por el documento 1 con el esquema 1 = 40 páginas x 0,040 USD por página = 1,6 USD
Cargo por el documento 2 con el esquema 2 = 10 páginas x 0,045 USD por página = 0,45 USD
Cargo total = cargo por el documento 1 + cargo por el documento 2 = 1,6 USD + 0,45 USD = 2,05 USDEjemplo 3 de precios.
Supongamos que configura las bases de conocimiento de Bedrock para usar Bedrock Data Automation como analizador y, a continuación, ingiere un documento de 1000 páginas. Tenga en cuenta que las estructuras de costos difieren entre las opciones de análisis de las bases de conocimiento. BDA usa precios por página, mientras que los analizadores de Foundational Model cobran en función de los tokens de entrada y salida. Para dar contexto, el procesamiento de 1000 páginas, de las que el 30 % contiene tablas y el 30 % contiene figuras, normalmente requiere 2900 tokens de entrada y 750 tokens de salida. El consumo de tokens varía según el tipo de contenido, por lo que se recomienda a los clientes que prueben con sus propios datos para obtener estimaciones más precisas. La integración de las bases de conocimiento de Bedrock y Bedrock Data Automation utiliza una salida estándar, donde precio por página es 0,010 USD. El costo total sería de 10 USD.Total de páginas procesadas = 1000
Precio por página para la salida estándar = 0,010 USD
Costo total = 1000 x 0,010 USD = 10 USDEjemplo de precios 4:
Supongamos que procesa un video de 60 minutos con la salida estándar BDA. El precio por minuto de la salida estándar de video es de 0,050 USD. El costo total sería de 3.00 USD.
Total de minutos procesados = 60
Precio por minuto para la salida estándar de video = 0,050 USD
Costo total = 60 × 0,050 USD = 3,00 USDEjemplo de precios 5:
Supongamos que procesa 2000 imágenes con BDA Custom Output. Las primeras 1000 imágenes se procesan con el esquema 1, que tiene 10 campos. Las últimas 1000 páginas se procesan con el esquema 2, que tiene 40 campos. El precio por imagen del esquema 1 es de 0,005 USD, ya que contiene 30 campos o menos. El precio por imagen del esquema 2 es de 0,01 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 1 es de 5,00 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 2 es de 10,00 USD. El costo total de procesar las 2000 imágenes sería de 15,00 USD
Costo de las primeras 1000 imágenes = 1000 imágenes* 0,005 USD por imagen = 5,00 USD
Costo de 1000 imágenes secundarias = 1000 imágenes * (0,005 USD + [número de campos adicionales superiores a 30 x 0,0005 USD por campo])
= 1000 x (0,005 USD + ([40-30] x 0,0005 USD))
= 1000 x (0,005 USD + [10 x 0,0005 USD]) = 10,00 USD
Costo total = 5,00 USD + 10,00 USD = 15,00 USDEjemplo de precios 6:
Supongamos que desea utilizar Bedrock Data Automation Standard Output para procesar 15 000 minutos de grabaciones de audio de reuniones en su organización. El costo total de procesar los 15 000 minutos de audio sería de 90 USD.
Total de minutos procesados = 15 000 minutos
Carga total = 15 000 minutos × 0,006 USD = 90 USD -
DeepSeek
Precios bajo demanda
Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo DeepSeek-R1 para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens (incluidos los tokens de razonamiento):
Costo total por hora = 2000 tokens/1000 * 0,00135 USD + 1000 tokens/1000 * 0,0054 USD = 0,0081 USD
-
Flujos
Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea un flujo para automatizar el resumen de noticias para los comerciantes. El flujo incluye un nodo de entrada que ocupa una ubicación de S3 y un nodo de recuperación de S3 que recupera 10 archivos que incluyen artículos de 10 de las principales agencias de noticias de S3 (transiciones de 2 nodos). A continuación, utiliza un nodo iterador para invocar un modelo con un nodo de petición para resumir cada archivo (+ 10 archivos x 2 transiciones de nodos). A continuación, recopila todos los resultados mediante un nodo recopilador, escribe los resultados en S3 mediante el nodo de almacenamiento de S3 y los completa en un nodo de salida (+ 3 transiciones de nodo). El desarrollador ejecuta este flujo cada media hora de cada día de la semana.La cantidad de transiciones de nodo por ejecución de flujo es: 2+1+10*2 + 3 = 25 transiciones de nodo/ejecución de flujo
La cantidad de ejecuciones de flujo por mes es: 24 horas *2* 5 días * 4 semanas = 960 ejecuciones de flujo/mes.
La factura mensual total es: 25 * 960 * 0,035 USD/1000 = 0,84 USD
Cargos adicionales
La factura también incluirá cargos adicionales por los servicios de AWS que se utilicen en la ejecución del flujo de trabajo, incluidos los usos de Amazon S3 en los nodos de recuperación y almacenamiento, y el uso del modelo fundacional de Amazon Bedrock en el nodo de petición. -
Meta
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.
Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD
Precios de la personalización (ajuste preciso)
Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.
Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD
El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.
Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD
-
Mistral AI
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD
Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.
Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD
-
Evaluación del modelo
Ejemplo 1 de evaluación del modelo:
Precios bajo demanda
Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).
Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.
Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tareas humanas 50 0,21 USD 10,50 USD 10,50 USD Total 11,06 USD Ejemplo 2 de evaluación del modelo:
Precios bajo demanda
Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).
El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).
Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.
Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total Inferencia de Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD 0,04 USD Inferencia de Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD 0,52 USD Tareas humanas 100 0,21 USD 21,00 USD 21,00 USD Total 21,56 USD -
Optimización de peticiones
Ejemplo: resumen de noticias
Un desarrollador de aplicaciones crea una petición para resumir las noticias para los operadores que usan Claude 3.5. La petición original incluye 429 tokens. La petición optimizada tiene 511 tokens e incluye instrucciones y ejemplos más específicos para que los modelos fundacionales generen respuestas más concisas. Usa la petición optimizada con 511 tokens como entrada para el optimizador de peticiones y crea 2 variantes nuevas para Claude 3.7 y Nova Pro con 582 y 579 tokens.La cantidad total de tokens de entrada y salida para la optimización de peticiones es: 429 + 511 + 511 + 582 + 511 + 579 = 3123
La factura mensual total es: 3123 / 1000 * 0,03 USD = 0,09 USD
-
Stability AI
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).
Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).
Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD
Precios del rendimiento aprovisionado
Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.
Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD
-
TwelveLabs
Precios bajo demanda
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Pegasus 1.2 para describir lo que implica un video de 10 segundos de duración, que proporciona una salida de 2000 tokens.
Costo total incurrido = 10 segundos * 0,00049 USD + 2000 tokens / 1000 * 0,0075 = USD = 0,0199 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed [3.0 o 2.7] para incrustar 10 vídeos, con una duración combinada de 100 minutos.Coste total incurrido = 100 minutos (es decir, 6000 segundos) * 0,00070 USD = 4,2 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed 3.0 para que, al proporcionar un texto y una imagen juntos, genere una incrustación que pueda usar para encontrar el clip que tiene la bolsa que se muestra en la imagen dada, en el repositorio de incrustaciones que habría creado con el ejemplo anterior.Coste total incurrido = 1 solicitud de texto * 0,00007 USD +1 solicitud de imagen * 0,0001 USD = 0,00017 USD
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed [3.0 o 2.7] para proporcionar un texto para generar una incrustación que pueda usar para encontrar clips coincidentes en el repositorio de incrustaciones que habría creado con el ejemplo anterior.Coste total incurrido = 1 solicitud de texto * 0,00007 = 0,00007 USD
-
Escritor
Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Palmyra X5 de Writer para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.
Costo total incurrido = 10 000 tokens/1000 * 0,003 USD + 2000 tokens/1000 * 0,015 USD = 0,06 USD