Precios de Amazon Bedrock

Información general sobre precios

Amazon Bedrock es un servicio totalmente gestionado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento a través de una única API, junto con un amplio conjunto de capacidades que usted necesita para crear aplicaciones de IA generativas, lo que simplifica el desarrollo con seguridad, privacidad e IA responsable.

Con Amazon Bedrock, se le cobrará por la inferencia y personalización del modelo. Puedes elegir entre dos planes de precios para inferencia: 1/ Bajo demanda y por lotes: este modo te permite usar FM con la modalidad de pago por uso sin compromisos temporales. 2/ Rendimiento aprovisionado: este modo le permite aprovisionar un rendimiento suficiente para cumplir con los requisitos de rendimiento de su aplicación a cambio de un compromiso temporal.

Modelos de precios

Bajo demanda

Con el modo bajo demanda, solo paga por lo que utiliza, sin compromisos de plazo basados en el tiempo. En el caso de los modelos de generación de texto, se le cobra por cada token de entrada procesado y por cada token de salida generado. En el caso de los modelos de incrustación, se le cobra por cada token de entrada procesado. Un token se compone de unos pocos caracteres y se refiere a la unidad básica de texto que un modelo aprende para entender la entrada y el mensaje del usuario. En el caso de los modelos de generación de imágenes, se le cobra por cada imagen generada.

Por lotes

Con el modo por lotes, puede proporcionar un conjunto de solicitudes como un único archivo de entrada y recibir respuestas como un único archivo de salida, lo que le permite obtener predicciones simultáneas a gran escala. Las respuestas se procesan y almacenan en su bucket de Amazon S3 para que pueda acceder a ellas más adelante. El precio del modo por lotes es igual al del modo bajo demanda.

Rendimiento aprovisionado

Con el modo de rendimiento aprovisionado, puede comprar unidades de modelo para un modelo base o personalizado específico. El modo de rendimiento aprovisionado se ha diseñado principalmente para grandes cargas de trabajo de inferencia consistentes que necesitan un rendimiento garantizado. Solo se puede acceder a los modelos personalizados mediante el rendimiento aprovisionado. Una unidad de modelo proporciona un rendimiento determinado, que se mide por la cantidad máxima de tokens de entrada o salida procesados por minuto. Con el rendimiento aprovisionado, se le cobra por hora y tiene la flexibilidad de elegir entre plazos de compromiso de 1 o 6 meses.

Personalización de modelos

Con Amazon Bedrock, puede personalizar las FM con sus datos para ofrecer respuestas personalizadas a tareas específicas y su contexto empresarial. Puede ajustar de forma precisa los modelos con datos etiquetados o utilizar un entrenamiento previo continuo con datos sin etiquetar. Para personalizar un modelo de generación de texto, se le cobra por el entrenamiento del modelo en función de la cantidad total de tokens procesados por el modelo (la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas) y el almacenamiento del modelo se cobra por mes por modelo. Una época es un ciclo completo a través de su conjunto de datos de entrenamiento durante el ajuste de precisión o el entrenamiento previo continuo. Las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que compre este plan. Una unidad de modelo se encuentra disponible sin plazo de compromiso para su inferencia en un modelo personalizado. Se le cobrará por la cantidad de horas que dure la primera unidad de modelo que utilice para la inferencia de modelos personalizados. Si desea aumentar su rendimiento más allá de una unidad de modelo, debe adquirir un plazo de compromiso de 1 o 6 meses.

Herramientas potentes para crear sin costo adicional

Cuando utilice los agentes y las bases de conocimiento para Amazon Bedrock, solo se le cobrarán los modelos y las bases de datos vectoriales que utilice con estas funciones.

Desglose de precios

El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

AI21 Labs

Precios bajo demanda y por lotes

Modelos de AI21 Labs Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic-2 Ultra

0,0188 USD

0,0188 USD

Actualmente, la personalización del modelo (ajuste preciso) y el rendimiento aprovisionado no son compatibles con los modelos de AI21 Labs en Amazon Bedrock.

Amazon

Región

Anthropic

Precios bajo demanda y por lotes

Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude Instant

0,00080 USD

0,00240 USD

Claude 2.0/2.1

0,00800 USD

0,02400 USD

Claude 3 Sonnet

0,00300 USD

0,01500 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Región: Asia-Pacífico (Tokio)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude Instant

0,00080 USD

0,00240 USD

Claude 2.0/2.1

0,00800 USD

0,02400 USD

Región: Europa (Fráncfort)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude Instant

0,00080 USD

0,00240 USD

Claude 2.0/2.1

0,00800 USD

0,02400 USD

Precios del rendimiento aprovisionado:

Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Modelos de Anthropic Precio por hora y modelo
sin compromiso
Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0 y 2.1

70,00 USD

63,00 USD

35,00 USD

Modelos de Anthropic Precio por hora y modelo
sin compromiso
Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0 y 2.1

70,00 USD

63,00 USD

35,00 USD

Claude 3 Sonnet

88,00 USD

80,00 USD

44,00 USD

Claude 3 Haiku

88,00 USD

80,00 USD

44,00 USD

Región: Asia-Pacífico (Tokio)

Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

53,00 USD

29,00 USD

Claude 2.0/2.1

86,00 USD

48,00 USD

Región: Europa (Fráncfort)

Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

49,00 USD

27,00 USD

Claude 2.0/2.1

79,00 USD

44,00 USD

Póngase en contacto con su equipo de cuentas de AWS para obtener más información sobre las unidades de modelo. 

Cohere

Precios bajo demanda y por lotes

Modelos de Cohere Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
Command 0,0015 USD 0,0020 USD
Command-Light 0,0003 USD 0,0006 USD
Embed: inglés 0,0001 USD N/D
Embed: miltilingüe 0,0001 USD N/D

Precios por la personalización (ajuste preciso)

Modelos de Cohere Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado Precio a deducir de un modelo personalizado por unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

Cohere Command

0,004 USD

1,95 USD

49,50 USD

Cohere Command-Light 0,001 USD

1,95 USD

8,56 USD

* El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

Precios del rendimiento aprovisionado:

Modelos de Cohere Precio por hora y modelo 
sin compromiso
Precio por hora por unidad de modelo con un compromiso de 1 mes

Precio por hora por unidad de modelo con un compromiso de 6 mes

Cohere Command

49,50 USD

39,60 USD

23,77 USD

Cohere Command-Light 8,56 USD

6,85 USD

4,11 USD
Embed: inglés 7,12 USD

6,76 USD

6,41 USD
Embed: multilingüe 7,12 USD

6,76 USD

6,41 USD

Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo. 

Meta Llama 2

Precios bajo demanda y por lotes 

Modelos de Meta Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Llama 2 Chat (13B)

0,00075 USD

0,00100 USD

Llama 2 Chat (70B)

0,00195 USD

0,00256 USD

Precios por la personalización del modelo (ajuste preciso)

Modelos de Meta Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio a deducir de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

Llama 2 Pre-trained (13B)

0,00149 USD

1,95 USD

23,50 USD

Llama 2 Pre-trained (70B)

0,00799 USD

1,95 USD 23,50 USD

* Almacenamiento de modelo personalizado = 1,95 USD

Precios del rendimiento aprovisionado:

Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Llama 2 Pre-trained y Chat (13B)

21,18 USD

13,08 USD

Llama 2 Pre-trained (70B)

21,18 USD

13,08 USD

* Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización. 

Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

Mistral AI

Precios bajo demanda. Regiones: Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón)

Modelo de Mistral AI Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
Mistral 7B

0,00015 USD

0,0002 USD

Mixtral 8*7B

0,00045 USD

0,0007 USD
Mistral Large 0,008 USD 0,024 USD

Precios bajo demanda. Regiones: Europa (París)

Modelo de Mistral AI Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
Mistral 7B

0,0002 USD

0,00026 USD

Mixtral 8*7B

0,00059 USD

0,00091 USD
Mistral Large 0,0104 USD 0,0312 USD

Precios bajo demanda. Regiones: Asia-Pacífico (Sídney) 

Modelo de Mistral AI Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
Mistral 7B

0,00017 USD

0,00023 USD

Mixtral 8*7B

0,00051 USD

0,0008 USD
Región

Stability AI

Precios bajo demanda y por lotes

Los modelos de imagen que ofrece Stability AI tienen un precio por imagen, en función del recuento de pasos y la resolución de la imagen:

Modelo de Stability AI Resolución de imagen Precio por imagen generada de calidad estándar (<=50 pasos) Precio por imagen generada de calidad premium (>50 pasos)

 

SDXL 0.8

512 x 512 o más pequeño

0,018 USD por imagen

0,036 USD por imagen

Más de 512 x 512

0,036 USD por imagen

0,072 USD por imagen

SDXL 1.0

Hasta 1024 x 1024

0,04 USD 0,08 USD

Precios del rendimiento aprovisionado:

Modelo de Stability AI Precio por hora por unidad de modelo con un compromiso de 1 mes* Precio por hora por unidad de modelo con un compromiso de 6 mes*

SDXL 1.0

49,86 USD

46,18 USD

* Incluye inferencia para modelos básicos y personalizados.

Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

Actualmente, la personalización del modelo (ajuste preciso) no es compatible con los modelos de Stability AI en Amazon Bedrock.

Ejemplos de precios

  • Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

    El costo total incurrido es:10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text - Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    El costo total por hora es: 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD.

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base del Generador de imágenes de Titan para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

    El costo total incurrido es: 1000 imágenes * 0,01 USD por imagen = 10 USD

    Precios de la personalización (ajuste y entrenamiento previo continuo)

    Un desarrollador de aplicaciones personaliza un modelo de generación de imágenes de Titan con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante una hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante un mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    El costo mensual incurrido para realizar el ajuste preciso es: el entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + el almacenamiento mensual de los modelos personalizados (1,95 USD) + una hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 USD = 182,95 USD.

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra dos unidades de modelo de Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    El costo total mensual incurrido es: 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

    Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico del Generador de imágenes de Titan con un compromiso de 1 mes.

    El costo total incurrido es: 1 * 16,20 USD * 24 horas * 31 días = 12 052,80 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

    El costo total incurrido es:11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

    El costo total mensual incurrido es: 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    El costo total incurrido es: 6000 tokens/1000 * 0,00150 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command-Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    El costo total incurrido es: 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed, en inglés o multilingüe, de Cohere para generar incrustaciones para 10 000 tokens de entrada.

    El costo total incurrido es: 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante una hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante un mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    El costo mensual incurrido para realizar el ajuste preciso es: el entrenamiento del ajuste preciso (0,004 USD * 1000) + el almacenamiento mensual de los modelos personalizados (1,95 USD) + una hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

    El costo mensual incurrido por el rendimiento aprovisionado (compromiso de 1 mes) del modelo personalizado es de 39,60 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad modelo de Cohere Command con un compromiso de 1 mes para su caso de uso de resumen de texto.

    El costo total mensual incurrido es: 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

    El costo total incurrido es: 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pre-Trained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante una hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante un mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    El costo mensual incurrido para realizar el ajuste preciso es: el entrenamiento del ajuste preciso (0,00799 USD * 1000) + el almacenamiento mensual de los modelos personalizados (1,95 USD) + una hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

    El costo mensual incurrido por el rendimiento aprovisionado (compromiso de 1 mes) del modelo personalizado es de 21,18 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    El costo total mensual incurrido es: 1 unidad de modelo * 21,20 USD * 24 horas * 31 días = 15 772,8 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    El costo total por hora es: 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD.

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    El costo total por hora es: 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD.

    Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens. 

    El costo total por hora es: 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD.

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium)

    El costo total incurrido es: 1 imagen * 0,036 USD por imagen = 0,036 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium)

    El costo total incurrido es: 1 imagen * 0,08 USD por imagen = 0,08 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de SDXL1.0 con un compromiso de 1 mes.

    El costo total en el que se incurre es: 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD