Precios de Amazon Bedrock

Información general sobre precios

Amazon Bedrock es un servicio totalmente administrado que ofrece una selección de modelos fundacionales (FM) de alto rendimiento a través de una única API, junto con un amplio conjunto de funcionalidades que necesita para crear aplicaciones de IA generativa con seguridad, privacidad e IA responsable.

Con Amazon Bedrock, se le cobrará por la inferencia y personalización del modelo. Puede elegir entre dos precios de planes a modo de inferencia: 1. Bajo demanda y por lotes: este modo le permite usar FM con la modalidad de pago por uso sin compromisos temporales. 2. Rendimiento aprovisionado: este modo le permite aprovisionar un rendimiento suficiente para cumplir con los requisitos de rendimiento de su aplicación a cambio de un compromiso temporal.

Modelos de precios

Bajo demanda

Con el modo bajo demanda, solo paga por lo que utiliza, sin compromisos de plazo basados en el tiempo. En el caso de los modelos de generación de texto, se le cobra por cada token de entrada procesado y por cada token de salida generado. En el caso de los modelos de incrustación, se le cobra por cada token de entrada procesado. Un token está compuesto de unos pocos caracteres y se refiere a la unidad básica de texto que un modelo aprende para entender la entrada y el mensaje del usuario. En el caso de los modelos de generación de imágenes, se le cobra por cada imagen generada.

Por lotes

Con el modo por lotes, puede proporcionar un conjunto de solicitudes como un único archivo de entrada y recibir respuestas como un único archivo de salida, lo que le permite obtener predicciones simultáneas a gran escala. Las respuestas se procesan y almacenan en su bucket de Amazon S3 para que pueda acceder a ellas más adelante. El precio del modo por lotes es igual al del modo bajo demanda.

Rendimiento aprovisionado

Con el modo de rendimiento aprovisionado, puede comprar unidades de modelo para un modelo base o personalizado específico. El modo de rendimiento aprovisionado se ha diseñado principalmente para grandes cargas de trabajo de inferencia consistentes que necesitan un rendimiento garantizado. Solo se puede acceder a los modelos personalizados mediante el rendimiento aprovisionado. Una unidad de modelo proporciona un rendimiento determinado, que se mide por la cantidad máxima de tokens de entrada o salida procesados por minuto. Con el rendimiento aprovisionado, se le cobra por hora y tiene la flexibilidad de elegir entre plazos de compromiso de 1 o 6 meses.

Personalización de modelos

Con Amazon Bedrock, puede personalizar los FM con sus datos para ofrecer respuestas personalizadas a tareas específicas y su contexto empresarial. Puede ajustar de forma precisa los modelos con datos etiquetados o utilizar un entrenamiento previo continuo con datos sin etiquetar. Para personalizar un modelo de generación de texto, se le cobra por el entrenamiento del modelo en función de la cantidad total de tokens procesados por el modelo (la cantidad de tokens en el corpus de datos de entrenamiento × por la cantidad de épocas) y el almacenamiento del modelo se cobra por mes por modelo. Una época es un ciclo completo a través de su conjunto de datos de entrenamiento durante el ajuste de precisión o el entrenamiento previo continuo. Las inferencias que utilizan modelos personalizados se cobran en función del plan de rendimiento aprovisionado y requieren que compre este plan. Una unidad de modelo se encuentra disponible sin plazo de compromiso para su inferencia en un modelo personalizado. Se le cobrará por la cantidad de horas que utilice en la primera unidad de modelo para la inferencia de modelos personalizados. Si desea aumentar su rendimiento más allá de una unidad de modelo, debe adquirir un plazo de compromiso de 1 o 6 meses.

Evaluación de modelos

Con la evaluación de modelos en Amazon Bedrock, paga por lo que usa, sin compromisos de volumen en cuanto al número de solicitudes o respuestas. En el caso de la evaluación automática, solo paga por la inferencia del modelo que haya elegido en la evaluación. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos a la que lleve a su propio equipo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada. Una tarea humana se define como la instancia en la que un trabajador humano envía una evaluación de una sola solicitud y las respuestas de inferencia asociadas en la interfaz de usuario de la evaluación humana. El precio es el mismo sin importar si tiene uno o dos modelos en el trabajo de evaluación; también es el mismo sin importar el número de métricas de la evaluación y los métodos de calificación que incluya. Los cargos por las tareas humanas aparecerán en la sección Amazon SageMaker de su factura de AWS y son los mismos para todas las regiones de AWS. No hay ningún cargo adicional por el personal, ya que lo suministra usted. En el caso de una evaluación administrada por AWS, los precios varían según las necesidades de evaluación en un contrato privado mientras trabaja con el equipo de evaluaciones de expertos de AWS.

Herramientas potentes para crear sin costo adicional

Cuando utilice los agentes y las bases de conocimiento para Amazon Bedrock, solo se le cobrarán los modelos y las bases de datos vectoriales que utilice con estas funciones.

Desglose de precios

El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

AI21 Labs

Precios bajo demanda y por lotes

Modelos de AI21 Labs Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Jurassic-2 Mid

0,0125 USD

0,0125 USD

Jurassic-2 Ultra

0,0188 USD

0,0188 USD

Amazon

Región

Anthropic

Precios bajo demanda y por lotes

Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0 y 2.1

0,008 USD

0,024 USD

Claude 3 Opus*

0,015 USD

0,075 USD

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

*Actualmente, Claude 3 Opus se encuentra disponible en la región Oeste de EE. UU. (Oregón).

Región: Asia-Pacífico (Sídney)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Región: Europa (París)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude 3 Sonnet

0,003 USD

0,015 USD

Claude 3 Haiku

0,00025 USD

0,00125 USD

Región: Asia-Pacífico (Tokio)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0 y 2.1

0,008 USD

0,024 USD

Región: Europa (Fráncfort)

Modelos de Anthropic Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Claude Instant

0,0008 USD

0,0024 USD

Claude 2.0 y 2.1

0,008 USD

0,024 USD

Precios del rendimiento aprovisionado

Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

Modelos de Anthropic Precio por hora y modelo
sin compromiso
Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0 y 2.1

70,00 USD

63,00 USD

35,00 USD

Modelos de Anthropic Precio por hora y modelo
sin compromiso
Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

44,00 USD

39,60 USD

22,00 USD

Claude 2.0 y 2.1

70,00 USD

63,00 USD

35,00 USD

Región: Asia-Pacífico (Tokio)

Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

53,00 USD

29,00 USD

Claude 2.0/2.1

86,00 USD

48,00 USD

Región: Europa (Fráncfort)

Modelos de Anthropic Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Claude Instant

49,00 USD

27,00 USD

Claude 2.0/2.1

79,00 USD

44,00 USD

Póngase en contacto con su equipo de cuentas de AWS para obtener más información sobre las unidades de modelo. 

Cohere

Precios bajo demanda y por lotes

Modelos de Cohere Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida
Command 0,0015 USD 0,0020 USD
Command-Light 0,0003 USD 0,0006 USD
Command R+ 0,0030 USD 0,0150 USD
Command R 0,0005 USD 0,0015 USD
Embed: inglés 0,0001 USD N/D
Embed: multilingüe 0,0001 USD N/D

Precios por la personalización (ajuste preciso)

Modelos de Cohere Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado Precio a deducir de un modelo personalizado por unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

Cohere Command

0,004 USD

1,95 USD

49,50 USD

Cohere Command-Light 0,001 USD

1,95 USD

8,56 USD

* El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

Precios del rendimiento aprovisionado

Modelos de Cohere Precio por hora y modelo 
sin compromiso
Precio por hora por unidad de modelo con un compromiso de 1 mes

Precio por hora por unidad de modelo con un compromiso de 6 mes

Cohere Command

49,50 USD

39,60 USD

23,77 USD

Cohere Command: Light 8,56 USD

6,85 USD

4,11 USD
Embed: inglés 7,12 USD

6,76 USD

6,41 USD
Embed: multilingüe 7,12 USD

6,76 USD

6,41 USD

Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo. 

Meta Llama

Precios bajo demanda y por lotes 

Modelos de Meta Precio por cada 1000 tokens de entrada Precio por cada 1000 tokens de salida

Llama 2 Chat (13B)

0,00075 USD

0,001 USD

Llama 2 Chat (70B)

0,00195 USD

0,00256 USD
Llama 3 Instruct (8B)

0,0004 USD

0,0006 USD
Llama 3 Instruct (70B)

0,00265 USD

0,0035 USD

Precios por la personalización del modelo (ajuste preciso)

Modelos de Meta Precio por entrenar 1000 tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

Llama 2 Pretrained (13B)

0,00149 USD

1,95 USD

23,50 USD

Llama 2 Pretrained (70B)

0,00799 USD

1,95 USD 23,50 USD

* Almacenamiento de modelo personalizado = 1,95 USD

Precios del rendimiento aprovisionado

Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

Llama 2 Pretrained y Chat (13B)

21,18 USD

13,08 USD

Llama 2 Pretrained (70B)

21,18 USD

13,08 USD

* Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización. 

Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

Mistral AI

Región
Región

Stability AI

Precios bajo demanda y por lotes

Los modelos de imagen que ofrece Stability AI tienen un precio por imagen, en función del recuento de pasos y la resolución de la imagen

Modelo de Stability AI Resolución de imagen Precio por imagen generada de calidad estándar (<=50 pasos) Precio por imagen generada de calidad premium (>50 pasos)

 

SDXL 0.8

512 x 512 o más pequeño

0,018 USD por imagen

0,036 USD por imagen

Más de 512 x 512

0,036 USD por imagen

0,072 USD por imagen

SDXL 1.0

Hasta 1024 x 1024

0,04 USD 0,08 USD

Precios del rendimiento aprovisionado

Modelo de Stability AI Precio por hora por unidad de modelo con un compromiso de 1 mes* Precio por hora por unidad de modelo con un compromiso de 6 mes*

SDXL 1.0

49,86 USD

46,18 USD

*Incluye inferencia para modelos básicos y personalizados

Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

Actualmente, la personalización del modelo (ajuste preciso) no es compatible con los modelos de Stability AI en Amazon Bedrock.

Barreras de protección para Amazon Bedrock

Precios bajo demanda

Política de barreras de protección* Precio por 1000 unidades de texto**

Filtros de contenido

0,75 USD

Temas denegados

1 USD

Filtro de información confidencial (PII)

0,10 USD

Filtro de información confidencial (expresión regular)  Gratis
Filtros de palabras

Gratis

* Cada política de barreras de protección es opcional y se puede habilitar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de política utilizada en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estas dos políticas, pero no habrá cargos asociados a los filtros de información confidencial.

** Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.


Las barreras de protección no son compatibles con imágenes e incrustaciones.

Ejemplos de precios

  • Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

    Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD

    Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

    Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

    Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.

    Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

    Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.

    Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

    Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD

    Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens. 

    Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.

    Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD

  • Ejemplo 1 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).

    Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Ejemplo 2 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).

    Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Ejemplo 1: chatbot de atención al cliente
    Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.

    El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.

    Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.

    Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.

    Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto

    Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,75 USD + 1,00 USD) / 1000 = 5,25 USD

     

    Ejemplo 2: resumen de la transcripción del centro de llamadas
    Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.

    Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.

    Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USD

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD