Amazon Bedrock

  • Precios de los modelos
  • Precios de los modelos

    El precio depende de la modalidad, el proveedor y el modelo. Seleccione el proveedor del modelo para ver los precios detallados.

    Amazon Bedrock admite una variedad de niveles, tales como Standard, Flex, Priority y Reserved. Haga clic para obtener más información sobre los niveles de servicio.

    Amazon Bedrock ofrece modelos fundacionales (FM) exclusivos de los principales proveedores de inteligencia artificial, como Anthropic, Meta, Mistral AI y Amazon, para la inferencia en lotes a un precio un 50 % más bajo en comparación con los precios de inferencia bajo demanda. Para obtener más información sobre los lotes, haga clic aquí. Consulte la lista de modelos aquí. 

    • AI21 Labs
    • AI21 Labs

      Precios bajo demanda

    • Amazon
      • Amazon Nova
      • Amazon Nova

        Precios para comprender los modelos

        Inferencia interregional global

        Inferencia geográfica entre regiones y dentro de una región

        Herramientas integradas

        Precios por modelos de generación de contenido creativo

        Precios de los modelos de generación y comprensión del habla

        Precios bajo demanda para los modelos fundacionales de conversión de voz a voz

        Nota: *Los precios de entrada y salida de los tokens de texto se aplican a casos de uso específicos, como la transcripción de voz a texto, las llamadas a herramientas para completar tareas o la base de conocimientos, agregar el historial de conversaciones a la sesión, etc. 

        La inferencia bajo demanda para los modelos Nova personalizados tiene el mismo precio que la inferencia Nova básica.

        Precios de los modelos de incrustación

      • Amazon Titan
      • Amazon Titan

      • Otro Amazon
    • Anthropic
    • Anthropic

      Precios bajo demanda y por lotes

      Modelos con acceso ampliado

      Proveedor Nombre de modelo Regiones Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Precio por cada millón de tokens de entrada (por lotes) Precio por cada millón de tokens de salida (por lotes) Precio por cada millón de tokens de entrada (escritura en caché) Precio por cada millón de tokens de entrada (lectura de caché)
       Anthropic  Claude 3.5 Sonnet (acceso público ampliado, en vigor desde el 1 de diciembre de 2025) Este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio), oeste de EE. UU. (Oregón), Europa (Fráncfort), Europa (Irlanda), Europa (Zúrich), Europa (París) 6,00 USD 30,00 USD 3,00 USD 15,00 USD N/D N/D
      Anthropic  Claude 3.5 Sonnet v2 (acceso público ampliado, en vigor desde el 1 de diciembre de 2025) Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón) 6,00 USD 30,00 USD 3,00 USD 15,00 USD 7,50 USD 0,60 USD

      Precios del nivel Reserved

      Inferencia optimizada para la latencia

      Precios del rendimiento aprovisionado

      Para conocer los precios del rendimiento aprovisionado, contacte con su equipo de cuentas.

    • Cohere
    • Cohere

      Precios bajo demanda

      Modelos de Cohere Precio por cada 1000 consultas**
      Rerank 3.5 2,00 USD
      **Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 500 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos.

      Precios por la personalización (ajuste preciso)

      *El total de tokens entrenados es igual a la cantidad de tokens en el corpus de datos de entrenamiento multiplicado por la cantidad de épocas

      Precios del rendimiento aprovisionado

      Modelos de Cohere Precio por hora y modelo 
      sin compromiso
      Precio por hora por unidad de modelo con un compromiso de 1 mes

      Precio por hora por unidad de modelo con un compromiso de 6 mes

      Cohere Command

      49,50 USD

      39,60 USD

      23,77 USD

      Cohere Command: Light 8,56 USD

      6,85 USD

      4,11 USD
      Insertar 3 inglés 7,12 USD

      6,76 USD

      6,41 USD
      Insertar 3 multilingüe 7,12 USD

      6,76 USD

      6,41 USD

      Póngase en contacto con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo. 

    • DeepSeek
    • DeepSeek

      Precios bajo demanda

      • Standard
      • Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

        Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        DeepSeek v3.2 0,62 USD 1,85 USD

        Regiones: Asia-Pacífico (Mumbai), América del Sur (São Paulo), Asia-Pacífico (Yakarta), Asia-Pacífico (Tokio) y Europa (Estocolmo)

        Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        DeepSeek v3.2 0,74 USD 2,22 USD

        Región: Asia-Pacífico (Sídney)

        Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        DeepSeek v3.1 0,5974 USD 1,7304 USD
        DeepSeek v3.2 0,6386 USD 1,9055 USD
      • Priority
      • Región: Asia-Pacífico (Sídney)

        Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        DeepSeek v3.1 1,0455 USD 3,0282 USD
      • Flex
      • Región: Asia-Pacífico (Sídney)

        Modelos de DeepSeek Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        DeepSeek v3.1 0,2987 USD 0,8652 USD
    • Google
    • Google

      Precios bajo demanda

      Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

      Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Gemma 3 4B 0,04 USD 0,08 USD
      Gemma 3 12B 0,09 USD 0,29 USD
      Gemma 3 27B 0,23 USD 0,38 USD

      Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

      Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Gemma 3 4B 0,05 USD 0,09 USD
      Gemma 3 12B 0,11 USD 0,34 USD
      Gemma 3 27B 0,27 USD 0,45 USD

      Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

      Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Gemma 3 4B 0,05 USD 0,10 USD
      Gemma 3 12B 0,11 USD 0,35 USD
      Gemma 3 27B 0,28 USD 0,46 USD

      Región: Europa (Londres)

      Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Gemma 3 4B 0,06 USD 0,12 USD
      Gemma 3 12B 0,14 USD 0,45 USD
      Gemma 3 27B 0,36 USD 0,59 USD

      Región: Asia-Pacífico (Sídney)

      Modelos de Google Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Gemma 3 4B 0,0412 USD 0,0824 USD
      Gemma 3 12B 0,0927 USD 0,2987 USD
      Gemma 3 27B 0,2369 USD 0,3914 USD

      * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
      * Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

    • Luma AI
    • Precios bajo demanda

    • Meta
    • Meta

      Llama 4

      Precios bajo demanda y por lotes

      Llama 3.3

      Precios bajo demanda y por lotes

      Llama 3.2

      Precios bajo demanda y por lotes

      Precios por la personalización del modelo (refinamiento)

      Precios del rendimiento aprovisionado

      Llama 3.1

      Precios bajo demanda y por lotes

      Precios por la personalización del modelo (ajuste preciso)

      Precios del rendimiento aprovisionado

      Llama 3

      Precios bajo demanda 

      Llama 2

      Precios bajo demanda 

      Región: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

      Modelos de Meta Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida

      Llama 2 Chat (13B)

      0,75 USD

      1,00 USD

      Llama 2 Chat (70B)

      1,95 USD

      2,56 USD

      Precios por la personalización del modelo (refinamiento)

      Modelos de Meta Precio por el entrenamiento de 1 millón de tokens Precio por el almacenamiento mensual de cada modelo personalizado* Precio por inferencia de un modelo personalizado por 1 unidad de modelo por hora (con precios de rendimiento aprovisionado sin compromiso)

      Llama 2 Pretrained (13B)

      1,49 USD

      1,95 USD

      23,50 USD

      Llama 2 Pretrained (70B)

      7,99 USD

      1,95 USD 23,50 USD

      * Almacenamiento de modelo personalizado = 1,95 USD

      Precios del rendimiento aprovisionado

      Modelos de Meta Precio por hora por unidad de modelo con un compromiso de 1 mes Precio por hora por unidad de modelo con un compromiso de 6 mes

      Llama 2 Pretrained y Chat (13B)

      21,18 USD

      13,08 USD

      Llama 2 Pretrained (70B)

      21,18 USD

      13,08 USD

      * Los modelos de Llama 2 Pre-trained solo se encuentran disponibles con un rendimiento aprovisionado después de la personalización. 

      Contacte con su equipo de cuentas o ventas de AWS para obtener más información sobre las unidades de modelo.

    • MiniMax AI
    • MiniMax AI

      Precios bajo demanda

      Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2 0,30 USD 1,20 USD
      Minimax M2.1 0,30 USD 1,20 USD

      Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2.5 0,30 USD 1,20 USD

      Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2 0,35 USD 1,41 USD
      Minimax M2.1 0,36 USD 1,44 USD

      Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2 0,36 USD 1,45 USD
      Minimax M2.1 0,36 USD 1,44 USD

      Región: Europa (Londres)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2 0,47 USD 1,86 USD
      Minimax M2.1 0,47 USD 1,86 USD

      Regiones: Europa (Fráncfort), Europa (Estocolmo) y Asia-Pacífico (Yakarta)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2.1 0,36 USD 1,44 USD

      Región: Asia-Pacífico (Sídney)

      Modelos de Minimax Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Minimax M2 0,3090 USD 1,2360 USD
      Minimax M2.1 0,3090 USD 1,2360 USD

      * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
      * Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

    • Mistral AI
    • Mistral AI

      Precios bajo demanda

      Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,40 USD 2,00 USD
      Magistral Small 1.2
      0,50 USD 1,50 USD
      Voxtral Mini 1.0
      0,04 USD 0,04 USD
      Voxtral Small 1.0
      0,10 USD 0,30 USD
      Ministral 3B 3.0
      0,10 USD 0,10 USD
      Ministral 8B 3.0
      0,15 USD 0,15 USD
      Ministral 14B 3.0
      0,20 USD 0,20 USD
      Mistral Large 3 0,50 USD 1,50 USD

      Regiones: Asia-Pacífico (Mumbai)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,48 USD 2,40 USD
      Magistral Small 1.2
      0,59 USD 1,76 USD
      Voxtral Mini 1.0
      0,05 USD 0,05 USD
      Voxtral Small 1.0
      0,12 USD 0,35 USD
      Ministral 3B 3.0
      0,12 USD 0,12 USD
      Ministral 8B 3.0
      0,18 USD 0,18 USD
      Ministral 14B 3.0
      0,24 USD 0,24 USD
      Mistral Large 3 0,59 USD 1,76 USD

      Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,48 USD 2,40 USD
      Magistral Small 1.2
      0,61 USD 1,82 USD
      Voxtral Mini 1.0
      0,05 USD 0,05 USD
      Voxtral Small 1.0
      0,12 USD 0,36 USD
      Ministral 3B 3.0
      0,12 USD 0,12 USD
      Ministral 8B 3.0
      0,18 USD 0,18 USD
      Ministral 14B 3.0
      0,24 USD 0,24 USD
      Mistral Large 3 0,61 USD 1,82 USD

      Regiones: Europa (Irlanda) y Europa (Milán)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,48 USD 2,40 USD
      Magistral Small 1.2
      0,59 USD 1,76 USD
      Voxtral Mini 1.0
      0,05 USD 0,05 USD
      Voxtral Small 1.0
      0,12 USD 0,35 USD
      Ministral 3B 3.0
      0,12 USD 0,12 USD
      Ministral 8B 3.0
      0,18 USD 0,18 USD
      Ministral 14B 3.0
      0,24 USD 0,24 USD

      Región: Europa (Londres)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,62 USD 3,10 USD
      Magistral Small 1.2
      0,78 USD 2,33 USD
      Voxtral Mini 1.0
      0,06 USD 0,06 USD
      Voxtral Small 1.0
      0,16 USD 0,47 USD
      Ministral 3B 3.0
      0,16 USD 0,16 USD
      Ministral 8B 3.0
      0,23 USD 0,23 USD
      Ministral 14B 3.0
      0,31 USD 0,31 USD

      Región: Asia-Pacífico (Sídney)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,41 USD 2,06 USD
      Magistral Small 1.2
      0,5150 USD 1,5450 USD
      Voxtral Mini 1.0
      0,0412 USD 0,0412 USD
      Voxtral Small 1.0
      0,1030 USD 0,3090 USD
      Ministral 3B 3.0
      0,1030 USD 0,1030 USD
      Ministral 8B 3.0
      0,1545 USD 0,1545 USD
      Ministral 14B 3.0
      0,2060 USD 0,2060 USD
      Mistral Large 3 0,5150 USD 1,5450 USD

      Regiones: Asia-Pacífico (Yakarta), Europa (Fráncfort) y Europa (Estocolmo)

      Modelos de Mistral Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Devstral 2 135B 0,48 USD 2,40 USD

      * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
      * Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

    • Moonshot AI
    • Moonshot AI

      Precios bajo demanda

      Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

      Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Kimi K2 Thinking 0,60 USD 2,50 USD
      Kimi K2.5 0,60 USD 3,00 USD

      Región: Asia-Pacífico (Mumbai)

      Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Kimi K2 Thinking 0,71 USD 2,94 USD
      Kimi K2.5 0,72 USD 3,60 USD

      Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

      Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Kimi K2 Thinking 0,73 USD 3,03 USD
      Kimi K2.5 0,72 USD 3,60 USD

      Regiones: Europa (Estocolmo) y Asia-Pacífico (Yakarta)

      Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Kimi K2.5 0,72 USD 3,60 USD

      Región: Asia-Pacífico (Sídney)

      Modelos de Kimi Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Kimi K2 Thinking 0,6180 USD 2,5750 USD
      Kimi K2.5 0,6180 USD 3,0900 USD

      * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
      * Los precios del nivel Flex tienen un descuento del 50 % con respecto al precio del nivel Standard

    • NVIDIA
    • NVIDIA

      Precios bajo demanda

      Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

      Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      NVIDIA Nemotron Nano 2 0,06 USD 0,23 USD
      NVIDIA Nemotron Nano 2 VL 0,20 USD 0,60 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,06 USD 0,24 USD

      Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

      Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      NVIDIA Nemotron 3 Super 120B A12B 0,15 USD 0,65 USD

      Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

      Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      NVIDIA Nemotron Nano 2 0,07 USD 0,27 USD
      NVIDIA Nemotron Nano 2 VL 0,24 USD 0,71 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,28 USD

      Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

      Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      NVIDIA Nemotron Nano 2 0,07 USD 0,28 USD
      NVIDIA Nemotron Nano 2 VL 0,24 USD 0,73 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,29 USD

      Región: Europa (Londres)

      Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      NVIDIA Nemotron Nano 2 0,09 USD 0,36 USD
      NVIDIA Nemotron Nano 2 VL 0,31 USD 0,93 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,09 USD 0,37 USD

      Región: Asia-Pacífico (Sídney)

      Modelos de NVIDIA Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      NVIDIA Nemotron Nano 2 0,0618 USD 0,2369 USD
      NVIDIA Nemotron Nano 2 VL 0,2060 USD 0,6180 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,0618 USD 0,2472 USD

      * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
      * Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

    • OpenAI
    • OpenAI

      • gpt-oss-20b, 120b
        • Standard
        • Región: Asia-Pacífico (Sídney)

          Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          gpt-oss-20b 0,0721 USD 0,3090 USD
          gpt-oss-120b 0,1545 USD 0,6180 USD
        • Priority
        • Región: Asia-Pacífico (Sídney)

          Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          gpt-oss-20b 0,1262 USD 0,5408 USD
          gpt-oss-120b 0,2704 USD 1,0815 USD
        • Flex
        • Región: Asia-Pacífico (Sídney)

          Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          gpt-oss-20b 0,0361 USD 0,1545 USD
          gpt-oss-120b 0,0773 USD 0,3090 USD
        • Por lotes
        • Región: Asia-Pacífico (Sídney)

          Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          gpt-oss-20b 0,0361 USD 0,1545 USD
          gpt-oss-120b 0,0773 USD 0,3090 USD
        • Personalización de modelos
        • Personalización de modelos

          Precios de refinamiento de refuerzo

          Con la capacidad de refinamiento de refuerzo de Amazon Bedrock, puede mejorar la precisión de los modelos sin necesidad de contar con una profunda experiencia en machine learning o grandes cantidades de datos etiquetados. Amazon Bedrock automatiza el flujo de trabajo de refinamiento de refuerzo: toma las peticiones de muestra, genera respuestas modelo y las puntúa mediante la función de recompensa. Estas peticiones, respuestas y puntuaciones se utilizan luego para entrenar su modelo mediante un flujo de trabajo de RFT iterativo. 

          Todo el flujo de trabajo de entrenamiento se factura por hora. Una vez finalizado el entrenamiento, los clientes pueden usar de inmediato el modelo refinado resultante para la inferencia bajo demanda. La opción de inferencia bajo demanda incluye un modelo de precios basado en tokens por el que se paga en función de la cantidad de tokens procesados durante la inferencia.

          Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

          Modelos de OpenAI Precio por horas de entrenamiento Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Precio por el almacenamiento mensual de cada modelo entrenado
          gpt-oss-20b 80,00 USD 0,09 USD 0,39 USD 1,95 USD
      • gpt-oss-safeguard 20b, 120b
      • Precios bajo demanda

        Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

        Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GPT OSS Safeguard 20B 0,07 USD 0,20 USD
        GPT OSS Safeguard 120B 0,15 USD 0,60 USD

        Regiones: Asia-Pacífico (Mumbai), América del Sur (São Paulo) y Asia-Pacífico (Tokio)

        Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GPT OSS Safeguard 20B 0,08 USD 0,24 USD
        GPT OSS Safeguard 120B 0,18 USD 0,71 USD

        Regiones: Europa (Irlanda) y Europa (Milán)

        Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GPT OSS Safeguard 20B 0,08 USD 0,23 USD
        GPT OSS Safeguard 120B 0,18 USD 0,70 USD

        Región: Europa (Londres)

        Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GPT OSS Safeguard 20B 0,11 USD 0,31 USD
        GPT OSS Safeguard 120B 0,23 USD 0,93 USD

        Región: Asia-Pacífico (Sídney)

        Modelos de OpenAI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GPT OSS Safeguard 20B 0,0721 USD 0,2060 USD
        GPT OSS Safeguard 120B 0,1545 USD 0,6180 USD

        * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
        * Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

    • Qwen
    • Amazon Bedrock

      Qwen

      • Qwen3 Coder, 32B, 235B
        • Standard
        • Región: Asia-Pacífico (Sídney)

          Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          Qwen3 Coder 30B A3B 0,1545 USD 0,6180 USD
          Qwen3 32B 0,1545 USD 0,6180 USD
          Qwen3 235B A22B 2507 0,2266 USD 0,9064 USD
        • Priority
        • Región: Asia-Pacífico (Sídney)

          Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          Qwen3 Coder 30B A3B 0,2704 USD 1,0815 USD
          Qwen3 32B 0,2704 USD 1,0815 USD
          Qwen3 235B A22B 2507 0,3966 USD 1,5862 USD
        • Flex
        • Región: Asia-Pacífico (Sídney)

          Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD
          Qwen3 32B 0,0773 USD 0,3090 USD
          Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD
        • Por lotes
        • Región: Asia-Pacífico (Sídney)

          Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
          Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD
          Qwen3 32B 0,0773 USD 0,3090 USD
          Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD
        • Personalización de modelos
        • Personalización de modelos

          Precios de refinamiento de refuerzo

          Con la capacidad de refinamiento de refuerzo de Amazon Bedrock, puede mejorar la precisión de los modelos sin necesidad de contar con una profunda experiencia en machine learning o grandes cantidades de datos etiquetados. Amazon Bedrock automatiza el flujo de trabajo de refinamiento de refuerzo: toma las peticiones de muestra, genera respuestas modelo y las puntúa mediante la función de recompensa. Estas peticiones, respuestas y puntuaciones se utilizan luego para entrenar su modelo mediante un flujo de trabajo de RFT iterativo.

          Todo el flujo de trabajo de entrenamiento se factura por hora. Una vez finalizado el entrenamiento, los clientes pueden usar de inmediato el modelo refinado resultante para la inferencia bajo demanda. La opción de inferencia bajo demanda incluye un modelo de precios basado en tokens por el que se paga en función de la cantidad de tokens procesados durante la inferencia.

          Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

          Modelos de Qwen Precio por horas de entrenamiento Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida Precio por el almacenamiento mensual de cada modelo entrenado
          Qwen3 32B 80,00 USD 0,20 USD 0,78 USD 1,95 USD
      • Qwen 3 Next, VL, Coder Next
      • Precios bajo demanda

        Regiones: este de EE. UU. (norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

        Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        Qwen3 Next 80B A3B 0,15 USD 1,20 USD
        Qwen3 VL 235B A22B 0,53 USD 2,66 USD
        Qwen3 Coder Next 0,50 USD 1,20 USD

        Regiones: Asia-Pacífico (Mumbai), Europa (Irlanda) y Europa (Milán)

        Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        Qwen3 Next 80B A3B 0,18 USD 1,41 USD
        Qwen3 VL 235B A22B 0,62 USD 3,13 USD
        Qwen3 Coder Next 0,60 USD 1,44 USD

        Regiones: América del Sur (São Paulo) y Asia-Pacífico (Tokio)

        Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        Qwen3 Next 80B A3B 0,18 USD 1,45 USD
        Qwen3 VL 235B A22B 0,64 USD 3,22 USD
        Qwen3 Coder Next 0,60 USD 1,44 USD

        Región: Europa (Londres)

        Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        Qwen3 Next 80B A3B 0,23 USD 1,86 USD
        Qwen3 VL 235B A22B 0,82 USD 4,12 USD
        Qwen3 Coder Next 0,78 USD 1,86 USD

        Regiones: Europa (Fráncfort) y Asia-Pacífico (Yakarta)

        Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        Qwen3 Coder Next 0,60 USD 1,44 USD

        Región: Asia-Pacífico (Sídney)

        Modelos de Qwen Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        Qwen3 Next 80B A3B 0,1545 USD 1,2360 USD
        Qwen3 VL 235B A22B 0,5459 USD 2,7398 USD
        Qwen3 Coder Next 0,5150 USD 1,2360 USD

        * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
        * Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

    • Stability AI
    • Stability AI

      Precios bajo demanda

      Los modelos de imagen de la generación anterior ofrecidos por Stability AI tienen un precio por imagen, en función del número de pasos y de la resolución de la imagen.

       

      Región: Oregón, Norte de Virginia, Ohio

      Servicios de imágenes de Stability AI Precio por generación para cada modelo  
      Eliminar fondo en imágenes de Stable 0,07 USD  
      Borrar objeto en imágenes de Stable 0,07 USD  
      Control de estructura en imágenes de Stable 0,07 USD  
      Control de boceto en imágenes de Stable 0,07 USD  
      Guía de estilo de imágenes de Stable 0,07 USD  
      Búsqueda y reemplazo de imágenes de Stable 0,07 USD  
      Relleno de imágenes de Stable 0,07 USD  
      Búsqueda y cambio de color de imágenes de Stable 0,07 USD  
      Transferencia de estilos de imágenes de Stable 0,08 USD  
      Ampliación conservadora de imágenes de Stable 0,40 USD  
      Ampliación creativa de imágenes de Stable 0,60 USD  
      Ampliación rápida de imágenes de Stable 0,03 USD  
      Extensión de imágenes de Stable 0,06 USD  
    • TwelveLabs
    • TwelveLabs

      Precios bajo demanda

      • Inferencia interregional global
      • Inferencia interregional geográfica y dentro de una región
    • Writer
    • Writer

      Precios bajo demanda

      Modelos de Writer Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
      Palmyra X4 2,50 USD 10,00 USD
      Palmyra X5 0,60 USD 6,00 USD
    • Z AI
    • Amazon Bedrock

      Z AI

      • GLM 5
      • Precios bajo demanda

        Regiones: este de EE. UU. (Norte de Virginia) y oeste de EE. UU. (Oregón)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 5 1,00 USD 3,20 USD

        * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
        * Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

      • GLM 4.7
      • Precios bajo demanda

        Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 0,60 USD 2,20 USD

        Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), América del Sur (São Paulo) y Europa (Estocolmo)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 0,72 USD 2,64 USD

        Región: Asia-Pacífico (Sídney)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 0,6180 USD 2,2660 USD

        * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
        * Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

      • GLM 4.7 Flash
      • Precios bajo demanda

        Regiones: este de EE. UU. (Norte de Virginia), este de EE. UU. (Ohio) y oeste de EE. UU. (Oregón)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 Flash 0,07 USD 0,40 USD

        Regiones: Asia-Pacífico (Yakarta), Asia-Pacífico (Mumbai), Asia-Pacífico (Tokio), Europa (Fráncfort), Europa (Irlanda), Europa (Milán), Europa (Estocolmo) y América del Sur (São Paulo)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 Flash 0,08 USD 0,48 USD

        Región: Europa (Londres)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 Flash 0,11 USD 0,62 USD

        Región: Asia-Pacífico (Sídney)

        Modelos de Z AI Precio por cada millón de tokens de entrada Precio por cada millón de tokens de salida
        GLM 4.7 Flash 0,0721 USD 0,4120 USD

        * El precio del nivel Priority es un 75 % superior al precio del nivel Standard
        * Los precios del nivel Flex y por lotes tienen un descuento del 50 % con respecto al precio del nivel Standard

    • Importación de modelos personalizados
    • Importación de modelos personalizados

      • Llama
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,05718 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Región: Europa (Fráncfort)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,07144 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

      • Llama multimodal
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,05718 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Región: Europa (Fráncfort)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,07144 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

      • Mistral
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,05718 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Región: Europa (Fráncfort)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,07144 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

      • Mixtral
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,05718 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Región: Europa (Fráncfort)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,07144 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

      • Flan
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,05718 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Región: Europa (Fráncfort)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,07144 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

        Precios de inferencia bajo demanda:
        Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

        Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

      • Qwen
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,05718 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Región: Europa (Fráncfort)

        Versión de unidad modelo personalizada v1.0
        Precio por unidad modelo personalizada por minuto* 0,07144 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

        Precios de inferencia bajo demanda:
        Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

        Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

      • OpenAI
      • Regiones: Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón)

        Versión de unidad de modelos personalizados v2.0
        Precio por unidad de modelos personalizados por minuto* 0,1433 USD
        Costo de almacenamiento mensual por unidad de modelos personalizados 1,95 USD

        Nota: Las unidades de modelos personalizados necesarias para alojar un modelo dependen de una variedad de factores, en particular la arquitectura del modelo, el recuento de parámetros del modelo y la longitud del contexto. La cantidad exacta de unidades de modelos personalizados necesarias se determinará en el momento de la importación. Como referencia, el modelo Llama 3.1 8B 128K requiere 2 unidades de modelos personalizados, un modelo Llama 3.1 70B 128k requiere 8 unidades de modelos personalizados.

        *Facturado en intervalos de 5 minutos

        Precios de inferencia bajo demanda:
        Se le facturará en intervalos de 5 minutos mientras la copia del modelo esté activa a partir de la primera invocación exitosa. El límite máximo de rendimiento y simultaneidad por copia de modelo depende de factores como la combinación de tokens de entrada/salida, el tipo de hardware, el tamaño del modelo, la arquitectura y las optimizaciones de inferencia, y se determina durante el flujo de trabajo de importación del modelo.

        Bedrock escala automáticamente el número de copias del modelo en función de sus patrones de uso. Si no hay invocaciones durante un período de 5 minutos, Bedrock reducirá la escala a cero y volverá a escalar hacia arriba cuando invoques su modelo. Al reducir la escala, es posible que experimente una duración de arranque en frío (en decenas de segundos) según el tamaño del modelo. Bedrock también aumenta la cantidad de copias del modelo si el volumen de la inferencia supera constantemente los límites de simultaneidad de una sola copia del modelo. Nota: Hay un máximo predeterminado de 3 copias del modelo por cuenta y modelo importado que se puede aumentar mediante Service Quotas.

  • Bases de conocimiento
  • Recuperación de datos estructurados (generación de SQL)

    La recuperación de datos estructurados se cobra por cada solicitud para generar una consulta SQL. La consulta SQL generada se usa para recuperar los datos de los almacenes de datos estructurados.

    Modelos de Rerank

    Los modelos de Rerank están diseñados para mejorar la relevancia y precisión de las respuestas en las aplicaciones de generación aumentada por recuperación (RAG). Se cobran por consulta.

    **Se le cobrará por el número de consultas en las que una consulta puede contener hasta 100 fragmentos de documentos. Si la consulta contiene más de 100 fragmentos de documentos, se contabiliza como consultas múltiples. Por ejemplo, si una solicitud contiene 350 documentos, se tratará como 4 consultas. Tenga en cuenta que cada documento solo puede contener un máximo de 512 tokens (incluidos los tokens totales de la consulta y del documento) y, si la longitud del token es superior a 512 tokens, se divide en varios documentos. Una consulta equivale a una unidad de búsqueda.

  • Barreras de protección
  • Barreras de protección de Amazon Bedrock

    El precio de Barreras de protección de Amazon Bedrock se basa en los cargos incurridos por el filtro usado en la barrera de protección. El precio es el mismo para el nivel estándar y el nivel clásico.

    Filtro de las barreras de protección*

    Precio

    Filtros de contenido tanto para el nivel estándar como para el nivel clásico (contenido de texto)

    0,15 USD por 1000 unidades de texto

    Filtros de contenido (contenido de imágenes)

    0,00075 USD por imagen procesada

    Temas rechazados tanto para el nivel estándar como para el nivel clásico

    0,15 USD por 1000 unidades de texto

    Filtros de información confidencial 

    0,10 USD por 1000 unidades de texto

    Filtros de información confidencial (expresión regular) 

    Gratis

    Filtros de palabras

    Gratis

    Verificaciones de la base contextual

    0,10 USD por 1000 unidades de texto

    Verificaciones del razonamiento automatizado

    0,17 USD por cada 1000 unidades de texto por política de razonamiento automatizado

    Precios bajo demanda

    * Cada filtro de barreras de protección es opcional y se puede activar según los requisitos de su aplicación. Se incurrirá en cargos según el tipo de filtro usado en la barrera de protección. Por ejemplo, si una barrera de protección está configurada con filtros de contenido y temas denegados, se cobrarán estos dos filtros, pero no habrá cargos asociados a los filtros de información confidencial.

    Nota: Una unidad de texto puede contener hasta 1000 caracteres. Si una entrada de texto tiene más de 1000 caracteres, se procesa como varias unidades de texto, con 1000 caracteres o menos cada una de ellas. Por ejemplo, si una entrada de texto contiene 5600 caracteres, se cobrarán 6 unidades de texto.

    La verificación de base contextual utiliza un origen de referencia y una consulta para determinar si la respuesta del modelo se basa en el origen y es relevante para la consulta. El número total de unidades de texto cobradas se calcula mediante la combinación de todos los caracteres del origen, la consulta y la respuesta del modelo.

  • Evaluación del modelo
  • Evaluación del modelo

    La evaluación del modelo se cobra por la inferencia a partir del modelo que elija. Las puntuaciones algorítmicas generadas automáticamente se proporcionan sin costo adicional. En el caso de la evaluación realizada por humanos en la que aporta su propio flujo de trabajo, se le cobrará por la inferencia del modelo en la evaluación y un cargo de 0,21 USD por tarea humana completada.

    Si utiliza la evaluación de RAG o LLM como juez en la evaluación del modelo, los tokens que utiliza el modelo juez se cobran en función de los precios de los niveles estándar bajo demanda. Las peticiones del juez se cobran como parte del uso de tokens y están disponibles en la documentación pública. La evaluación de RAG en una base de conocimientos de Bedrock también conlleva los cargos por uso habituales de Bases de conocimiento de Bedrock.

    Modelo

    Precio por cada 1000 tokens de entrada

    Precio por cada 1000 tokens de salida

    Precio por tarea humana

     

    Modelo seleccionado para la evaluación

    Basado en el modelo seleccionado

    Basado en el modelo seleccionado

     

    0,21 USD

     
  • Automatización de datos
  • Automatización de Datos

    Automatización de Datos de Amazon Bedrock transforma contenido no estructurado y multimodal en formatos de datos estructurados, para casos de uso como el procesamiento inteligente de documentos, el análisis de video y la RAG. La Automatización de datos de Bedrock puede generar contenido de salida estándar con valores predeterminados específicos según la modalidad, como descripciones escena por escena de videos, transcripciones de audio o análisis automatizado de documentos. Además, los clientes pueden crear salidas personalizadas al especificar los requisitos de salida en esquemas basados en su propia estructura de datos, que luego se cargan fácilmente en una base de datos o almacén de datos existente. A través de su integración con Bases de conocimiento, Automatización de Datos de Bedrock también permite analizar contenido en aplicaciones de RAG, lo que mejora la precisión y la relevancia de los resultados al incorporar información incrustada tanto en imágenes como en texto.

    Bases de conocimiento de Amazon Bedrock ofrece una integración de Automatización de Datos de Bedrock para proporcionar respuestas más relevantes y precisas para los datos multimodales. Al configurar una base de conocimientos, puede seleccionar Bedrock Data Automation como método de análisis para analizar y extraer información significativa de imágenes o documentos, que pueden incluir figuras, gráficos y diagramas. Durante el procesamiento, Bedrock Data Automation extrae información significativa de los documentos e imágenes ingeridos, que luego se utiliza en los pasos posteriores de la base de conocimientos para fragmentar, incrustar y almacenar. Cuando se integra con las bases de conocimiento, Automatización de Datos de Bedrock entrega y cobra por los resultados estandarizados.

  • Direccionamiento de peticiones inteligente
  • Punto de precio Dimensión de precios Plan de precios
    Direccionamiento de peticiones inteligente 1 USD por 1000 solicitudes Bajo demanda

    Direccionamiento de peticiones inteligente

    El direccionamiento de peticiones inteligente le permite usar una combinación de modelos fundacionales (FM) de la misma familia de modelos para ayudar a optimizar la calidad y el costo. Por ejemplo, con la familia de modelos Claude de Anthropic, Amazon Bedrock puede enrutar de forma inteligente las peticiones entre Claude 3.5 Sonnet y Claude 3 Haiku, en función de la complejidad del mensaje. Del mismo modo, Amazon Bedrock puede enrutar solicitudes entre Meta Llama 3.3 70B y 3.18B, y Nova Pro y Nova Lite. El direccionamiento de peticiones predice qué modelo proporcionará el mejor rendimiento para cada solicitud y, al mismo tiempo, ayuda a optimizar la calidad de la respuesta y el costo. Esto es particularmente útil para aplicaciones como los asistentes de servicio al cliente, donde las consultas sencillas se pueden gestionar mediante modelos más pequeños, rápidos y rentables, y las consultas complejas se dirigen a modelos más capaces. El direccionamiento de peticiones inteligente puede reducir los costos hasta en un 30 % sin comprometer la precisión.

  • Optimización de peticiones
  • Optimización de peticiones para Amazon Bedrock

    Se le cobra en función del número de tokens en las peticiones de entrada y en las peticiones optimizadas.

    Todos los cargos se facturan mensualmente a partir del 23 de abril de 2025. 

    Precio por cada 1000 tokens
    0,030 USD

Ejemplos de precios

  • Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Jurrasic-2 Mid de AI21 para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 10 000 tokens/1000 * 0,0125 USD + 2000 tokens/1000 * 0,0125 USD = 0,15 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Amazon Titan Text Lite para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,0003 USD + 1000 tokens/1000 * 0,0004 USD = 0,001 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo base Amazon Titan Image Generator para generar 1000 imágenes de 1024 x 1024 de tamaño y de calidad estándar.

    Costo total incurrido = 1000 imágenes * 0,01 USD por imagen = 10 USD

    Precios de la personalización (ajuste preciso y entrenamiento previo continuo)

    Un desarrollador de aplicaciones personaliza un modelo de Amazon Titan Image Generator con 1000 pares de imagen y texto. Tras el entrenamiento, el desarrollador utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (plazo de compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,005 USD * 500 * 64), donde 0,005 USD es el precio por imagen vista, 500 es el número de pasos y 64 es el tamaño del lote + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra dos unidades de modelo de Amazon Titan Text Express con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 2 unidades de modelo * 18,40 USD/hora * 24 horas* 31 días = 27 379,20 USD

    Un desarrollador de aplicaciones compra una unidad de modelo del modelo básico de Amazon Titan Image Generator con un compromiso de 1 mes.

    Costo total incurrido = 1 unidad de modelo * 16,20 USD * 24 horas * 31 días = 12 052,80 USD

  • Ejemplo 1: chatbot de atención al cliente
    Un desarrollador de aplicaciones crea un chatbot de atención al cliente y usa filtros de contenido para bloquear el contenido dañino y los temas denegados para filtrar las consultas y respuestas no deseadas.

    El chatbot atiende 1000 consultas de usuarios por hora. Cada consulta de usuario tiene una longitud de entrada promedio de 200 caracteres y recibe una respuesta del FM de 1500 caracteres.

    Cada consulta de usuario de 200 caracteres corresponde a 1 unidad de texto.

    Cada respuesta del FM de 1500 caracteres corresponde a 2 unidades de texto.

    Unidades de texto procesadas cada hora = (1 + 2) * 1000 consultas = 3000 unidades de texto

    Costo total incurrido por hora por los filtros de contenido y el tema denegado = 3000 * (0,15 USD + 0,15 USD) / 1000 = 0,90 USD

     

    Ejemplo 2: resumen de la transcripción del centro de llamadas
    Un desarrollador de aplicaciones crea una aplicación para resumir las transcripciones de los chats entre los usuarios y los agentes de soporte. Utiliza un filtro de información confidencial para eliminar la información de identificación personal (PII) en los resúmenes generados para 10 000 conversaciones.

    Cada resumen generado tiene un promedio de 3500 caracteres que corresponden a 4 unidades de texto.

    Costo total incurrido para resumir 10 000 conversaciones = 10 000 * 4 * (0,1/1000 USD) = 4 USD

     

    Ejemplo 3: Motor de verificación de protocolos médicos
    Una empresa de tecnología sanitaria implementa verificaciones de razonamiento automatizado en su sistema de apoyo a la toma de decisiones clínicas para validar las sugerencias de tratamiento según las directrices médicas.

    El sistema procesa 5000 casos de pacientes al mes. Cada caso implica:

    • Resumen de datos del paciente: 500 caracteres (1 unidad de texto)
    • Evaluación diagnóstica: 2000 caracteres (2 unidades de texto)
    • Recomendación de tratamiento: 4500 caracteres (5 unidades de texto)

    Unidades de texto procesadas por mes = (1 + 2 + 5) 5000 casos = 40 000 unidades de texto
    Costo total incurrido por mes para las verificaciones de razonamiento automatizado = 40 000 (0,17 USD)/1000 = 6,80 USD

     

  • Ejemplo de precios 1 (cambio de clasificación mediante el modelo Amazon Rerank 1.0)

    En un mes determinado, realiza 2 millones de solicitudes a la API de Rerank con el modelo Amazon Rerank 1.0; 1 millón de solicitudes contienen menos de 100 documentos cada una y, por lo tanto, se cobrará una solicitud por cada una. El millón de solicitudes restantes contienen entre 120 y 150 documentos y, por lo tanto, a cada solicitud se le cobrarán 2 solicitudes.

    Precio de una solicitud = 0,001 USD
    Costo total = 1,000,000 USD × 0.001 + 1,000,000 USD × 2 = 0.001 USD = 3000 USD 

    Ejemplo de precios 2: (Recuperación de datos estructurados)

    Un desarrollador de aplicaciones crea un chatbot de soporte que consulta los datos estructurados almacenados en Amazon Redshift. El desarrollador crea una base de conocimientos de Bedrock y se conecta a Amazon Redshift. El chatbot atiende 10000 consultas de usuarios por hora. Cada consulta de usuario costará 0,002 USD por API de GenerateQuery para generar SQL a partir de la consulta del usuario.

    Costo total incurrido para generar SQL por hora = 0,002 USD*10000 = 20 USD.
    Costo total incurrido en el mes = 20 USD*24 USD*30 USD = 1440 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock, en la región Oeste de EE. UU. (Oregón): una solicitud al modelo Claude de Anthropic para resumir una entrada de 11 000 tokens de texto de entrada en una salida de 4000 tokens.

    Costo total incurrido =11 000 tokens/1000 * 0,008 USD + 4000 tokens/1000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de Anthropic Claude Instant en la región Oeste de EE. UU. (Oregón):

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0015 USD + 2000 tokens/1000 * 0,0020 USD = 0,013 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Command Light de Cohere para resumir una entrada de 6000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 6000 tokens/1000 * 0,0003 USD + 2000 tokens/1000 * 0,0006 USD = 0,003 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Embed (inglés) o al modelo Embed (multilingüe) de Cohere para generar incrustaciones para 10 000 tokens de entrada.

    Costo total incurrido = 10 000 tokens/1000 * 0,0001 USD = 0,001 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza un modelo Command de Cohere con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,004 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (49,50 USD) = 55,45 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 39,60 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad modelo Command de Cohere con un compromiso de 1 mes para su caso de uso de resumen de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 39,60 USD * 24 horas * 31 días = 29 462,40 USD

  • Ejemplo de precios: Un desarrollador de aplicaciones importa un modelo personalizado tipo Llama 3.1 con un tamaño de parámetro de 8B y una longitud de secuencia de 128 000 en la región us-east-1, y lo elimina después de un mes. Esto requiere 2 unidades de modelos personalizados. Por lo tanto, el precio por minuto será de 0,1570 USD porque se requieren 2 unidades de modelos personalizados. Los costos de almacenamiento del modelo para 2 unidades de modelos personalizados serían de 3,90 USD al mes.

    La importación del modelo es gratuita. La primera invocación exitosa es a las 8:03 a. m., momento en el que comienza la medición. Los intervalos de medición de 5 minutos son de 8:03 a. m. a 8:07 a. m.; de 8:07 a. m. a 8:11 a. m., y así sucesivamente. Si hay al menos una invocación durante un periodo de 5 minutos, el intervalo se considerará activa para la facturación. Si hay una invocación a las 8:03 a. m. y no hay más invocaciones después de las 8:07 a. m., la medición se detendrá a las 8:07 a. m. En este caso, la factura se calcularía de la siguiente manera: 0,1570 USD * 5 minutos * 1 intervalo de cinco minutos = 0,785 USD.

  • Ejemplo de precios 1:
    Supongamos que procesa un documento de 1000 páginas con BDA Custom Output. Las 1000 páginas se procesan mediante el esquema 1, que tiene 15 campos. El precio por página de cualquier esquema con 30 campos o menos es de 0,040 USD. El costo total sería de 40 USD.

    Total de páginas procesadas = 1000
    Precio por página para esquemas con menos de 30 campos = 0,040 USD
    Costo total = 1000 × 0.040 USD = 40 USD

     

    Ejemplo de precios 2:
    Supongamos que procesa 2 documentos con BDA Custom Output. El documento 1 tiene 40 páginas y se procesa con el esquema 1, que tiene 20 campos. El documento 2 tiene 10 páginas y se procesa con el esquema 2, que tiene 40 campos. El precio por página del esquema 1 es de 0,040 USD, ya que contiene 30 campos o menos. El precio por página del esquema 2 es de 0,045 USD. El costo de procesamiento del documento 1 con el esquema 1 es de 1,60 USD. El costo de procesamiento del documento 2 con el esquema 2 es de 0,45 USD. El costo total de procesar ambos documentos sería de 2,05 USD.

    Total de páginas procesadas = 50
    Precio por página para el esquema 1 con menos de 30 campos = 0,040 USD
    Precio por página para el esquema 2 con 40 campos = 0,040 USD + (número de campos adicionales superiores a 30 *0,0005 USD por campo)
    Número de campos adicionales por encima de 30 = 40 - 30 = 10
    Precio por página para el esquema 2 con 40 campos = 0,040 USD + (10 *0,0005 USD por campo) = 0,045 USD
    Cargo por el documento 1 con el esquema 1 = 40 páginas x 0,040 USD por página = 1,6 USD
    Cargo por el documento 2 con el esquema 2 = 10 páginas x 0,045 USD por página = 0,45 USD
    Cargo total = cargo por el documento 1 + cargo por el documento 2 = 1,6 USD + 0,45 USD = 2,05 USD

     

    Ejemplo 3 de precios.
    Supongamos que configura las bases de conocimiento de Bedrock para usar Bedrock Data Automation como analizador y, a continuación, ingiere un documento de 1000 páginas. Tenga en cuenta que las estructuras de costos difieren entre las opciones de análisis de las bases de conocimiento. BDA usa precios por página, mientras que los analizadores de Foundational Model cobran en función de los tokens de entrada y salida. Para dar contexto, el procesamiento de 1000 páginas, de las que el 30 % contiene tablas y el 30 % contiene figuras, normalmente requiere 2900 tokens de entrada y 750 tokens de salida. El consumo de tokens varía según el tipo de contenido, por lo que se recomienda a los clientes que prueben con sus propios datos para obtener estimaciones más precisas. La integración de las bases de conocimiento de Bedrock y Bedrock Data Automation utiliza una salida estándar, donde precio por página es 0,010 USD. El costo total sería de 10 USD.

    Total de páginas procesadas = 1000
    Precio por página para la salida estándar = 0,010 USD
    Costo total = 1000 x 0,010 USD = 10 USD

     

    Ejemplo de precios 4:
    Supongamos que procesa un video de 60 minutos con la salida estándar BDA. El precio por minuto de la salida estándar de video es de 0,050 USD. El costo total sería de 3.00 USD.

    Total de minutos procesados = 60
    Precio por minuto para la salida estándar de video = 0,050 USD
    Costo total = 60 × 0,050 USD = 3,00 USD

     

    Ejemplo de precios 5:
    Supongamos que procesa 2000 imágenes con BDA Custom Output. Las primeras 1000 imágenes se procesan con el esquema 1, que tiene 10 campos. Las últimas 1000 páginas se procesan con el esquema 2, que tiene 40 campos. El precio por imagen del esquema 1 es de 0,005 USD, ya que contiene 30 campos o menos. El precio por imagen del esquema 2 es de 0,01 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 1 es de 5,00 USD. El costo de procesamiento de las primeras 1000 imágenes con el esquema 2 es de 10,00 USD. El costo total de procesar las 2000 imágenes sería de 15,00 USD

    Costo de las primeras 1000 imágenes = 1000 imágenes* 0,005 USD por imagen = 5,00 USD
    Costo de 1000 imágenes secundarias = 1000 imágenes * (0,005 USD + [número de campos adicionales superiores a 30 x 0,0005 USD por campo])
    = 1000 x (0,005 USD + ([40-30] x 0,0005 USD))
    = 1000 x (0,005 USD + [10 x 0,0005 USD]) = 10,00 USD
    Costo total = 5,00 USD + 10,00 USD = 15,00 USD

     

    Ejemplo de precios 6:
    Supongamos que desea utilizar Bedrock Data Automation Standard Output para procesar 15 000 minutos de grabaciones de audio de reuniones en su organización. El costo total de procesar los 15 000 minutos de audio sería de 90 USD.

    Total de minutos procesados = 15 000 minutos
    Carga total = 15 000 minutos × 0,006 USD = 90 USD

     

  • Precios bajo demanda

    Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo DeepSeek-R1 para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens (incluidos los tokens de razonamiento):

    Costo total por hora = 2000 tokens/1000 * 0,00135 USD + 1000 tokens/1000 * 0,0054 USD = 0,0081 USD

  • Ejemplo: resumen de noticias
    Un desarrollador de aplicaciones crea un flujo para automatizar el resumen de noticias para los comerciantes. El flujo incluye un nodo de entrada que ocupa una ubicación de S3 y un nodo de recuperación de S3 que recupera 10 archivos que incluyen artículos de 10 de las principales agencias de noticias de S3 (transiciones de 2 nodos). A continuación, utiliza un nodo iterador para invocar un modelo con un nodo de petición para resumir cada archivo (+ 10 archivos x 2 transiciones de nodos). A continuación, recopila todos los resultados mediante un nodo recopilador, escribe los resultados en S3 mediante el nodo de almacenamiento de S3 y los completa en un nodo de salida (+ 3 transiciones de nodo). El desarrollador ejecuta este flujo cada media hora de cada día de la semana.

    La cantidad de transiciones de nodo por ejecución de flujo es: 2+1+10*2 + 3 = 25 transiciones de nodo/ejecución de flujo

    La cantidad de ejecuciones de flujo por mes es: 24 horas *2* 5 días * 4 semanas = 960 ejecuciones de flujo/mes.

    La factura mensual total es: 25 * 960 * 0,035 USD/1000 = 0,84 USD

    Cargos adicionales
    La factura también incluirá cargos adicionales por los servicios de AWS que se utilicen en la ejecución del flujo de trabajo, incluidos los usos de Amazon S3 en los nodos de recuperación y almacenamiento, y el uso del modelo fundacional de Amazon Bedrock en el nodo de petición.

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Llama 2 Chat (13B) de Meta para resumir una entrada de 2000 tokens de texto de entrada en una salida de 500 tokens.

    Costo total incurrido = 2000 tokens/1000 * 0,00075 USD + 500 tokens/1000 * 0,001 USD = 0,002 USD

    Precios de la personalización (ajuste preciso)

    Un desarrollador de aplicaciones personaliza el modelo Llama 2 Pretrained (70B) con 1000 tokens de datos. Tras el entrenamiento, utiliza el rendimiento aprovisionado por un modelo personalizado durante 1 hora para evaluar el rendimiento del modelo. El modelo con ajuste preciso se almacena durante 1 mes. Tras la evaluación, el desarrollador utiliza el rendimiento aprovisionado (compromiso de 1 mes) para alojar el modelo personalizado.

    Costo mensual incurrido para realizar el ajuste preciso = entrenamiento del ajuste preciso (0,00799 USD * 1000) + almacenamiento mensual de los modelos personalizados (1,95 USD) + 1 hora de inferencia de modelos personalizados (23,50 USD) = 33,44 USD

    El costo mensual incurrido por el rendimiento aprovisionado (plazo de compromiso de 1 mes) del modelo personalizado es de 21,18 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo Llama 2 de Meta con un compromiso de 1 mes para su caso de uso de resúmenes de texto.

    Costo total mensual incurrido = 1 unidad de modelo * 21,18 USD * 24 horas * 31 días = 15 757,92 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mistral 7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00015 USD + 1000 tokens/1000 * 0,0002 USD = 0,0005 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock cada una hora: una solicitud al modelo Mixtral 8x7B para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens.

    Costo total por hora = 2000 tokens/1000 * 0,00045 USD + 1000 tokens/1000 * 0,0007 USD = 0,0016 USD

    Un desarrollador de aplicaciones hace las siguientes llamadas a la API a Amazon Bedrock cada hora: una solicitud al modelo Mistral Large para resumir una entrada de 2000 tokens de texto de entrada en una salida de 1000 tokens. 

    Costo total por hora = 2000 tokens/1000 * 0,008 USD + 1000 tokens/1000 * 0,024 USD = 0,04 USD

  • Ejemplo 1 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que un trabajador califique cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”).

    Habrá 50 tareas en este trabajo de evaluación (un conjunto de tareas por cada par de solicitud y respuesta por trabajador). Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,004 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,04 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             50 0,21 USD 10,50 USD 10,50 USD
    Total                   11,06 USD

    Ejemplo 2 de evaluación del modelo:

    Precios bajo demanda
    Un desarrollador de aplicaciones envía un conjunto de datos para la evaluación de modelos realizada por humanos mediante Anthropic Claude 2.1 y Anthropic Claude Instant en la región de AWS Este de EE. UU. (Norte de Virginia).

    El conjunto de datos contiene 50 solicitudes y el desarrollador requiere que dos trabajadores califiquen cada conjunto de solicitudes y respuestas (se puede configurar en la creación del trabajo de evaluación como parámetro “trabajadores por solicitud”). Este trabajo de evaluación constará de 100 tareas (1 por cada conjunto de solicitud y respuesta por cada trabajador: 2 trabajadores x 50 conjuntos de solicitud y respuesta = 100 tareas humanas).

    Las 50 solicitudes se combinan en 5000 tokens de entrada, y las respuestas asociadas se combinan en 15 000 tokens para Anthropic Claude Instant y 20 000 tokens para Anthropic Claude 2.1.

    Se incurre en los siguientes cargos por este trabajo de evaluación del modelo:

    Elemento Número de tokens de entrada Precio por cada 1000 tokens de entrada Costo de entrada Número de tokens de salida Precio por cada 1000 tokens de salida Costo de salida Número de tareas humanas Precio por tarea humana Costo de las tareas humanas Total
    Inferencia de Claude Instant 5000 0,0008 USD 0,0040 USD 15 000 0,0024 USD 0,036 USD       0,04 USD
    Inferencia de Claude 2.1 5000 0,008 USD 0,0400 USD 20 000 0,024 USD 0,48 USD       0,52 USD
    Tareas humanas             100 0,21 USD 21,00 USD 21,00 USD
    Total                   21,56 USD
  • Ejemplo: resumen de noticias
    Un desarrollador de aplicaciones crea una petición para resumir las noticias para los operadores que usan Claude 3.5. La petición original incluye 429 tokens. La petición optimizada tiene 511 tokens e incluye instrucciones y ejemplos más específicos para que los modelos fundacionales generen respuestas más concisas. Usa la petición optimizada con 511 tokens como entrada para el optimizador de peticiones y crea 2 variantes nuevas para Claude 3.7 y Nova Pro con 582 y 579 tokens.

    La cantidad total de tokens de entrada y salida para la optimización de peticiones es: 429 + 511 + 511 + 582 + 511 + 579 = 3123

    La factura mensual total es: 3123 / 1000 * 0,03 USD = 0,09 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL para generar una imagen de 512 x 512 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,036 USD por imagen = 0,036 USD

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo SDXL 1.0 para generar una imagen de 1024 x 1024 con un tamaño de paso de 70 (calidad premium).

    Costo total incurrido = 1 imagen * 0,08 USD por imagen = 0,08 USD

    Precios del rendimiento aprovisionado

    Un desarrollador de aplicaciones compra una unidad de modelo de SDXL 1.0 con un compromiso de 1 mes.

    Costo total incurrido = 1 * 49,86 USD * 24 horas * 31 días = 37 095,84 USD

  • Precios bajo demanda

    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Pegasus 1.2 para describir lo que implica un video de 10 segundos de duración, que proporciona una salida de 2000 tokens.

    Costo total incurrido = 10 segundos * 0,00049 USD + 2000 tokens / 1000 * 0,0075 = USD = 0,0199 USD


    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed [3.0 o 2.7] para incrustar 10 vídeos, con una duración combinada de 100 minutos.

    Coste total incurrido = 100 minutos (es decir, 6000 segundos) * 0,00070 USD = 4,2 USD


    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed 3.0 para que, al proporcionar un texto y una imagen juntos, genere una incrustación que pueda usar para encontrar el clip que tiene la bolsa que se muestra en la imagen dada, en el repositorio de incrustaciones que habría creado con el ejemplo anterior. 

    Coste total incurrido = 1 solicitud de texto * 0,00007 USD +1 solicitud de imagen * 0,0001 USD = 0,00017 USD


    Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Marengo Embed [3.0 o 2.7] para proporcionar un texto para generar una incrustación que pueda usar para encontrar clips coincidentes en el repositorio de incrustaciones que habría creado con el ejemplo anterior. 

    Coste total incurrido = 1 solicitud de texto * 0,00007 = 0,00007 USD

  • Un desarrollador de aplicaciones realiza las siguientes llamadas a la API a Amazon Bedrock: una solicitud al modelo Palmyra X5 de Writer para resumir una entrada de 10 000 tokens de texto de entrada en una salida de 2000 tokens.

    Costo total incurrido = 10 000 tokens/1000 * 0,003 USD + 2000 tokens/1000 * 0,015 USD = 0,06 USD