Amazon Bedrock

  • Prezzi del modello
  • Prezzi del modello

    Il prezzo dipende dalla modalità, dal fornitore e dal modello. Seleziona il fornitore del modello per visualizzare i prezzi dettagliati.

    Amazon Bedrock supporta diversi livelli, tra cui Standard, Flex, Priority e Reserved. Fai clic per saperne di più sui livelli di servizio.

    Amazon Bedrock offre modelli di fondazione (FM) selezionati dei principali fornitori di IA come Anthropic, Meta, Mistral AI e Amazon per l’inferenza in batch a un prezzo inferiore del 50% rispetto ai prezzi di inferenza on demand. Per saperne di più su Batch, fai clic qui. Consulta l’elenco dei modelli qui

    • AI21 Labs
    • AI21 Labs

      Prezzi on demand

    • Amazon
      • Amazon Nova
      • Amazon Nova

        Prezzi dei Modelli di comprensione

        Inferenza interregionale globale

        Inferenza geografica interregionale e nella regione

        Strumenti integrati

        Prezzi per i modelli di generazione di contenuti creativi

        Prezzi per i modelli di comprensione e generazione vocale

        Prezzi on demand per i modelli di fondazione di sintesi vocale

        Nota: *I prezzi per i token di testo in input e output si applicano a casi d’uso specifici, come la trascrizione speech-to-text, la chiamata di strumenti per completare attività o per il knowledge grounding, l’aggiunta della cronologia delle conversazioni alla sessione, ecc. 

        L’inferenza on demand per i modelli Nova personalizzati ha il medesimo prezzo dell’inferenza Nova di base.

        Prezzi per i modelli di embedding

      • Amazon Titan
      • Amazon Titan

      • Altro Amazon
    • Anthropic
    • Anthropic

      Prezzi on demand e in batch

      Modelli con accesso esteso

      Provider Nome modello Regioni Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output Prezzo per 1 milione di token di input (batch) Prezzo per 1 milione di token di output (batch) Prezzo per 1 milione di token di input (scrittura nella cache) Prezzo per 1 milione di token di input (lettura della cache)
       Anthropic  Claude 3.5 Sonnet (accesso pubblico esteso, in vigore dal 1° dicembre 2025) Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Stati Uniti occidentali (Oregon), Europa (Francoforte), Europa (Irlanda), Europa (Zurigo), Europa (Parigi) 6,00 USD 30,00 USD 3,00 USD 15,00 USD N/D N/D
      Anthropic  Claude 3.5 Sonnet v2 (accesso pubblico esteso, in vigore dal 1° dicembre 2025) Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio), Stati Uniti occidentali (Oregon) 6,00 USD 30,00 USD 3,00 USD 15,00 USD 7,50 USD 0,60 USD

      Prezzi del livello Reserved

      Inferenza ottimizzata per la latenza

      Prezzi del throughput assegnato

      Per i prezzi del throughput assegnato, contatta il team del tuo account.

    • Cohere
    • Cohere

      Prezzi on demand

      Modelli Cohere Prezzo per 1.000 query**
      Rerank 3.5 2,00 USD
      **Ti viene addebitato il numero di query in cui una query può contenere fino a 100 blocchi di documenti. Se la query contiene più di 100 blocchi di documenti, viene conteggiata come query multipla. Ad esempio, se una richiesta contiene 350 documenti, verrà considerata come 4 query. Tieni presente che ogni documento può contenere solo fino a 500 token (inclusi i token totali della query e del documento) e, se la lunghezza del token è superiore a 512 token, viene suddiviso in più documenti.

      Prezzi per la personalizzazione (messa a punto)

      *Token totali addestrati = numero di token nel corpus di dati di addestramento x numero di epoch

      Prezzi del throughput fornito

      Modelli Cohere Prezzo orario per modello 
      senza impegno
      Prezzo orario per unità modello con impegno di 1 mese

      Prezzo orario per unità modello con impegno di 6 mesi

      Cohere Command

      49,50 USD

      39,60 USD

      23,77 USD

      Cohere Command - Light 8,56 USD

      6,85 USD

      4,11 USD
      Embed 3 inglese 7,12 USD

      6,76 USD

      6,41 USD
      Embed 3 multilingue 7,12 USD

      6,76 USD

      6,41 USD

      Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello. 

    • DeepSeek
    • DeepSeek

      Prezzi on demand

      • Standard
      • Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

        Modelli DeepSeek Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        DeepSeek v3.2 0,62 USD 1,85 USD

        Regioni: Asia Pacifico (Mumbai), Sud America (San Paolo), Asia Pacifico (Giacarta), Asia Pacifico (Tokyo) ed Europa (Stoccolma)

        Modelli DeepSeek Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        DeepSeek v3.2 0,74 USD 2,22 USD

        Regione: Asia Pacifico (Sydney)

        Modelli DeepSeek Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        DeepSeek v3.1 0,5974 USD 1,7304 USD
        DeepSeek v3.2 0,6386 USD 1,9055 USD
      • Priority
      • Regione: Asia Pacifico (Sydney)

        Modelli DeepSeek Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        DeepSeek v3.1 1,0455 USD 3,0282 USD
      • Flex
      • Regione: Asia Pacifico (Sydney)

        Modelli DeepSeek Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        DeepSeek v3.1 0,2987 USD 0,8652 USD
    • Google
    • Google

      Prezzi on-demand

      Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

      Modelli Google Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Gemma 3 4B 0,04 USD 0,08 USD
      Gemma 3 12B 0,09 USD 0,29 USD
      Gemma 3 27B 0,23 USD 0,38 USD

      Regioni: Asia Pacifico (Mumbai), Europa (Irlanda) ed Europa (Milano)

      Modelli Google Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Gemma 3 4B 0,05 USD 0,09 USD
      Gemma 3 12B 0,11 USD 0,34 USD
      Gemma 3 27B 0,27 USD 0,45 USD

      Regioni: Sud America (San Paolo) e Asia Pacifico (Tokyo)

      Modelli Google Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Gemma 3 4B 0,05 USD 0,10 USD
      Gemma 3 12B 0,11 USD 0,35 USD
      Gemma 3 27B 0,28 USD 0,46 USD

      Regione: Europa (Londra)

      Modelli Google Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Gemma 3 4B 0,06 USD 0,12 USD
      Gemma 3 12B 0,14 USD 0,45 USD
      Gemma 3 27B 0,36 USD 0,59 USD

      Regione: Asia Pacifico (Sydney)

      Modelli Google Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Gemma 3 4B 0,0412 USD 0,0824 USD
      Gemma 3 12B 0,0927 USD 0,2987 USD
      Gemma 3 27B 0,2369 USD 0,3914 USD

      * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
      * I prezzi del livello Flex sono scontati del 50% rispetto ai prezzi del livello Standard

    • Luma AI
    • Prezzi on demand

    • Meta
    • Meta

      Llama 4

      Prezzi on demand e in batch

      Llama 3.3

      Prezzi su richiesta e in batch

      Llama 3.2

      Prezzi on demand e in batch

      Prezzo per la personalizzazione del modello (fine-tuning)

      Prezzi del throughput con provisioning

      Llama 3.1

      Prezzi su richiesta e in batch

      Prezzi per la personalizzazione del modello (messa a punto)

      Prezzi del throughput assegnato

      Llama 3

      Prezzi on demand

      Llama 2

      Prezzi on demand

      Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Modelli Meta Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output

      Chat Llama 2 (13B)

      0,75 USD

      1,00 USD

      Chat Llama 2 (70B)

      1,95 USD

      2,56 USD

      Prezzo per la personalizzazione del modello (fine-tuning)

      Modelli Meta Prezzo per l’addestramento di 1 milione di token Prezzo per l’archiviazione di ogni modello personalizzato* al mese Prezzo da dedurre da un modello personalizzato per 1 unità modello all’ora (con prezzi del throughput assegnato senza impegno)

      Llama 2 Pretrained (13B)

      1,49 USD

      1,95 USD

      23,50 USD

      Llama 2 Pretrained (70B)

      7,99 USD

      1,95 USD 23,50 USD

      *Archiviazione per modelli personalizzati = 1,95 USD

      Prezzi del throughput fornito

      Meta modelli Prezzo orario per unità modello con impegno di 1 mese Prezzo orario per unità modello con impegno di 6 mesi

      Llama 2 Preaddestrato e Chat (13B)

      21,18 USD

      13,08 USD

      Llama 2 Preaddestrato (70B)

      21,18 USD

      13,08 USD

      *I modelli preaddestrati di Llama 2 sono disponibili solo in provisioned throughput previa personalizzazione.

      Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

    • MiniMax AI
    • MiniMax AI

      Prezzi on-demand

      Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2 0,30 USD 1,20 USD
      Minimax M2.1 0,30 USD 1,20 USD

      Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2.5 0,30 USD 1,20 USD

      Regioni: Asia Pacifico (Mumbai), Europa (Irlanda) ed Europa (Milano)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2 0,35 USD 1,41 USD
      Minimax M2.1 0,36 USD 1,44 USD

      Regioni: Sud America (San Paolo) e Asia Pacifico (Tokyo)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2 0,36 USD 1,45 USD
      Minimax M2.1 0,36 USD 1,44 USD

      Regione: Europa (Londra)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2 0,47 USD 1,86 USD
      Minimax M2.1 0,47 USD 1,86 USD

      Regioni: Europa (Francoforte), Europa (Stoccolma), Asia Pacifico (Giacarta)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2.1 0,36 USD 1,44 USD

      Regione: Asia Pacifico (Sydney)

      Modelli Minimax Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Minimax M2 0,3090 USD 1,2360 USD
      Minimax M2.1 0,3090 USD 1,2360 USD

      * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
      * I prezzi del livello Flex sono scontati del 50% rispetto ai prezzi del livello Standard

    • Mistral AI
    • Mistral AI

      Prezzi on-demand

      Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,40 USD 2,00 USD
      Magistral Small 1.2
      0,50 USD 1,50 USD
      Voxtral Mini 1.0
      0,04 USD 0,04 USD
      Voxtral Small 1.0
      0,10 USD 0,30 USD
      Ministral 3B 3.0
      0,10 USD 0,10 USD
      Ministral 8B 3.0
      0,15 USD 0,15 USD
      Ministral 14B 3.0
      0,20 USD 0,20 USD
      Mistral Large 3 0,50 USD 1,50 USD

      Regioni: Asia Pacifico (Mumbai)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,48 USD 2,40 USD
      Magistral Small 1.2
      0,59 USD 1,76 USD
      Voxtral Mini 1.0
      0,05 USD 0,05 USD
      Voxtral Small 1.0
      0,12 USD 0,35 USD
      Ministral 3B 3.0
      0,12 USD 0,12 USD
      Ministral 8B 3.0
      0,18 USD 0,18 USD
      Ministral 14B 3.0
      0,24 USD 0,24 USD
      Mistral Large 3 0,59 USD 1,76 USD

      Regioni: Sud America (San Paolo) e Asia Pacifico (Tokyo)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,48 USD 2,40 USD
      Magistral Small 1.2
      0,61 USD 1,82 USD
      Voxtral Mini 1.0
      0,05 USD 0,05 USD
      Voxtral Small 1.0
      0,12 USD 0,36 USD
      Ministral 3B 3.0
      0,12 USD 0,12 USD
      Ministral 8B 3.0
      0,18 USD 0,18 USD
      Ministral 14B 3.0
      0,24 USD 0,24 USD
      Mistral Large 3 0,61 USD 1,82 USD

      Regioni: Europa (Irlanda) ed Europa (Milano)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,48 USD 2,40 USD
      Magistral Small 1.2
      0,59 USD 1,76 USD
      Voxtral Mini 1.0
      0,05 USD 0,05 USD
      Voxtral Small 1.0
      0,12 USD 0,35 USD
      Ministral 3B 3.0
      0,12 USD 0,12 USD
      Ministral 8B 3.0
      0,18 USD 0,18 USD
      Ministral 14B 3.0
      0,24 USD 0,24 USD

      Regione: Europa (Londra)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,62 USD 3,10 USD
      Magistral Small 1.2
      0,78 USD 2,33 USD
      Voxtral Mini 1.0
      0,06 USD 0,06 USD
      Voxtral Small 1.0
      0,16 USD 0,47 USD
      Ministral 3B 3.0
      0,16 USD 0,16 USD
      Ministral 8B 3.0
      0,23 USD 0,23 USD
      Ministral 14B 3.0
      0,31 USD 0,31 USD

      Regione: Asia Pacifico (Sydney)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,41 USD 2,06 USD
      Magistral Small 1.2
      0,5150 USD 1,5450 USD
      Voxtral Mini 1.0
      0,0412 USD 0,0412 USD
      Voxtral Small 1.0
      0,1030 USD 0,3090 USD
      Ministral 3B 3.0
      0,1030 USD 0,1030 USD
      Ministral 8B 3.0
      0,1545 USD 0,1545 USD
      Ministral 14B 3.0
      0,2060 USD 0,2060 USD
      Mistral Large 3 0,5150 USD 1,5450 USD

      Regioni: Asia Pacifico (Giacarta), Europa (Francoforte), Europa (Stoccolma)

      Modelli Mistral Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Devstral 2 135B 0,48 USD 2,40 USD

      * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
      * I prezzi del livello Flex sono scontati del 50% rispetto ai prezzi del livello Standard

    • Moonshot AI
    • Moonshot AI

      Prezzi on demand

      Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

      Modelli Kimi Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Kimi K2 Thinking 0,60 USD 2,50 USD
      Kimi K2.5 0,60 USD 3,00 USD

      Regione: Asia Pacifico (Mumbai)

      Modelli Kimi Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Kimi K2 Thinking 0,71 USD 2,94 USD
      Kimi K2.5 0,72 USD 3,60 USD

      Regioni: Sud America (San Paolo) e Asia Pacifico (Tokyo)

      Modelli Kimi Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Kimi K2 Thinking 0,73 USD 3,03 USD
      Kimi K2.5 0,72 USD 3,60 USD

      Regioni: Europa (Stoccolma), Asia Pacifico (Giacarta)

      Modelli Kimi Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Kimi K2.5 0,72 USD 3,60 USD

      Regione: Asia Pacifico (Sydney)

      Modelli Kimi Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Kimi K2 Thinking 0,6180 USD 2,5750 USD
      Kimi K2.5 0,6180 USD 3,0900 USD

      * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
      * I prezzi del livello Flex sono scontati del 50% rispetto ai prezzi del livello Standard

    • NVIDIA
    • NVIDIA

      Prezzi on-demand

      Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

      Modelli NVIDIA Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      NVIDIA Nemotron Nano 2 0,06 USD 0,23 USD
      NVIDIA Nemotron Nano 2 VL 0,20 USD 0,60 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,06 USD 0,24 USD

      Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

      Modelli NVIDIA Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      NVIDIA Nemotron 3 Super 120B A12B 0,15 USD 0,65 USD

      Regioni: Asia Pacifico (Mumbai), Europa (Irlanda) ed Europa (Milano)

      Modelli NVIDIA Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      NVIDIA Nemotron Nano 2 0,07 USD 0,27 USD
      NVIDIA Nemotron Nano 2 VL 0,24 USD 0,71 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,28 USD

      Regioni: Sud America (San Paolo) e Asia Pacifico (Tokyo)

      Modelli NVIDIA Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      NVIDIA Nemotron Nano 2 0,07 USD 0,28 USD
      NVIDIA Nemotron Nano 2 VL 0,24 USD 0,73 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,07 USD 0,29 USD

      Regione: Europa (Londra)

      Modelli NVIDIA Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      NVIDIA Nemotron Nano 2 0,09 USD 0,36 USD
      NVIDIA Nemotron Nano 2 VL 0,31 USD 0,93 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,09 USD 0,37 USD

      Regione: Asia Pacifico (Sydney)

      Modelli NVIDIA Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      NVIDIA Nemotron Nano 2 0,0618 USD 0,2369 USD
      NVIDIA Nemotron Nano 2 VL 0,2060 USD 0,6180 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0,0618 USD 0,2472 USD

      * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
      * I prezzi dei livelli Flex e Batch sono scontati del 50% rispetto ai prezzi del livello Standard

    • OpenAI
    • OpenAI

      • gpt-oss-20b, 120b
        • Standard
        • Regione: Asia Pacifico (Sydney)

          Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          gpt-oss-20b 0,0721 USD 0,3090 USD
          gpt-oss-120b 0,1545 USD 0,6180 USD
        • Priority
        • Regione: Asia Pacifico (Sydney)

          Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          gpt-oss-20b 0,1262 USD 0,5408 USD
          gpt-oss-120b 0,2704 USD 1,0815 USD
        • Flex
        • Regione: Asia Pacifico (Sydney)

          Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          gpt-oss-20b 0,0361 USD 0,1545 USD
          gpt-oss-120b 0,0773 USD 0,3090 USD
        • Batch
        • Regione: Asia Pacifico (Sydney)

          Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          gpt-oss-20b 0,0361 USD 0,1545 USD
          gpt-oss-120b 0,0773 USD 0,3090 USD
        • Personalizzazione del modello
        • Personalizzazione del modello

          Prezzi del fine-tuning per rinforzo

          Con la funzionalità di fine-tuning per rinforzo su Amazon Bedrock, puoi migliorare la precisione del modello senza bisogno di esperienza nel machine learning o di ingenti quantità di dati etichettati. Amazon Bedrock automatizza il flusso di lavoro del fine-tuning per rinforzo: prende i tuoi prompt campione, genera risposte modello e assegna loro un punteggio utilizzando la tua funzione di ricompensa. Questi prompt, risposte e punteggi vengono quindi utilizzati per addestrare il modello personalizzato attraverso un flusso di lavoro RFT iterativo. 

          L’intero flusso di lavoro viene fatturato a una tariffa oraria. Al termine dell’addestramento, i clienti possono utilizzare immediatamente il modello ottimizzato risultante per l’inferenza on demand. L’opzione di inferenza on demand include un modello di prezzi basato su token, che addebita i costi in base al numero di token elaborati durante l’inferenza.

          Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

          Modelli OpenAI Prezzo per ore di addestramento Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output Prezzo per l’archiviazione di ogni modello addestrato al mese
          gpt-oss-20b 80,00 USD 0,09 USD 0,39 USD 1,95 USD
      • gpt-oss-safeguard 20b, 120b
      • Prezzi on demand

        Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

        Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GPT OSS Safeguard 20B 0,07 USD 0,20 USD
        GPT OSS Safeguard 120B 0,15 USD 0,60 USD

        Regioni: Asia Pacifico (Mumbai), Sud America (San Paolo) e Asia Pacifico (Tokyo)

        Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GPT OSS Safeguard 20B 0,08 USD 0,24 USD
        GPT OSS Safeguard 120B 0,18 USD 0,71 USD

        Regioni: Europa (Irlanda) ed Europa (Milano)

        Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GPT OSS Safeguard 20B 0,08 USD 0,23 USD
        GPT OSS Safeguard 120B 0,18 USD 0,70 USD

        Regione: Europa (Londra)

        Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GPT OSS Safeguard 20B 0,11 USD 0,31 USD
        GPT OSS Safeguard 120B 0,23 USD 0,93 USD

        Regione: Asia Pacifico (Sydney)

        Modelli OpenAI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GPT OSS Safeguard 20B 0,0721 USD 0,2060 USD
        GPT OSS Safeguard 120B 0,1545 USD 0,6180 USD

        * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
        * I prezzi dei livelli Flex e Batch sono scontati del 50% rispetto ai prezzi del livello Standard.

    • Qwen
    • Amazon Bedrock

      Qwen

      • Qwen3 Coder, 32B, 235B
        • Standard
        • Regione: Asia Pacifico (Sydney)

          Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          Qwen3 Coder 30B A3B 0,1545 USD 0,6180 USD
          Qwen3 32B 0,1545 USD 0,6180 USD
          Qwen3 235B A22B 2507 0,2266 USD 0,9064 USD
        • Priority
        • Regione: Asia Pacifico (Sydney)

          Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          Qwen3 Coder 30B A3B 0,2704 USD 1,0815 USD
          Qwen3 32B 0,2704 USD 1,0815 USD
          Qwen3 235B A22B 2507 0,3966 USD 1,5862 USD
        • Flex
        • Regione: Asia Pacifico (Sydney)

          Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD
          Qwen3 32B 0,0773 USD 0,3090 USD
          Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD
        • Batch
        • Regione: Asia Pacifico (Sydney)

          Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
          Qwen3 Coder 30B A3B 0,0773 USD 0,3090 USD
          Qwen3 32B 0,0773 USD 0,3090 USD
          Qwen3 235B A22B 2507 0,1133 USD 0,4532 USD
        • Personalizzazione del modello
        • Personalizzazione del modello

          Prezzi del fine-tuning per rinforzo

          Con la funzionalità di fine-tuning per rinforzo su Amazon Bedrock, puoi migliorare la precisione del modello senza bisogno di esperienza nel machine learning o di ingenti quantità di dati etichettati. Amazon Bedrock automatizza il flusso di lavoro del fine-tuning per rinforzo: prende i tuoi prompt campione, genera risposte modello e assegna loro un punteggio utilizzando la tua funzione di ricompensa. Questi prompt, risposte e punteggi vengono quindi utilizzati per addestrare il modello personalizzato attraverso un flusso di lavoro RFT iterativo.

          L’intero flusso di lavoro viene fatturato a una tariffa oraria. Al termine dell’addestramento, i clienti possono utilizzare immediatamente il modello ottimizzato risultante per l’inferenza on demand. L’opzione di inferenza on demand include un modello di prezzi basato su token, che addebita i costi in base al numero di token elaborati durante l’inferenza.

          Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

          Modelli Qwen Prezzo per ore di addestramento Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output Prezzo per l’archiviazione di ogni modello addestrato al mese
          Qwen3 32B 80,00 USD 0,20 USD 0,78 USD 1,95 USD
      • Qwen 3 Next, VL, Coder Next
      • Prezzi on demand

        Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

        Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        Qwen3 Next 80B A3B 0,15 USD 1,20 USD
        Qwen3 VL 235B A22B 0,53 USD 2,66 USD
        Qwen3 Coder Next 0,50 USD 1,20 USD

        Regioni: Asia Pacifico (Mumbai), Europa (Irlanda) ed Europa (Milano)

        Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        Qwen3 Next 80B A3B 0,18 USD 1,41 USD
        Qwen3 VL 235B A22B 0,62 USD 3,13 USD
        Qwen3 Coder Next 0,60 USD 1,44 USD

        Regioni: Sud America (San Paolo) e Asia Pacifico (Tokyo)

        Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        Qwen3 Next 80B A3B 0,18 USD 1,45 USD
        Qwen3 VL 235B A22B 0,64 USD 3,22
        Qwen3 Coder Next 0,60 USD 1,44 USD

        Regione: Europa (Londra)

        Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        Qwen3 Next 80B A3B 0,23 USD 1,86 USD
        Qwen3 VL 235B A22B 0,82 USD 4,12 USD
        Qwen3 Coder Next 0,78 USD 1,86 USD

        Regioni: Europa (Francoforte) e Asia Pacifico (Giacarta)

        Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        Qwen3 Coder Next 0,60 USD 1,44 USD

        Regione: Asia Pacifico (Sydney)

        Modelli Qwen Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        Qwen3 Next 80B A3B 0,1545 USD 1,2360 USD
        Qwen3 VL 235B A22B 0,5459 USD 2,7398 USD
        Qwen3 Coder Next 0,5150 USD 1,2360 USD

        * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
        * I prezzi dei livelli Flex e Batch sono scontati del 50% rispetto ai prezzi del livello Standard.

    • Stability AI
    • Stability AI

      Prezzi on demand

      La precedente generazione di modelli di immagine offerti da Stability AI ha un prezzo per immagine, che dipende dal numero di passaggi e dalla risoluzione dell’immagine.

       

      Regione: Oregon, Virginia settentrionale, Ohio

      Stability AI Image Services Prezzo per generazione per ogni modello  
      Rimozione sfondo immagine stabile 0,07 USD  
      Cancellazione oggetto immagine stabile 0,07 USD  
      Struttura di controllo immagine stabile 0,07 USD  
      Schizzo di controllo immagine stabile 0,07 USD  
      Guida allo stile immagine stabile 0,07 USD  
      Ricerca e sostituzione immagine stabile 0,07 USD  
      Inpainting immagine stabile 0,07 USD  
      Ricerca e ricolorazione immagine stabile 0,07 USD  
      Trasferimento stile immagine stabile 0,08 USD  
      Ridimensionamento conservativo immagine stabile 0,40 USD  
      Ridimensionamento creativo immagine stabile 0,60 USD  
      Ridimensionamento veloce immagine stabile 0,03 USD  
      Outpainting immagine stabile 0,06 USD  
    • TwelveLabs
    • TwelveLabs

      Prezzi on-demand

      • Inferenza multiregionale globale
      • Inferenza multiregionale a livello geografico e nella regione
    • Writer
    • Writer

      Prezzi on demand

      Modelli Writer Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
      Palmira X4 2,50 USD 10,00 USD
      Palmira X5 0,60 USD 6,00 USD
    • Z AI
    • Amazon Bedrock

      Z AI

      • GLM 5
      • Prezzi on demand

        Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 5 1,00 USD 3,20 USD

        * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
        * I prezzi dei livelli Flex e Batch sono scontati del 50% rispetto ai prezzi del livello Standard.

      • GLM 4.7
      • Prezzi on demand

        Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 0,60 USD 2,20 USD

        Regioni: Asia Pacifico (Giacarta), Asia Pacifico (Mumbai), Asia Pacifico (Tokyo), Sud America (San Paolo) ed Europa (Stoccolma)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 0,72 USD 2,64 USD

        Regione: Asia Pacifico (Sydney)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 0,6180 USD 2,2660 USD

        * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
        * I prezzi dei livelli Flex e Batch sono scontati del 50% rispetto ai prezzi del livello Standard.

      • GLM 4.7 Flash
      • Prezzi on demand

        Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 Flash 0,07 USD 0,40 USD

        Regioni: Asia Pacifico (Giacarta), Asia Pacifico (Mumbai), Asia Pacifico (Tokyo), Europa (Francoforte), Europa (Irlanda), Europa (Milano), Europa (Stoccolma) e Sud America (San Paolo)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 Flash 0,08 USD 0,48 USD

        Regione: Europa (Londra)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 Flash 0,11 USD 0,62 USD

        Regione: Asia Pacifico (Sydney)

        Modelli Z AI Prezzo per 1 milione di token di input Prezzo per 1 milione di token di output
        GLM 4.7 Flash 0,0721 USD 0,4120 USD

        * I prezzi del livello Priority sono superiori del 75% rispetto ai prezzi del livello Standard
        * I prezzi dei livelli Flex e Batch sono scontati del 50% rispetto ai prezzi del livello Standard.

    • Importazione di modelli personalizzati
    • Importazione di modelli personalizzati

      • Llama
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,05718 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Regione: Europa (Francoforte) 

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,07144 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

      • Lama multimodale
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,05718 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Regione: Europa (Francoforte) 

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,07144 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

      • Mistral
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,05718 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Regione: Europa (Francoforte) 

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,07144 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

      • Mixtral
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,05718 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Regione: Europa (Francoforte) 

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,07144 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

      • Flan
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,05718 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Regione: Europa (Francoforte) 

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,07144 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

        Prezzi di inferenza on demand:
        La fatturazione viene effettuata in finestre di 5 minuti per la durata in cui la copia del modello è attiva a partire dalla prima invocazione avvenuta con successo. Il limite massimo di throughput e concorrenza per copia del modello dipende da fattori quali la combinazione di token di input/output, il tipo di hardware, le dimensioni del modello, l’architettura, le ottimizzazioni dell’inferenza e viene determinato durante il flusso di lavoro di importazione del modello.

        Bedrock scala automaticamente il numero di copie del modello in base ai modelli di utilizzo. Se non ci sono invocazioni per un periodo di 5 minuti, Bedrock si ridurrà verticalmente a zero per poi scalare nuovamente verso l’alto quando il modello verrà invocato. Durante il processo di aumento verticale, è possibile che si verifichi una durata dell’avvio a freddo (in decine di secondi) a seconda delle dimensioni del modello. Bedrock aumenta verticalmente anche il numero di copie del modello se il volume di inferenza supera costantemente i limiti di concorrenza di una singola copia del modello. Nota: per impostazione predefinita, è previsto un massimo di 3 copie del modello per account per modello importato che è possibile aumentare tramite Service Quotas.

      • Qwen
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,05718 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Regione: Europa (Francoforte) 

        Versione unità di modello personalizzate v1.0
        Prezzo per unità di modello personalizzato al minuto* 0,07144 USD
        Costo mensile di archiviazione per unità di modello personalizzato 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

        Prezzi di inferenza on demand:
        La fatturazione viene effettuata in finestre di 5 minuti per la durata in cui la copia del modello è attiva a partire dalla prima invocazione avvenuta con successo. Il limite massimo di throughput e concorrenza per copia del modello dipende da fattori quali la combinazione di token di input/output, il tipo di hardware, le dimensioni del modello, l’architettura, le ottimizzazioni dell’inferenza e viene determinato durante il flusso di lavoro di importazione del modello.

        Bedrock scala automaticamente il numero di copie del modello in base ai modelli di utilizzo. Se non ci sono invocazioni per un periodo di 5 minuti, Bedrock si ridurrà verticalmente a zero per poi scalare nuovamente verso l’alto quando il modello verrà invocato. Durante il processo di aumento verticale, è possibile che si verifichi una durata dell’avvio a freddo (in decine di secondi) a seconda delle dimensioni del modello. Bedrock aumenta verticalmente anche il numero di copie del modello se il volume di inferenza supera costantemente i limiti di concorrenza di una singola copia del modello. Nota: per impostazione predefinita, è previsto un massimo di 3 copie del modello per account per modello importato che è possibile aumentare tramite Service Quotas.

      • OpenAI
      • Regioni: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

        Versione unità di modello personalizzata v2.0
        Prezzo per unità di modello personalizzata al minuto* 0,1433 USD
        Costo mensile di archiviazione per unità di modello personalizzata 1,95 USD

        Nota: Le unità di modello personalizzate necessarie per ospitare un modello dipendono da una serie di fattori, in particolare dall’architettura del modello, dal numero di parametri del modello e dalla lunghezza del contesto. Il numero esatto di unità di modello personalizzate necessarie sarà determinato al momento dell’importazione. A titolo di riferimento, il modello Llama 3.1 8B 128K richiede 2 unità di modello personalizzate, mentre il modello Llama 3.1 70B 128k richiede 8 unità di modello personalizzate.

        *Fatturato in intervalli da 5 minuti

        Prezzi di inferenza on demand:
        La fatturazione viene effettuata in finestre di 5 minuti per la durata in cui la copia del modello è attiva a partire dalla prima invocazione avvenuta con successo. Il limite massimo di throughput e concorrenza per copia del modello dipende da fattori quali la combinazione di token di input/output, il tipo di hardware, le dimensioni del modello, l’architettura, le ottimizzazioni dell’inferenza e viene determinato durante il flusso di lavoro di importazione del modello.

        Bedrock scala automaticamente il numero di copie del modello in base ai modelli di utilizzo. Se non ci sono invocazioni per un periodo di 5 minuti, Bedrock si ridurrà verticalmente a zero per poi scalare nuovamente verso l’alto quando il modello verrà invocato. Durante il processo di aumento verticale, è possibile che si verifichi una durata dell’avvio a freddo (in decine di secondi) a seconda delle dimensioni del modello. Bedrock aumenta verticalmente anche il numero di copie del modello se il volume di inferenza supera costantemente i limiti di concorrenza di una singola copia del modello. Nota: per impostazione predefinita, è previsto un massimo di 3 copie del modello per account per ciascun modello importato; è possibile aumentare questo valore tramite Service Quotas.

  • Knowledge base
  • Recupero di dati strutturati (generazione SQL)

    Il recupero dei dati strutturati viene addebitato per ogni richiesta di generazione di una query SQL. La query SQL generata viene utilizzata per recuperare i dati dagli archivi di dati strutturati.

    Modelli Rerank

    I modelli Rerank sono progettati per migliorare la pertinenza e l’accuratezza delle risposte nelle applicazioni generazione potenziata tramite recupero (RAG). Vengono addebitati per query.

    **Ti viene addebitato il numero di query in cui una query può contenere fino a 100 blocchi di documenti. Se la query contiene più di 100 blocchi di documenti, viene conteggiata come query multipla. Ad esempio, se una richiesta contiene 350 documenti, verrà considerata come 4 query. Tieni presente che ogni documento può contenere solo fino a 512 token (inclusi i token totali della query e del documento) e, se la lunghezza del token è superiore a 512 token, viene suddiviso in più documenti. Una query è equivalente a un’unità di ricerca.

  • Guardrail
  • Guardrail per Amazon Bedrock

    Il prezzo di Guardrail per Amazon Bedrock si basa sui costi sostenuti dal filtro usato nel guardrail. Il prezzo è lo stesso sia per il livello standard che per quello classico.

    Filtro guardrail*

    Prezzo

    Filtri di contenuto sia per il livello standard che per quello classico (contenuto testuale)

    0,15 USD per 1.000 unità di testo

    Filtri di contenuto (contenuto di immagini)

    0,00075 USD per immagine elaborata

    Argomenti negati sia per il livello standard che per quello classico

    0,15 USD per 1.000 unità di testo

    Filtri per informazioni sensibili 

    0,10 USD per 1.000 unità di testo

    Filtri per informazioni sensibili (espressione regolare) 

    Gratis

    Filtri per parola

    Gratis

    Verifiche contestuali di base

    0,10 USD per 1.000 unità di testo

    Controlli del ragionamento automatico

    0,17 USD per 1.000 unità di testo per policy di ragionamento automatico

    Prezzi on demand

    *Ogni filtro guardrail è facoltativo e può essere abilitato in base ai requisiti dell’applicazione. I costi verranno addebitati in base al tipo di filtro usato nel guardrail. Ad esempio, se un guardrail è configurato con filtri di contenuto e argomenti negati, verranno addebitati costi per questi due filtri, mentre non ci saranno addebiti associati ai filtri di informazioni sensibili.

    Nota: un’unità di testo può contenere fino a 1.000 caratteri. Se un input di testo è superiore a 1.000 caratteri, viene elaborato come unità di testo multiple, ciascuna contenente fino a 1.000 caratteri. Ad esempio, se un input di testo contiene 5.600 caratteri, verranno addebitate 6 unità di testo.

    La verifica contestuale di base utilizza una fonte di riferimento e una query per stabilire se la risposta del modello si basa sulla fonte ed è pertinente alla query. Il numero totale di unità di testo addebitate viene calcolato combinando tutti i caratteri della fonte, della query e della risposta del modello. 

  • Valutazione del modello
  • Valutazione del modello

    La valutazione del modello viene addebitata per l’inferenza del modello scelto. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione su base umana, in cui l’utente porta il proprio flusso di lavoro, viene addebitato il costo dell’inferenza del modello nella valutazione e un costo di 0,21 USD per ogni attività umana completata.

    Se si utilizza la valutazione RAG o LLM-as-a-Judge nella valutazione del modello, i token utilizzati dal modello giudice vengono addebitati in base ai prezzi di livello Standard on demand. I prompt del giudice vengono addebitati come parte dell’utilizzo del token e sono disponibili nella documentazione pubblica. La valutazione RAG su una knowledge base Bedrock comporta anche gli eventuali costi di utilizzo regolari previsti dalle knowledge base Bedrock.

    Modello

    Prezzo per 1.000 token di input

    Prezzo per 1.000 token di output

    Prezzo per attività umana

     

    Modello selezionato per la valutazione

    In base al modello selezionato

    In base al modello selezionato

     

    0,21 USD

     
  • Automazione dei dati
  • Automazione dei dati

    Automazione dei dati Amazon Bedrock trasforma contenuti multimodali non strutturati in formati di dati strutturati per casi d’uso come l’elaborazione intelligente dei documenti, l’analisi video e la generazione potenziata da recupero dati (RAG). L’Automazione dei dati di Amazon Bedrock è in grado di generare contenuti in output standard utilizzando impostazioni predefinite specifiche della modalità, come descrizioni di video scena per scena, trascrizioni audio o analisi automatizzate dei documenti. I clienti possono inoltre creare output personalizzati specificando i requisiti di output nei blueprint in base al proprio schema di dati che possono quindi caricare facilmente in un database o data warehouse esistente. Attraverso l’integrazione con le knowledge base, Automazione dei dati Amazon Bedrock può essere usata anche per analizzare il contenuto per le applicazioni RAG, migliorando l’accuratezza e la pertinenza dei risultati tramite l’inclusione di informazioni incorporate sia nelle immagini sia nel testo.

    Le Knowledge Base di Amazon Bedrock offrono un’integrazione di Bedrock Data Automation per fornire risposte più pertinenti e accurate per i dati multimodali. Quando configuri una Knowledge Base, puoi selezionare Bedrock Data Automation come metodo di analisi per analizzare ed estrarre informazioni significative da immagini o documenti, che possono includere figure, grafici e diagrammi. Durante l’elaborazione, Bedrock Data Automation estrae informazioni significative dai documenti e dalle immagini inseriti, che vengono poi utilizzate nelle fasi successive della Knowledge Base per la suddivisione in blocchi, l’embedding e l’archiviazione. Se integrato con le Knowledge Base, Bedrock Data Automation fornisce e addebita un output standardizzato.

  • Routing di prompt intelligente
  • Punto di prezzo Dimensione dei prezzi Piano tariffario
    Routing di prompt intelligente 1 USD per 1.000 richieste On demand

    Routing di prompt intelligente

    Il routing di prompt intelligente consente di utilizzare una combinazione di modelli di fondazione (FM) della stessa famiglia di modelli per ottimizzare qualità e costi. Ad esempio, con la famiglia di modelli Claude di Anthropic, Amazon Bedrock può indirizzare in modo intelligente le richieste tra Claude 3.5 Sonnet e Claude 3 Haiku a seconda della complessità del prompt. Allo stesso modo, Amazon Bedrock può indirizzare le richieste tra Meta Llama 3.3 70B e 3.18B e Nova Pro e Nova Lite. Il router di prompt prevede quale modello fornirà le migliori prestazioni per ogni richiesta, contribuendo al contempo a ottimizzare la qualità della risposta e i costi. Ciò è particolarmente utile per applicazioni come gli assistenti del servizio clienti, in cui le domande semplici possono essere gestite da modelli più piccoli, più veloci e più convenienti e le domande complesse vengono indirizzate a modelli più capaci. Il routing di prompt intelligente può ridurre i costi anche del 30% senza compromettere la precisione.

  • Ottimizzazione di prompt
  • Ottimizzazione di prompt per Amazon Bedrock

    L’addebito viene effettuato in base al numero di token nei prompt di input e nei prompt ottimizzati.

    Tutti gli addebiti vengono fatturati mensilmente a partire dal 23 aprile 2025. 

    Prezzo per 1.000 token
    0,030 USD

Esempi di prezzo

  • Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Jurassic-2 Mid di AI21 per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 10.000 token/1.000 x 0,0125 USD + 2.000 token/1.000 x 0,0125 USD = 0,15 USD

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Amazon Titan Text Lite per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,0003 USD + 1.000 token/1.000 x 0,0004 USD = 0,001 USD.

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello base di Amazon Titan Image Generator per generare 1.000 immagini di dimensione 1024 x 1024 di qualità standard.

    Costo totale sostenuto = 1.000 immagini x 0,01 USD per immagine = 10 USD

    Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)

    Uno sviluppatore di applicazioni personalizza un modello Amazon Titan Image Generator utilizzando 1.000 coppie immagine-testo. Dopo l’addestramento, lo sviluppatore utilizza il throughput fornito dal modello personalizzato per un’ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (durata dell’impegno di 1 mese) per ospitare il modello personalizzato.

    Il costo mensile sostenuto per l’ottimizzazione è: formazione sull’ottimizzazione (0,005 USD x 500 x 64), dove 0,005 USD è il prezzo per immagine visualizzata, 500 è il numero di passaggi e 64 è la dimensione del batch + archiviazione del modello personalizzato al mese (1,95 USD) + un’ora di inferenza del modello personalizzato (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista due unità di modello di Amazon Titan Text Express con un vincolo di 1 mese per il suo caso d’uso di riepilogo di testo.

    Costo mensile totale sostenuto: 2 unità di modello x 18,40 USD/ora x 24 ore x 31 giorni = 27.379,20 USD

    Uno sviluppatore di applicazioni acquista un’unità di modello del modello Amazon Titan Image Generator base con un vincolo di 1 mese.

    Costo totale sostenuto = 1 unità di modello x 16,20 USD x 24 ore x 31 giorni = 12.052,80 USD

  • Esempio 1: chatbot per l’assistenza clienti
    Uno sviluppatore di applicazioni crea un chatbot per l’assistenza clienti e utilizza i filtri dei contenuti per bloccare i contenuti dannosi e gli argomenti negati per filtrare domande e risposte indesiderate.

    Il chatbot risponde a 1.000 richieste di utenti all’ora. Ogni richiesta utente ha una lunghezza media di input di 200 caratteri e riceve una risposta FM di 1.500 caratteri.

    Ogni richiesta utente di 200 caratteri corrisponde a 1 unità di testo.

    Ogni risposta FM di 1.500 caratteri corrisponde a 2 unità di testo.

    Unità di testo elaborate ogni ora = (1 + 2) x 1.000 query = 3.000 unità di testo

    Costo totale sostenuto all’ora per i filtri dei contenuti e l’argomento negato = 3000 x (0,15 USD + 0,15 USD)/1000 = 0,90 USD

     

    Esempio 2: riepilogo della trascrizione del call center
    Uno sviluppatore di applicazioni crea un’applicazione per riepilogare le trascrizioni delle chat tra utenti e agenti dell’assistenza. Utilizza un filtro per informazioni sensibili per oscurare le informazioni di identificazione personale (PII) nei riepiloghi generati per 10.000 conversazioni.

    Ogni riepilogo generato ha una media di 3.500 caratteri che corrispondono a 4 unità di testo.

    Costo totale sostenuto per riassumere 10.000 conversazioni = 10.000 x 4 x (0,1/1.000 USD) = 4 USD

     

    Esempio 3: Motore di verifica del protocollo medico
    Un’azienda di tecnologia sanitaria implementa controlli di ragionamento automatico nel proprio sistema di supporto alle decisioni cliniche per convalidare i suggerimenti terapeutici rispetto alle linee guida mediche.

    Il sistema elabora 5.000 casi di pazienti al mese. Ogni caso comporta:

    • Riepilogo dei dati del paziente: 500 caratteri (1 unità di testo)
    • Valutazione diagnostica: 2.000 caratteri (2 unità di testo)
    • Trattamento consigliato: 4.500 caratteri (5 unità di testo)

    Unità di testo elaborate al mese = (1 + 2 + 5) 5.000 casi = 40.000 unità di testo
    Costo totale sostenuto al mese per i controlli di ragionamento automatico = 40.000 (0,17 USD)/1000 = 6,80 USD

     

  • Esempio di prezzo 1 (riposizionamento utilizzando il modello Amazon Rerank 1.0)

    In un dato mese, effettui 2 milioni di richieste all’API Rerank utilizzando il modello Amazon Rerank 1.0: 1 milione di richieste contengono meno di 100 documenti ciascuna e quindi verrà addebitata una richiesta ciascuna. Il restante milione di richieste contiene 120-150 documenti e quindi ogni richiesta sarà addebitata per 2 richieste.

    Prezzo per una richiesta = 0,001 USD
    Addebito totale = 1.000.000 USD x 0,001 USD + 1.000.000 x 2 x 0,001 USD = 3000 USD 

    Esempio di prezzo 2: (recupero di dati strutturati)

    Uno sviluppatore di applicazioni crea un chatbot di supporto che interroga i dati strutturati archiviati in Amazon Redshift. Lo sviluppatore crea una Knowledge Base Bedrock e si connette ad Amazon Redshift. Il chatbot risponde a 10000 query di utenti all’ora. Ogni query utente costerà 0,002 USD per GenerateQuery API per generare SQL dalla query utente.

    Costo totale sostenuto per la generazione di SQL all’ora = 0,002 USD*10000 = 20 USD.
    Costo totale sostenuto nel mese = 20 x 24 x 30 USD = 1.440 USD

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock nella regione Stati Uniti occidentali (Oregon): una richiesta al modello Claude di Anthropic per riepilogare un input di 11.000 token di testo di input in un output di 4.000 token.

    Costo totale sostenuto= 11.000 token/1.000 x 0,008 USD + 4.000 token/1.000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un’unità di modello di Anthropic Claude Instant nella regione Stati Uniti occidentali (Oregon):

    Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 6.000 token/1.000 x 0,0015 USD + 2.000 token/1.000 x 0,0020 USD = 0,013 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command-Light di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 6.000 token/1.000 x 0,0003 USD + 2.000 token/1.000 x 0,0006 USD = 0,003 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Embed inglese o multilingue di Cohere per generare integrazioni per 10.000 token di input.

    Costo totale sostenuto = 10.000 token/1.000 x 0,0001 USD = 0,001 USD

    Prezzi per la personalizzazione (ottimizzazione)

    Uno sviluppatore di applicazioni personalizza un modello Cohere Command utilizzando 1.000 token di dati. Dopo l’addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

    Costo mensile sostenuto per l’ottimizzazione: addestramento di ottimizzazione (0,004 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un’ora di inferenza del modello personalizzato (49,50 USD) = 55,45 USD

    Costo mensile sostenuto per il throughput previsto (impegno di 1 mese) del modello personalizzato = 39,60 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un’unità di modello di Cohere Command con un vincolo di 1 mese per il suo caso d’uso di riepilogo di testo.

    Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD

  • Esempio di prezzo: uno sviluppatore di applicazioni importa un modello di tipo Llama 3.1 personalizzato con una dimensione di 8B di parametri con una lunghezza di sequenza di 128K nella regione us-east-1 ed elimina il modello dopo 1 mese. Ciò richiede 2 unità di modello personalizzate. Il prezzo al minuto sarà, quindi, di 0,1570 USD perché sono necessarie 2 unità di modello personalizzate. I costi di archiviazione del modello per 2 unità di modello personalizzate sono 3,90 USD al mese.

    L’importazione del modello è gratuita. La prima invocazione riuscita è alle 08:03, momento in cui inizia la misurazione. Le finestre di misurazione di 5 minuti sono dalle 08:03 alle 08:07; dalle 08:07 alle 08:11 e così via. Se viene effettuata almeno un’invocazione durante un periodo di 5 minuti, la finestra sarà considerata attiva per la fatturazione. Se viene effettuata un’invocazione alle 08:03 e non ci sono ulteriori invocazioni dopo le 08:07, la misurazione si interromperà alle 08:07. In questo caso, la fattura verrebbe calcolata come segue: 0,1570 USD × 5 minuti × 1 intervallo da cinque minuti = 0,785 USD.

  • Esempio di prezzi 1:
    Supponiamo che tu elabori un documento di 1.000 pagine utilizzando BDA Custom Output. Tutte le 1.000 pagine vengono elaborate utilizzando il blueprint 1 che ha 15 campi. Il prezzo per pagina per qualsiasi blueprint con 30 campi o meno è di 0,040 USD. Il costo totale sarebbe 40 USD.

    Totale pagine elaborate = 1.000
    Prezzo per pagina per i blueprint con meno di 30 campi = 0,040 USD
    Addebito totale = 1,000 USD x 0.040 = 40 USD

     

    Esempio di prezzi 2:
    Supponiamo che tu elabori 2 documenti utilizzando BDA Custom Output. Il documento 1 ha 40 pagine e viene elaborato utilizzando il blueprint 1 che ha 20 campi. Il documento 2 ha 10 pagine e viene elaborato utilizzando il blueprint 2, che ha 40 campi. Il prezzo per pagina del blueprint 1 è di 0,040 USD poiché contiene 30 campi o meno. Il prezzo per pagina del blueprint 2 è di 0,045 USD. Il costo di elaborazione del Documento 1 utilizzando il blueprint 1 è di 1,60 USD. Il costo di elaborazione del Documento 2 utilizzando il blueprint 2 è di 0,45 USD. Il costo totale di elaborazione di entrambi i documenti sarebbe di 2,05 USD.

    Totale pagine elaborate = 50
    Prezzo per pagina per Blueprint 1 con meno di 30 campi = 0,040 USD
    Prezzo per pagina per Blueprint 2 con 40 campi = 0,040 USD + (numero di campi aggiuntivi superiori a 30 x 0,0005 USD per campo)
    Numero di campi aggiuntivi superiori a 30 = 40 - 30 = 10
    Prezzo per pagina per Blueprint 2 con 40 campi = 0,040 USD + (10 x 0,0005 USD per campo) = 0,045 USD
    Addebito per Documento 1 utilizzando Blueprint 1 = 40 pagine x 0,040 USD per pagina = 1,6 USD
    Addebito per Documento 2 utilizzando Blueprint 2 = 10 pagine x 0,045 USD per pagina = 0,45 USD
    Costo totale = Addebito per Documento 1 + Addebito per Documento 2 = 1,6 USD + 0,45 USD = 2,05 USD

     

    Esempio di prezzi 3:
    Supponiamo di configurare Bedrock Knowledge Bases per utilizzare Bedrock Data Automation come parser, per poi importare un documento di 1.000 pagine. Le strutture dei costi differiscono in base alle opzioni di analisi di Knowledge Bases. BDA utilizza un sistema di tariffe per pagina, mentre i prezzi dei parser dei modelli di fondazione vengono calcolati in base ai token di input e output. Per contestualizzare, l’elaborazione di 1.000 pagine, di cui il 30% contiene tabelle e il 30% contiene cifre, richiede in genere 2.900 token di input e 750 token di output. Il consumo di token varia in base al tipo di contenuto, pertanto invitiamo i clienti a effettuare test utilizzando i propri dati per ottenere stime più accurate. L’integrazione tra Bedrock Knowledge Bases e Bedrock Data Automation utilizza l’output standard, il cui prezzo per pagina è di 0,010 USD. Il costo totale sarebbe 10 USD.

    Totale pagine elaborate = 1.000
    Prezzo per pagina per output standard = 0,010 USD
    Costo totale = 1.000 x 0,010 USD = 10 USD

     

    Esempio di prezzi 4:
    Supponiamo di elaborare un video di 60 minuti utilizzando l’output standard di BDA. Il prezzo al minuto per l’output video standard è di 0,050 USD. Il costo totale sarebbe 3.00 USD.

    Minuti totali elaborati = 60
    Prezzo al minuto per output video standard = 0,050 USD
    Addebito totale = 60 x 0,050 USD = 3,00 USD

     

    Esempio di prezzi 5:
    Supponiamo di elaborare 2.000 immagini utilizzando l’output personalizzato di BDA. Le prime 1.000 immagini vengono elaborate utilizzando il blueprint 1, che ha 10 campi. Le ultime 1.000 pagine vengono elaborate utilizzando il blueprint 2, che ha 40 campi. Il prezzo per immagine del blueprint 1 è di 0,005 USD, poiché contiene 30 campi o meno. Il prezzo per immagine del blueprint 2 è di 0,01 USD. Il costo di elaborazione per le prime 1.000 immagini utilizzando il blueprint 1 è di 5,00 USD. Il costo di elaborazione per le seconde 1.000 immagini utilizzando il blueprint 2 è di 10,00 USD. Il costo totale di elaborazione di tutte le 2.000 immagini sarebbe di 15 USD

    Costo per le prime 1.000 immagini = 1.000 immagini x 0,005 USD per immagine = 5,00 USD
    Costo per le seconde 1.000 immagini = 1.000 immagini x (0,005 USD + (numero di campi aggiuntivi superiori a 30 x 0,0005 USD per campo))
    = 1.000 x (0,005 USD + ((40-30) x 0,0005 USD))
    = 1.000 x (0,005 USD + (10 x 0,0005 USD)) = 10,00 USD
    Costo totale = 5,00 USD + 10,00 USD = 15,00 USD

     

    Esempio di prezzi 6:
    Supponiamo di utilizzare l’output standard di Bedrock Data Automation per elaborare 15.000 minuti di registrazioni audio di riunioni nella propria organizzazione. Il costo totale di elaborazione di tutti i 15.000 minuti audio sarebbe di 90 USD.

    Minuti totali elaborati = 15.000 minuti
    Costo totale = 15.000 min × 0,006 USD = 90 USD

     

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello DeepSeek-R1 per riassumere un input di 2.000 token di testo di input in un output di 1.000 token (inclusi i token di ragionamento):

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,00135 USD + 1.000 token/1.000 x 0,0054 USD = 0,0081 USD

  • Esempio: riepilogo delle notizie
    Uno sviluppatore di applicazioni crea un flusso per automatizzare il riepilogo delle notizie per i trader. Il flusso include un nodo di input che memorizza una posizione S3 e un nodo di recupero S3 che recupera 10 file che includono articoli di 10 importanti agenzie di stampa in S3 (transizioni a 2 nodi). Quindi utilizza un nodo iteratore per richiamare un modello con un nodo prompt per riepilogare ogni file (+ 10 file x 2 transizioni di nodi). Inoltre, raccoglie tutti i risultati utilizzando un nodo di raccolta, scrive i risultati su S3 utilizzando il nodo di archiviazione S3 e completa in quello di output (+ 3 transizioni di nodo). Eseguono questo flusso ogni mezz’ora di ogni giorno della settimana.

    Il numero di transizioni di nodo per esecuzione di flusso è: 2 + 1 + 10 x 2 + 3 = 25 transizioni di nodo per esecuzione del flusso

    Il numero di esecuzioni di flusso al mese è: 24 ore × 2 × 5 giorni × 4 settimane = 960 esecuzioni di flusso al mese.

    La fattura mensile totale è: 25 × 960 × 0,035/1000 USD = 0,84 USD

    Costi aggiuntivi
    La fattura includerà anche costi aggiuntivi per i servizi AWS utilizzati nell’esecuzione del flusso di lavoro, inclusi gli utilizzi di Amazon S3 nei nodi di recupero e archiviazione e l’utilizzo del modello di fondazione Amazon Bedrock nel nodo prompt.

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Llama 2 Chat (13B) di Meta per riepilogare un input di 2.000 token di testo di input in un output di 500 token.

    Costo totale sostenuto = 2.000 token/1.000 x 0,00075 USD + 500 token/1.000 x 0,001 USD = 0,002 USD

    Prezzi per la personalizzazione (ottimizzazione)

    Uno sviluppatore di applicazioni personalizza il modello Llama 2 pre-addestrato (70B) utilizzando 1.000 token di dati. Dopo l’addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

    Costo mensile sostenuto per l’ottimizzazione: addestramento di ottimizzazione (0,00799 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un’ora di inferenza del modello personalizzato (23,50 USD) = 33,44 USD

    Costo mensile sostenuto per il throughput fornito (impegno di 1 mese) del modello personalizzato = 21,18 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un’unità di modello di Meta Llama 2 con un impegno di 1 mese per il suo caso d’uso di riepilogo di testo.

    Costo mensile totale sostenuto: 1 unità di modello x 21,18 USD x 24 ore x 31 giorni = 15.757,92 USD

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral 7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,00015 USD + 1.000 token/1.000 x 0,0002 USD = 0,0005 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mixtral 8x7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,00045 USD + 1.000 token/1.000 x 0,0007 USD = 0,0016 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral Large per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token. 

    Costo orario totale sostenuto = 2.000 token/1.000 x 0,008 USD + 1.000 token/1.000 x 0,024 USD = 0,04 USD

  • Esempio di valutazione del modello 1:

    Prezzi on demand
    Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull’uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).

    Il set di dati contiene 50 prompt e lo sviluppatore richiede 1 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt").

    Ci saranno 50 attività in questo processo di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker). I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

    Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

    Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell’input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale
    Inferenza istantanea di Claude 5.000 0,0008 USD 0,004 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Inferenza Claude 2.1 5.000 0,008 USD 0,04 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Attività umane             50 0,21 USD 10,50 USD 10,50 USD
    Totale                   11,06 USD

    Esempio di valutazione del modello 2:

    Prezzi on demand
    Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull’uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).

    Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt"). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker: 2 worker x 50 set di risposta rapida = 100 attività umane).

    I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

    Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

    Elemento Numero di token di input Prezzo per 1.000 token di input Costo dell’input Numero di token di uscita Prezzo per 1.000 token di output Costo dell’output Numero di attività umane Prezzo per attività umana Costo delle attività umane Totale
    Inferenza istantanea di Claude 5.000 0,0008 USD 0,0040 USD 15.000 0,0024 USD 0,036 USD       0,04 USD
    Inferenza Claude 2.1 5.000 0,008 USD 0,0400 USD 20.000 0,024 USD 0,48 USD       0,52 USD
    Attività umane             100 0,21 USD 21,00 USD 21,00 USD
    Totale                   21,56 USD
  • Esempio: riepilogo delle notizie
    Uno sviluppatore di applicazioni crea un prompt per riassumere le notizie per i trader che utilizzano Claude 3.5. Il prompt originale comprende 429 token. Il prompt ottimizzato ha 511 token e comprende istruzioni ed esempi più specifici per generare risposte più concise dai modelli di fondazione. Utilizza il prompt ottimizzato con 511 token come input per l’ottimizzatore di prompt e crea 2 nuove varianti per Claude 3.7 e Nova Pro con 582 e 579 token.

    Il numero totale di token di input e output per l’ottimizzazione di prompt: 429 + 511 + 511 + 582 + 511 + 579 = 3.123

    La fattura mensile totale ammonta a: 3.123 / 1.000 × 0,03 USD = 0,09 USD

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL per generare un’immagine di 512 x 512 con dimensione del passo di 70 (qualità eccellente).

    Costo totale sostenuto = 1 immagine x 0,036 USD per immagine = 0,036 USD

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL 1.0 per generare un’immagine di 1024 x 1024 con dimensione del passo di 70 (qualità eccellente).

    Costo totale sostenuto = 1 immagine x 0,08 USD per immagine = 0,08 USD

    Prezzi del throughput fornito

    Uno sviluppatore di applicazioni acquista un’unità di modello di SDXL 1.0 con un impegno di 1 mese.

    Costo totale sostenuto = 1 x 49,86 USD x 24 ore x 31 giorni = 37.095,84 USD

  • Prezzi on demand

    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Pegasus 1.2 per descrivere il contenuto di un video della durata di 10 secondi, ottenendo un output di 2.000 token.

    Costo totale sostenuto = 10 secondi x 0,00049 USD + 2.000 token/1000 x 0,0075 USD = 0,0199 USD


    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Marengo Embed [3.0 o 2.7] per incorporare 10 video dalla durata totale di 100 minuti.

    Costo totale sostenuto = 100 minuti (ovvero 6000 secondi) * 0,00070 USD = 4,2 USD


    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Marengo Embed 3.0, fornendo un testo e un’immagine da utilizzare insieme per generare un embedding da impiegare nella ricerca della clip contenente il sacchetto mostrato nell’immagine fornita, mediante il repository di embedding che il modello avrebbe creato tramite l’esempio precedente. 

    Costo totale sostenuto = 1 richiesta di testo * 0,00007 USD +1 richiesta di immagine * 0,0001 USD = 0,00017 USD


    Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Marengo Embed [3.0 o 2.7] fornendo un testo per generare un embedding che il modello potrebbe utilizzare per trovare le clip corrispondenti da un repository di embedding che avrebbe creato tramite l’esempio precedente. 

    Costo totale sostenuto = 1 richiesta di testo * 0,00007USD = 0,00007USD

  • Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Palmyra X5 di Writer per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.

    Costo totale sostenuto = 10.000 token/1.000 x 0,003 USD + 2.000 token/1.000 x 0,015 USD = 0,06 USD