Prezzi di Amazon Bedrock
Panoramica dei prezzi
Amazon Bedrock è un servizio completamente gestito che offre una scelta di modelli di fondazione (FM) ad alte prestazioni attraverso una singola API, insieme a un'ampia gamma di funzionalità necessarie per creare applicazioni di IA generativa, per semplificare lo sviluppo mantenendo sicurezza, privacy e IA responsabile.
Amazon Bedrock prevede l'addebito dei costi relativi all'inferenza e alla personalizzazione dei modelli. È possibile scegliere tra due piani tariffari per l'inferenza: 1) On demand e batch: questa modalità consente di utilizzare gli FM con pagamento in base al consumo senza vincoli temporali. 2) Velocità di trasmissione effettiva allocata: questa modalità consente di eseguire il provisioning di una velocità di trasmissione effettiva sufficiente per soddisfare i requisiti prestazionali dell'applicazione in cambio di un vincolo temporale.
Modelli di prezzo
On-Demand
Con la modalità On-Demand, paghi solo quello che usi, senza impegni a termine basati sul tempo. Per i modelli di generazione di testo, ti viene addebitato ogni token di input elaborato e ogni token di output generato. Per i modelli di incorporamento, ti viene addebitato un costo per ogni token di input elaborato. Un token è composto da pochi caratteri e si riferisce all'unità di testo di base che un modello impara a comprendere l'input e il prompt dell'utente. Per i modelli di generazione di immagini, ti viene addebitato un costo per ogni immagine generata.
Batch
Con la modalità Batch, puoi fornire una serie di prompt come un singolo file di input e ricevere risposte come un singolo file di output, consentendo di ottenere previsioni simultanee su larga scala. Le risposte vengono elaborate e archiviate nel tuo bucket Amazon S3 in modo da potervi accedere in un secondo momento. I prezzi per la modalità Batch sono gli stessi della modalità On-Demand.
Provisioned Throughput
Con la modalità Provisioned Throughput, è possibile acquistare unità modello per uno specifico modello base o personalizzato. La modalità Provisioned Throughput è progettata principalmente per carichi di lavoro di inferenza consistenti di grandi dimensioni che richiedono una velocità di trasmissione effettiva garantita. È possibile accedere ai modelli personalizzati solo utilizzando Provisioned Throughput. Un'unità modello fornisce una determinata velocità di trasmissione effettiva misurata dal numero massimo di token di input o output elaborati al minuto. Con i prezzi Provisioned Throughput, ti vengono addebitati a ore, hai la flessibilità di scegliere tra termini di impegno di 1 mese o 6 mesi.
Personalizzazione del modello
Con Amazon Bedrock, puoi personalizzare gli FM con i tuoi dati per fornire risposte su misura per attività specifiche e il tuo contesto aziendale. È possibile ottimizzare i modelli con dati etichettati o utilizzare un pre-training continuo con dati non etichettati. Per la personalizzazione di un modello di generazione di testo, viene addebitato il costo dell'addestramento del modello in base al numero totale di token elaborati dal modello (numero di token nel corpus di dati di addestramento moltiplicato per il numero di epoche) e per l'archiviazione del modello addebitato al mese per modello. Un'epoca si riferisce a un passaggio completo del set di dati di allenamento durante la messa a punto o il pre-allenamento continuo. Le inferenze che utilizzano modelli personalizzati vengono addebitate in base al piano Provisioned Throughput e richiedono l'acquisto di Provisioned Throughput. Un'unità modello è resa disponibile senza alcun termine di impegno per l'inferenza su un modello personalizzato. Ti verrà addebitato il numero di ore trascorse dalla prima unità modello utilizzata per l'inferenza del modello personalizzato. Se desideri aumentare la velocità di trasmissione effettiva oltre un'unità modello, devi acquistare un periodo di impegno di 1 o 6 mesi.
Potenti strumenti da costruire senza costi aggiuntivi
Quando utilizzi Agents for Amazon Bedrock e Knowledge Bases for Amazon Bedrock, ti vengono addebitati solo i modelli e i database vettoriali che utilizzi con queste funzionalità.
Ripartizione dei prezzi
Il prezzo dipende dalla modalità, dal fornitore e dal modello. Seleziona il fornitore del modello per visualizzare i prezzi dettagliati.
AI21 Labs
Prezzi su richiesta e in batch
Modelli AI21 Labs | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Jurassic-2 Mid |
0,0125 USD |
0,0125 USD |
Jurassic 2 Ultra |
0,0188 USD |
0,0188 USD |
Attualmente, la personalizzazione del modello (messa a punto) e i Provisioned Throughput non sono supportati per i modelli di AI21 Labs su Amazon Bedrock.
Amazon
Anthropic
Prezzi su richiesta e in batch
Stati Uniti orientali (Virginia settentrionale e Ohio) e Stati Uniti occidentali (Oregon)
Modelli antropici | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Claude Instant |
0,00080 USD |
0,00240 USD |
Claude 2.0/2.1 |
0,00800 USD |
0,02400 USD |
Claude 3 Opus* |
0,01500 USD |
0,07500 USD |
Claude 3 Sonnet |
0,00300 USD |
0,01500 USD |
Claude 3 Haiku |
0,00025 USD |
0,00125 USD |
*Claude 3 Opus è al momento disponibile solo nella regione Stati Uniti occidentali (Oregon). |
Regione: Asia Pacifico (Sydney)
Modelli antropici | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Claude 3 Sonnet |
0,00300 USD |
0,01500 USD |
Claude 3 Haiku |
0,00025 USD |
0,00125 USD |
Regione: Europa (Parigi)
Modelli antropici | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Claude 3 Sonnet |
0,00300 USD |
0,01500 USD |
Claude 3 Haiku |
0,00025 USD |
0,00125 USD |
Regione: Asia Pacifico (Tokyo)
Modelli antropici | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Claude Instant |
0,00080 USD |
0,00240 USD |
Claude 2.0/2.1 |
0,00800 USD |
0,02400 USD |
Regione: Europa (Francoforte)
Modelli antropici | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Claude Instant |
0,00080 USD |
0,00240 USD |
Claude 2.0/2.1 |
0,00800 USD |
0,02400 USD |
Prezzi di Provisioned Throughput:
Stati Uniti orientali (Virginia settentrionale e Ohio) e Stati Uniti occidentali (Oregon)
Modelli antropici | Prezzo orario per modello con nessun impegno |
Prezzo orario per unità modello con impegno di 1 mese | Prezzo orario per unità modello con impegno di 6 mesi |
Claude Instant |
44,00 USD | 39,60 USD |
22,00 USD |
Claude 2.0/2.1 |
70,00 USD | 63,00 USD |
35,00 USD |
Modelli antropici | Prezzo orario per modello con nessun impegno |
Prezzo orario per unità modello con impegno di 1 mese | Prezzo orario per unità modello con impegno di 6 mesi |
Claude Instant |
44,00 USD | 39,60 USD |
22,00 USD |
Claude 2.0/2.1 |
70,00 USD | 63,00 USD |
35,00 USD |
Regione: Asia Pacifico (Tokyo)
Modelli antropici | Prezzo orario per unità modello con impegno di 1 mese | Prezzo orario per unità modello con impegno di 6 mesi |
Claude Instant |
53,00 USD |
29,00 USD |
Claude 2.0/2.1 |
86,00 USD |
48,00 USD |
Regione: Europa (Francoforte)
Modelli antropici | Prezzo orario per unità modello con impegno di 1 mese | Prezzo orario per unità modello con impegno di 6 mesi |
Claude Instant |
49,00 USD |
27,00 USD |
Claude 2.0/2.1 |
79,00 USD |
44,00 USD |
Contatta il team del tuo account AWS per maggiori dettagli sulle unità modello.
Cohere
Prezzi su richiesta e in batch
Modelli Cohere | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Command | 0,0015 USD | 0,0020 USD |
Command-Light | 0,0003 USD | 0,0006 USD |
Embed — English | 0,0001 USD | N/D |
Embed - Multilingue | 0,0001 USD | N/D |
Prezzi per la personalizzazione (messa a punto)
Modelli Cohere | Prezzo per addestrare 1.000 gettoni | Prezzo mensile per memorizzare ogni modello personalizzato | Prezzo da dedurre da un modello personalizzato per unità di modello all'ora (con prezzi Provisioned Throughput senza impegno) |
Cohere Command |
0,004 USD |
1,95 USD |
49,50 USD |
Command-Light Cohere | 0,001 USD | 1,95 USD |
8,56 USD |
*Token totali addestrati = numero di token nel corpus di dati di addestramento x numero di epoche
Prezzi di Provisioned Throughput:
Modelli Cohere | Prezzo orario per modello senza impegno |
Prezzo orario per unità modello con impegno di 1 mese | Prezzo orario per unità modello con impegno di 6 mesi |
Cohere Command |
49,50 USD | 39,60 USD |
23,77 USD |
Cohere Command-Light | 8,56 USD | 6,85 USD |
4,11 USD |
Integrato - Inglese | 7,12 USD | 6,76 USD |
6,41 USD |
Integrato - Multilingue | 7,12 USD | 6,76 USD |
6,41 USD |
Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.
Meta Llama 2
Prezzi su richiesta e in batch
Meta modelli | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Chat Llama 2 (13B) |
0,00075 USD |
0,00100 USD |
Chat Llama 2 (70B) | 0,00195 USD |
0,00256 USD |
Prezzi per la personalizzazione del modello (messa a punto)
Meta modelli | Prezzo per addestrare 1.000 gettoni | Prezzo per memorizzare ogni modello personalizzato* al mese | Prezzo da dedurre da un modello personalizzato per 1 unità modello all'ora (con prezzi Provisioned Throughput senza impegno) |
Llama 2 Pre-addestrato (13B) |
0,00149 USD |
1,95 USD |
23,50 USD |
Llama 2 Pre-addestrato (70B) | 0,00799 USD |
1,95 USD | 23,50 USD |
*Archiviazione per modelli personalizzati = 1,95 USD
Prezzi di Provisioned Throughput:
Meta modelli | Prezzo orario per unità modello con impegno di 1 mese | Prezzo orario per unità modello con impegno di 6 mesi |
Llama 2 Pre-addestrato e chat (13B) |
21,18 USD |
13,08 USD |
Llama 2 Pre-addestrato (70B) | 21,18 USD |
13,08 USD |
*I modelli preaddestrati di Llama 2 sono disponibili solo in provisioned throughput previa personalizzazione.
Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.
Mistral AI
Prezzi su richiesta - Regioni: Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon)
Modello Mistral AI | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Mistral 7B | 0,00015 USD |
0,0002 USD |
Mixtral 8*7B | 0,00045 USD |
0,0007 USD |
Mistral Grande | 0,008 USD | 0,024 USD |
Prezzi su richiesta - Regioni: Europa (Parigi), Asia Pacifico (Sydney)
Modello Mistral AI | Prezzo per 1.000 token di input | Prezzo per 1.000 token di output |
Mistral 7B | 0,0002 USD |
0,00026 USD |
Mixtral 8*7B | 0,00059 USD |
0,00091 USD |
Mistral Grande | 0,0104 USD | 0,0312 USD |
Stability AI
Prezzi su richiesta e in batch
I modelli di immagine offerti da Stability AI hanno un prezzo per immagine, in base al numero di passi e alla risoluzione dell'immagine:
Modello AI di stabilità | Risoluzione dell'immagine | Prezzo per immagine generata per una qualità standard (<=50 passaggi) | Prezzo per immagine generata per una qualità premium (>50 passaggi) |
SDXL 0,8 |
512 x 512 o inferiore |
0,018 USD per immagine |
0,036 USD per immagine |
Più grande di 512 x 512 |
0,036 USD per immagine |
0,072 USD per immagine |
|
SDXL 1,0 | Fino a 1024 x 1024 |
0,04 USD | 0,08 USD |
Prezzi di Provisioned Throughput:
Modello AI di stabilità | Prezzo orario per unità modello con impegno di 1 mese* | Prezzo orario per unità modello per un impegno di 6 mesi* |
SDXL 1,0 |
49,86 USD |
46,18 USD |
*Include l'inferenza per i modelli base e personalizzati.
Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.
Attualmente, la personalizzazione del modello (ottimizzazione fine) non è supportata per i modelli Stability AI su Amazon Bedrock.
Esempi di prezzo
-
AI21 Labs
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Jurassic-2 Mid di AI21 per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.
Costo totale sostenuto = 10.000 token/1.000 * 0,0125 USD + 2.000 token/1.000 * 0,0125 USD = 0,15 USD
-
Amazon
Prezzi on demand
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Amazon Titan Text - Lite per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 * 0,0003 USD + 1.000 token/1.000 * 0,0004 USD = 0,001 USD.
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello base Titan Image Generator per generare 1.000 immagini di 1024 x 1024 di qualità standard
Costo totale sostenuto = 1.000 immagini * 0,01 USD per immagine = 10 USD
Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)
Uno sviluppatore di applicazioni personalizza un modello Titan Image Generation utilizzando 1.000 coppie immagine-testo. Dopo l'addestramento, lo sviluppatore utilizza la velocità di trasmissione effettiva allocata del modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza la velocità di trasmissione effettiva allocata (vincolo di 1 mese) per ospitare il modello personalizzato.
Il costo mensile sostenuto per la messa a punto è: formazione sulla messa a punto (0,005 USD * 500 * 64), dove 0,005 USD è il prezzo per immagine visualizzata, 500 è il numero di passaggi e 64 è la dimensione del batch + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD
Prezzi Provisioned Throughput
Uno sviluppatore di applicazioni acquista due unità di modello di Titan Text Express con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.
Costo mensile totale sostenuto: 2 unità di modello * 18,40 USD/ora * 24 ore * 31 giorni = 27.379,20 USD
Uno sviluppatore di applicazioni acquista un'unità di modello del modello Titan Image Generator base con un vincolo di 1 mese.
Costo totale sostenuto = 1 * 16,20 USD * 24 ore * 31 giorni = 12.052,80 USD
-
Anthropic
Prezzi on demand
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock nella regione Stati Uniti occidentali (Oregon): una richiesta al modello Claude di Anthropic per riepilogare un input di 11.000 token di testo di input in un output di 4.000 token.
Costo totale sostenuto: 11.000 token/1.000 * 0,008 USD + 4.000 token/1.000 * 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD
Prezzi Provisioned Throughput
Uno sviluppatore di applicazioni acquista un'unità di modello di Anthropic Claude Instant nella regione Stati Uniti occidentali (Oregon):
Costo mensile totale sostenuto: 1 unità di modello * 39,60 USD * 24 ore * 31 giorni = 29.462,40 USD
-
Cohere
Prezzi on demand
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.
Costo totale sostenuto = 6.000 token/1.000 * 0,00150 USD + 2.000 token/1.000 * 0,0020 USD = 0,013 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command-Light di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.
Costo totale sostenuto = 6.000 token/1.000 * 0,0003 USD + 2.000 token/1.000 * 0,0006 USD = 0,003 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Embed inglese o multilingue di Cohere per generare integrazioni per 10.000 token di input.
Costo totale sostenuto = 10.000 token/1.000 * 0,0001 USD = 0,001 USD
Prezzi di personalizzazione (ottimizzazione)
Uno sviluppatore di applicazioni personalizza un modello Cohere Command utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza la velocità di trasmissione effettiva allocata del modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza la velocità di trasmissione effettiva allocata (vincolo di 1 mese) per ospitare il modello personalizzato.
Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,004 USD * 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (49,50 USD) = 55,45 USD
Costo mensile sostenuto per la velocità di trasmissione effettiva allocata (vincolo di 1 mese) del modello personalizzato = 39,60 USD
Prezzi Provisioned Throughput
Uno sviluppatore di applicazioni acquista un'unità di modello di Cohere Command con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.
Costo mensile totale sostenuto: 1 unità di modello * 39,60 USD * 24 ore * 31 giorni = 29.462,40 USD
-
Meta
Prezzi on demand
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Llama 2 Chat (13B) di Meta per riepilogare un input di 2.000 token di testo di input in un output di 500 token.
Costo totale sostenuto = 2.000 token/1.000 * 0,00075 USD + 500 token/1.000 * 0,001 USD = 0,002 USD
Prezzi di personalizzazione (ottimizzazione)
Uno sviluppatore di applicazioni personalizza il modello Llama 2 pre-addestrato (70B) utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza la velocità di trasmissione effettiva allocata del modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza la velocità di trasmissione effettiva allocata (vincolo di 1 mese) per ospitare il modello personalizzato.
Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,00799 USD * 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (23,50 USD) = 33,44 USD
Costo mensile sostenuto per la velocità di trasmissione effettiva allocata (vincolo di 1 mese) del modello personalizzato = 21,18 USD
Prezzi Provisioned Throughput
Uno sviluppatore di applicazioni acquista un'unità di modello di Meta Llama 2 con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.
Costo mensile totale sostenuto: 1 unità di modello * 21,20 USD * 24 ore * 31 giorni = 15.772,8 USD
-
Mistral AI
Prezzi on demand
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral 7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 * 0,00015 USD + 1.000 token/1.000 * 0,0002 USD = 0,0005 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mixtral 8x7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1.000 * 0,00045 USD + 1.000 token/1.000 * 0,0007 USD = 0,0016 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral di grandi dimensioni per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.
Costo orario totale sostenuto = 2.000 token/1000 * 0,008 USD + 1000 token/1.000 * 0,024 USD = 0,04 USD.
-
Stability AI
Prezzi on demand
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL per generare un'immagine di 512 x 512 con dimensione del passo di 70 (qualità eccellente)
Costo totale sostenuto = 1 immagine * 0,036 USD per immagine = 0,036 USD
Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL1.0 per generare un'immagine di 1024 x 1024 con dimensione del passo di 70 (qualità eccellente)
Costo totale sostenuto = 1 immagine * 0,08 USD per immagine = 0,08 USD
Prezzi Provisioned Throughput
Uno sviluppatore di applicazioni acquista un'unità di modello di SDXL1.0 con un vincolo di 1 mese.
Costo totale sostenuto = 1 * 49,86 USD * 24 ore * 31 giorni = 37.095,84 USD