Prezzi di Amazon Bedrock

Panoramica dei prezzi

Amazon Bedrock è un servizio completamente gestito che offre una scelta di modelli di fondazione (FM) ad alte prestazioni attraverso una singola API, insieme a un'ampia gamma di funzionalità necessarie per creare applicazioni di IA generativa garantendo sicurezza, privacy e IA responsabile.

Amazon Bedrock prevede l'addebito dei costi relativi all'inferenza e alla personalizzazione dei modelli. È possibile scegliere tra due piani tariffari per inferenza: 1. On demand e batch: questa modalità consente di utilizzare gli FM con pagamento in base al consumo senza vincoli temporali. 2. Throughput assegnato: questa modalità consente di eseguire il provisioning di un throughput sufficiente per soddisfare i requisiti prestazionali dell'applicazione in cambio di un vincolo temporale.

Modelli di prezzo

On-Demand

Con la modalità On-Demand, paghi solo quello che usi, senza impegni a termine basati sul tempo. Per i modelli di generazione di testo, ti viene addebitato ogni token di input elaborato e ogni token di output generato. Per i modelli di incorporamento, ti viene addebitato un costo per ogni token di input elaborato. Un token è composto da pochi caratteri e si riferisce all'unità di testo di base che un modello impara per comprendere l'input e il prompt dell'utente. Per i modelli di generazione di immagini, ti viene addebitato un costo per ogni immagine generata.

Batch

Con la modalità Batch, puoi fornire una serie di prompt come un singolo file di input e ricevere risposte come un singolo file di output, consentendo di ottenere previsioni simultanee su larga scala. Le risposte vengono elaborate e archiviate nel tuo bucket Amazon S3 in modo da potervi accedere in un secondo momento. I prezzi per la modalità Batch sono gli stessi della modalità On-Demand.

Provisioned Throughput

Con la modalità Provisioned Throughput, è possibile acquistare unità modello per uno specifico modello base o personalizzato. La modalità Provisioned Throughput è progettata principalmente per carichi di lavoro di inferenza consistenti di grandi dimensioni che richiedono una velocità di trasmissione effettiva garantita. È possibile accedere ai modelli personalizzati solo utilizzando Provisioned Throughput. Un'unità modello fornisce una determinata velocità di trasmissione effettiva misurata dal numero massimo di token di input o output elaborati al minuto. Con i prezzi Provisioned Throughput, ti vengono addebitati a ore, hai la flessibilità di scegliere tra termini di impegno di 1 mese o 6 mesi.

Personalizzazione del modello

Con Amazon Bedrock, puoi personalizzare gli FM con i tuoi dati per fornire risposte su misura per attività specifiche e il tuo contesto aziendale. È possibile ottimizzare i modelli con dati etichettati o utilizzare un pre-training continuo con dati non etichettati. Per la personalizzazione di un modello di generazione di testo, viene addebitato il costo dell'addestramento del modello in base al numero totale di token elaborati dal modello (numero di token nel corpus di dati di addestramento moltiplicato per il numero di epoche) e per l'archiviazione del modello addebitato al mese per modello. Un'epoca si riferisce a un passaggio completo del set di dati di allenamento durante la messa a punto o il pre-allenamento continuo. Le inferenze che utilizzano modelli personalizzati vengono addebitate in base al piano Provisioned Throughput e richiedono l'acquisto di Provisioned Throughput. Un'unità modello è resa disponibile senza alcun termine di impegno per l'inferenza su un modello personalizzato. Ti verrà addebitato il numero di ore trascorse che utilizzi nella prima unità modello per l'inferenza del modello personalizzato. Se desideri aumentare il throughput di trasmissione effettivo oltre un'unità modello, devi acquistare un periodo di impegno di 1 o 6 mesi.

Valutazione di modelli

Con la valutazione dei modelli su Amazon Bedrock paghi in base all'utilizzo, senza impegni di volume sul numero di richieste o risposte. Per la valutazione automatica, paghi solo l'inferenza derivante dal modello scelto nella valutazione. I punteggi algoritmici generati automaticamente vengono forniti senza costi aggiuntivi. Per la valutazione basata sull'uomo, in cui coinvolgi il tuo team di lavoro, ti verrà addebitato l'inferenza del modello nella valutazione e un costo di 0,21 USD per attività umana completata. Un'attività umana è definita come un'istanza in cui un lavoratore umano invia una valutazione di un singolo prompt e delle relative risposte di inferenza nell'interfaccia utente di valutazione umana. Il prezzo è lo stesso indipendentemente dal fatto che tu abbia uno o due modelli nel tuo lavoro di valutazione e lo stesso indipendentemente dal numero di parametri di valutazione e metodi di valutazione che includi. I costi per le attività umane appariranno nella sezione Amazon SageMaker della fattura AWS e sono gli stessi per tutte le Regioni AWS. Non è previsto alcun costo separato per la forza lavoro, poiché la forza lavoro viene fornita da te. Per una valutazione gestita da AWS, i prezzi sono personalizzati in base alle tue esigenze di valutazione, mediante un accordo privato con il team di valutazione degli esperti di AWS.

Potenti strumenti da costruire senza costi aggiuntivi

Quando utilizzi Agents for Amazon Bedrock e Knowledge Bases for Amazon Bedrock, ti vengono addebitati solo i modelli e i database vettoriali che utilizzi con queste funzionalità.

Ripartizione dei prezzi

Il prezzo dipende dalla modalità, dal fornitore e dal modello. Seleziona il fornitore del modello per visualizzare i prezzi dettagliati.

AI21 Labs

Prezzi su richiesta e in batch

Modelli AI21 Labs	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Jurassic-2 Mid	0,0125 USD	0,0125 USD
Jurassic 2 Ultra	0,0188 USD	0,0188 USD

Amazon

Regione

Anthropic

Prezzi su richiesta e in batch

Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Claude Instant	0,0008 USD	0,0024 USD
Claude 2.0/2.1	0,008 USD	0,024 USD
Claude 3 Opus*	0,015 USD	0,075 USD
Claude 3 Sonnet	0,003 USD	0,015 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD
*Claude 3 Opus è al momento disponibile solo nella regione Stati Uniti occidentali (Oregon).

Regione: Asia Pacifico (Sydney)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Claude 3 Sonnet	0,003 USD	0,015 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD

Regione: Europa (Parigi)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Claude 3 Sonnet	0,003 USD	0,015 USD
Claude 3 Haiku	0,00025 USD	0,00125 USD

Regione: Asia Pacifico (Tokyo)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Claude Instant	0,0008 USD	0,0024 USD
Claude 2.0/2.1	0,008 USD	0,024 USD

Regione: Europa (Francoforte)

Modelli antropici	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Claude Instant	0,0008 USD	0,0024 USD
Claude 2.0/2.1	0,008 USD	0,024 USD

Prezzi del throughput fornito

Regione: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon)

Modelli antropici	Prezzo orario per modello con nessun impegno	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Modelli antropici	Prezzo orario per modello con nessun impegno	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	44,00 USD	39,60 USD	22,00 USD
Claude 2.0/2.1	70,00 USD	63,00 USD	35,00 USD

Regione: Asia Pacifico (Tokyo)

Modelli antropici	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	53,00 USD	29,00 USD
Claude 2.0/2.1	86,00 USD	48,00 USD

Regione: Europa (Francoforte)

Modelli antropici	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Claude Instant	49,00 USD	27,00 USD
Claude 2.0/2.1	79,00 USD	44,00 USD

Contatta il team del tuo account AWS per maggiori dettagli sulle unità modello.

Cohere

Prezzi su richiesta e in batch

Modelli Cohere	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Command	0,0015 USD	0,0020 USD
Command-Light	0,0003 USD	0,0006 USD
Command R+	0,0030 USD	0,0150 USD
Command R	0,0005 USD	0,0015 USD
Integrato - Inglese	0,0001 USD	N/D
Integrato - Multilingue	0,0001 USD	N/D

Prezzi per la personalizzazione (messa a punto)

Modelli Cohere	Prezzo per addestrare 1.000 gettoni	Prezzo mensile per memorizzare ogni modello personalizzato	Prezzo da dedurre da un modello personalizzato per unità di modello all'ora (con prezzi Provisioned Throughput senza impegno)
Cohere Command	0,004 USD	1,95 USD	49,50 USD
Command-Light Cohere	0,001 USD	1,95 USD	8,56 USD

*Token totali addestrati = numero di token nel corpus di dati di addestramento x numero di epoche

Prezzi del throughput fornito

Modelli Cohere	Prezzo orario per modello senza impegno	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Cohere Command	49,50 USD	39,60 USD	23,77 USD
Cohere Command - Light	8,56 USD	6,85 USD	4,11 USD
Integrato - Inglese	7,12 USD	6,76 USD	6,41 USD
Integrato - Multilingue	7,12 USD	6,76 USD	6,41 USD

Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

Meta Llama

Prezzi su richiesta e in batch

Meta modelli	Prezzo per 1.000 token di input	Prezzo per 1.000 token di output
Chat Llama 2 (13B)	0,00075 USD	0,001 USD
Chat Llama 2 (70B)	0,00195 USD	0,00256 USD
Llama 3 Instruct (8B)	0,0004 USD	0,0006 USD
Llama 3 Instruct (70B)	0,00265 USD	0,0035 USD

Prezzi per la personalizzazione del modello (messa a punto)

Meta modelli	Prezzo per addestrare 1.000 gettoni	*Prezzo per memorizzare ogni modello personalizzato al mese**	Prezzo da dedurre da un modello personalizzato per 1 unità modello all'ora (con prezzi Provisioned Throughput senza impegno)
Llama 2 Preaddestrato (13B)	0,00149 USD	1,95 USD	23,50 USD
Llama 2 Preaddestrato (70B)	0,00799 USD	1,95 USD	23,50 USD

*Archiviazione per modelli personalizzati = 1,95 USD

Prezzi del throughput fornito

Meta modelli	Prezzo orario per unità modello con impegno di 1 mese	Prezzo orario per unità modello con impegno di 6 mesi
Llama 2 Preaddestrato e Chat (13B)	21,18 USD	13,08 USD
Llama 2 Preaddestrato (70B)	21,18 USD	13,08 USD

*I modelli preaddestrati di Llama 2 sono disponibili solo in provisioned throughput previa personalizzazione.

Contatta il team del tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

Mistral AI

Regione

Stability AI

Prezzi su richiesta e in batch

I modelli di immagine offerti da Stability AI hanno un prezzo per immagine, in base al numero di passi e alla risoluzione dell'immagine

Modello Stability AI	Risoluzione dell'immagine	Prezzo per immagine generata per una qualità standard (<=50 passaggi)	Prezzo per immagine generata per una qualità premium (>50 passaggi)
SDXL 0,8	512 x 512 o inferiore	0,018 USD per immagine	0,036 USD per immagine
SDXL 0,8	Più grande di 512 x 512	0,036 USD per immagine	0,072 USD per immagine
SDXL 1,0	Fino a 1024 x 1024	0,04 USD	0,08 USD

Prezzi del throughput fornito

Modello Stability AI	Prezzo orario per unità modello con impegno di 1 mese*	Prezzo orario per unità modello per un impegno di 6 mesi*
SDXL 1,0	49,86 USD	46,18 USD

*Include l'inferenza per i modelli base e personalizzati

Contatta il tuo account AWS o il team di vendita per maggiori dettagli sulle unità modello.

Attualmente, la personalizzazione del modello (messa a punto) non è supportata per i modelli Stability AI su Amazon Bedrock.

Guardrail per Amazon Bedrock

Prezzi su richiesta

Politica guardrail*	Prezzo per 1.000 unità di testo**
Filtri per i contenuti	0,75 USD
Argomenti negati	1 USD
Filtro per informazioni sensibili (PII)	0,10 USD
Filtro per informazioni sensibili (espressione regolare)	Gratis
Filtri per parola	Gratis

* Ogni politica guardrail è opzionale e può essere abilitata in base ai requisiti dell'applicazione. Gli addebiti avverranno in base al tipo di polizza utilizzata nel guardrail. Ad esempio, se un guardrail è configurato con filtri di contenuto e argomenti negati, verranno addebitati costi per queste due politiche, mentre non ci saranno addebiti associati ai filtri di informazioni sensibili.

**Un'unità di testo può contenere fino a 1.000 caratteri. Se un input di testo è superiore a 1.000 caratteri, viene elaborato come più unità di testo, ciascuna contenente 1.000 caratteri o meno. Ad esempio, se un input di testo contiene 5.600 caratteri, verranno addebitate 6 unità di testo.

I guardrail non sono supportati per immagini e incorporamenti.

Esempi di prezzo

AI21 Labs

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Jurassic-2 Mid di AI21 per riepilogare un input di 10.000 token di testo di input in un output di 2.000 token.

Costo totale sostenuto = 10.000 token/1.000 x 0,0125 USD + 2.000 token/1.000 x 0,0125 USD = 0,15 USD
Amazon

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Amazon Titan Text Lite per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,0003 USD + 1.000 token/1.000 x 0,0004 USD = 0,001 USD.

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello base di Amazon Titan Image Generator per generare 1.000 immagini di dimensione 1024 x 1024 di qualità standard.

Costo totale sostenuto = 1.000 immagini x 0,01 USD per immagine = 10 USD

Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)

Uno sviluppatore di applicazioni personalizza un modello Amazon Titan Image Generator utilizzando 1.000 coppie immagine-testo. Dopo l'addestramento, lo sviluppatore utilizza il throughput fornito dal modello personalizzato per un'ora allo scopo di valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (durata dell'impegno di 1 mese) per ospitare il modello personalizzato.

Il costo mensile sostenuto per l'ottimizzazione è: formazione sull'ottimizzazione (0,005 USD x 500 x 64), dove 0,005 USD è il prezzo per immagine visualizzata, 500 è il numero di passaggi e 64 è la dimensione del batch + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (21 USD) = 160 USD + 1,95 USD + 21 = 182,95 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista due unità di modello di Amazon Titan Text Express con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.

Costo mensile totale sostenuto: 2 unità di modello x 18,40 USD/ora x 24 ore x 31 giorni = 27.379,20 USD

Uno sviluppatore di applicazioni acquista un'unità di modello del modello Amazon Titan Image Generator base con un vincolo di 1 mese.

Costo totale sostenuto = 1 unità modello x 16,20 USD x 24 ore x 31 giorni = 12.052,80 USD
Anthropic

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock nella regione Stati Uniti occidentali (Oregon): una richiesta al modello Claude di Anthropic per riepilogare un input di 11.000 token di testo di input in un output di 4.000 token.

Costo totale sostenuto= 11.000 token/1.000 x 0,008 USD + 4.000 token/1.000 x 0,024 USD = 0,088 USD + 0,096 USD = 0,184 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di Anthropic Claude Instant nella regione Stati Uniti occidentali (Oregon):

Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD
Cohere

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

Costo totale sostenuto = 6.000 token/1.000 x 0,0015 USD + 2.000 token/1.000 x 0,0020 USD = 0,013 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Command-Light di Cohere per riepilogare un input di 6.000 token di testo di input in un output di 2.000 token.

Costo totale sostenuto = 6.000 token/1.000 x 0,0003 USD + 2.000 token/1.000 x 0,0006 USD = 0,003 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Embed inglese o multilingue di Cohere per generare integrazioni per 10.000 token di input.

Costo totale sostenuto = 10.000 token/1.000 x 0,0001 USD = 0,001 USD

Prezzi per la personalizzazione (ottimizzazione)

Uno sviluppatore di applicazioni personalizza un modello Cohere Command utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,004 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (49,50 USD) = 55,45 USD

Costo mensile sostenuto per il throughput previsto (impegno di 1 mese) del modello personalizzato = 39,60 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di Cohere Command con un vincolo di 1 mese per il suo caso d'uso di riepilogo di testo.

Costo mensile totale sostenuto: 1 unità di modello x 39,60 USD x 24 ore x 31 giorni = 29.462,40 USD
Meta Llama

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello Llama 2 Chat (13B) di Meta per riepilogare un input di 2.000 token di testo di input in un output di 500 token.

Costo totale sostenuto = 2.000 token/1.000 x 0,00075 USD + 500 token/1.000 x 0,001 USD = 0,002 USD

Prezzi per la personalizzazione (ottimizzazione)

Uno sviluppatore di applicazioni personalizza il modello Llama 2 pre-addestrato (70B) utilizzando 1.000 token di dati. Dopo l'addestramento, utilizza il throughput fornito dal modello personalizzato per 1 ora per valutare le prestazioni del modello. Il modello ottimizzato viene archiviato per un mese. Dopo la valutazione, lo sviluppatore utilizza il throughput fornito (impegno di 1 mese) per ospitare il modello personalizzato.

Costo mensile sostenuto per l'ottimizzazione: addestramento di ottimizzazione (0,00799 USD x 1.000) + archiviazione del modello personalizzato al mese (1,95 USD) + un'ora di inferenza del modello personalizzato (23,50 USD) = 33,44 USD

Costo mensile sostenuto per il throughput fornito (impegno di 1 mese) del modello personalizzato = 21,18 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di Meta Llama 2 con un impegno di 1 mese per il suo caso d'uso di riepilogo di testo.

Costo mensile totale sostenuto: 1 unità di modello x 21,18 USD x 24 ore x 31 giorni = 15.757,92 USD
Mistral AI

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral 7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,00015 USD + 1.000 token/1.000 x 0,0002 USD = 0,0005 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mixtral 8x7B per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,00045 USD + 1.000 token/1.000 x 0,0007 USD = 0,0016 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock su base oraria: una richiesta al modello Mistral Large per riepilogare un input di 2.000 token di testo di input in un output di 1.000 token.

Costo orario totale sostenuto = 2.000 token/1.000 x 0,008 USD + 1.000 token/1.000 x 0,024 USD = 0,04 USD
Stability AI

Prezzi su richiesta

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL per generare un'immagine di 512 x 512 con dimensione del passo di 70 (qualità eccellente).

Costo totale sostenuto = 1 immagine x 0,036 USD per immagine = 0,036 USD

Uno sviluppatore di applicazioni effettua le seguenti chiamate API ad Amazon Bedrock: una richiesta al modello SDXL1.0 per generare un'immagine di 1024 x 1024 con dimensione del passo di 70 (qualità eccellente).

Costo totale sostenuto = 1 immagine x 0,08 USD per immagine = 0,08 USD

Prezzi del throughput fornito

Uno sviluppatore di applicazioni acquista un'unità di modello di SDXL1.0 con un impegno di 1 mese.

Costo totale sostenuto = 1 x 49,86 USD x 24 ore x 31 giorni = 37.095,84 USD

Valutazione di modelli

Esempio di valutazione del modello 1:

Il set di dati contiene 50 prompt e lo sviluppatore richiede 1 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt").

Ci saranno 50 attività in questo processo di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker). I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

Elemento	Numero di token di input	Prezzo per 1.000 token di input	Costo dell'input	Numero di token di uscita	Prezzo per 1.000 token di output	Costo dell’output	Numero di attività umane	Prezzo per attività umana	Costo delle attività umane	Totale
Inferenza istantanea di Claude	5.000	0,0008 USD	0,004 USD	15.000	0,0024 USD	0,036 USD				0,04 USD
Inferenza Claude 2.1	5.000	0,008 USD	0,04 USD	20.000	0,024 USD	0,48 USD				0,52 USD
Attività umane							50	0,21 USD	10,50 USD	10,50 USD
Totale										11,06 USD

Esempio di valutazione del modello 2:

Prezzi on demand
Uno sviluppatore di applicazioni invia un set di dati per la valutazione del modello basato sull'uomo utilizzando Anthropic Claude 2.1 e Anthropic Claude Instant nella Regione AWS Stati Uniti orientali (Virginia settentrionale).

Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 worker per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro "worker per prompt"). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni worker: 2 worker x 50 set di risposta rapida = 100 attività umane).

I 50 prompt si combinano in 5.000 token di input e le risposte associate si combinano in 15.000 token per Anthropic Claude Instant e 20.000 token per Anthropic Claude 2.1.

Per questo lavoro di valutazione del modello sono previsti i seguenti costi:

Elemento	Numero di token di input	Prezzo per 1.000 token di input	Costo dell'input	Numero di token di uscita	Prezzo per 1.000 token di output	Costo dell’output	Numero di attività umane	Prezzo per attività umana	Costo delle attività umane	Totale
Inferenza istantanea di Claude	5.000	0,0008 USD	0,0040 USD	15.000	0,0024 USD	0,036 USD				0,04 USD
Inferenza Claude 2.1	5.000	0,008 USD	0,0400 USD	20.000	0,024 USD	0,48 USD				0,52 USD
Attività umane							100	0,21 USD	21,00 USD	21,00 USD
Totale										21,56 USD

Guardrail per Amazon Bedrock

Esempio 1: chatbot per l'assistenza clienti
Uno sviluppatore di applicazioni crea un chatbot per l'assistenza clienti e utilizza i filtri dei contenuti per bloccare i contenuti dannosi e gli argomenti negati per filtrare domande e risposte indesiderate.

Il chatbot risponde a 1.000 richieste di utenti all'ora. Ogni richiesta utente ha una lunghezza media di input di 200 caratteri e riceve una risposta FM di 1.500 caratteri.

Ogni richiesta utente di 200 caratteri corrisponde a 1 unità di testo.

Ogni risposta FM di 1.500 caratteri corrisponde a 2 unità di testo.

Unità di testo elaborate ogni ora = (1 + 2) x 1.000 interrogazioni = 3.000 unità di testo

Costo totale sostenuto all'ora per i filtri dei contenuti e l'argomento negato = 3.000 x (0,75 USD + 1,00 USD)/1.000 = 5,25 USD

Esempio 2: riepilogo della trascrizione del call center
Uno sviluppatore di applicazioni crea un'applicazione per riepilogare le trascrizioni delle chat tra utenti e agenti dell'assistenza. Utilizza un filtro per informazioni sensibili per oscurare le informazioni di identificazione personale (PII) nei riepiloghi generati per 10.000 conversazioni.

Ogni riepilogo generato ha una media di 3.500 caratteri che corrispondono a 4 unità di testo.

Costo totale sostenuto per riassumere 10.000 conversazioni = 10.000 x 4 x (0,1/1.000 USD) = 4 USD

Elemento	Numero di token di input	Prezzo per 1.000 token di input	Costo dell'input	Numero di token di uscita	Prezzo per 1.000 token di output	Costo dell’output	Numero di attività umane	Prezzo per attività umana	Costo delle attività umane	Totale
Inferenza istantanea di Claude	5.000	0,0008 USD	0,004 USD	15.000	0,0024 USD	0,036 USD				0,04 USD
Inferenza Claude 2.1	5.000	0,008 USD	0,04 USD	20.000	0,024 USD	0,48 USD				0,52 USD
Attività umane							100	0,21 USD	21,00 USD	21,00 USD
Totale										21,56 USD

Prezzi di Amazon Bedrock

Panoramica dei prezzi

Modelli di prezzo

On-Demand

Batch

Provisioned Throughput

Personalizzazione del modello

Valutazione di modelli

Potenti strumenti da costruire senza costi aggiuntivi

Ripartizione dei prezzi

AI21 Labs

Amazon

Anthropic

Cohere

Meta Llama

Mistral AI

Stability AI

Guardrail per Amazon Bedrock

Esempi di prezzo

AI21 Labs

Amazon

Prezzi su richiesta

Prezzi di personalizzazione (ottimizzazione e pre-addestramento continuo)

Prezzi del throughput fornito

Anthropic

Prezzi su richiesta

Prezzi del throughput fornito

Cohere

Prezzi su richiesta

Prezzi per la personalizzazione (ottimizzazione)

Meta Llama

Prezzi su richiesta

Prezzi per la personalizzazione (ottimizzazione)

Prezzi del throughput fornito

Mistral AI

Prezzi su richiesta

Stability AI

Prezzi su richiesta

Prezzi del throughput fornito

Valutazione di modelli

Esempio di valutazione del modello 1:

Esempio di valutazione del modello 2:

Guardrail per Amazon Bedrock

Fine del supporto per Internet Explorer