Servizio di machine learning – Prezzi di Amazon SageMaker

Amazon SageMaker aiuta sviluppatori e data scientist a preparare, creare, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità, combinando un'ampia gamma di funzionalità create ad hoc per il ML. SageMaker supporta i framework di machine learning, i kit di strumenti e i linguaggi di programmazione principali

I prezzi di SageMaker sono calcolati in base all'uso effettivo. Esistono due opzioni di pagamento: i prezzi on demand, senza tariffa minima né impegni anticipati, e i Savings Plans di SageMaker, che offrono un modello di determinazione dei prezzi flessibile e basato sul consumo in cambio dell'impegno ad un uso costante del servizio.

Piano gratuito di Amazon SageMaker

La prova di Amazon SageMaker Studio è gratuita. Grazie al piano gratuito di AWS, puoi iniziare a utilizzare Amazon SageMaker gratuitamente. Il piano gratuito si attiva il primo giorno del mese in cui crei la tua prima risorsa SageMaker. I dettagli del piano gratuito per Amazon SageMaker sono riportati nella tabella di seguito.

Funzionalità di Amazon SageMaker	Uso del piano gratuito mensile per i primi 2 mesi
Notebook Studio e istanze notebook	250 ore di istanza ml.t3.medium sui notebook Studio OPPURE 250 ore di istanza ml.t2 medium o ml.t3.medium su istanze notebook
RStudio su SageMaker	250 ore di istanze ml.t3.medium su app RSession E istanza ml.t3.medium gratuita per app RStudioServerPro
Data Wrangler	25 ore di istanza ml.m5.4xlarge
Archivio funzionalità	10 milioni di unità di scrittura, 10 milioni di unità di lettura, 25 GB di spazio di archiviazione (negozio online standard)
Formazione	50 ore di istanze m4.xlarge o m5.xlarge
Amazon SageMaker con TensorBoard	300 ore di istanza ml.r5.large
Inferenza in tempo reale	125 ore di istanze m4.xlarge o m5.xlarge
Inferenza serverless	Durata di 150.000 secondi dell'inferenza on demand
Canvas	160 ore/mese per la durata della sessione
HyperPod	50 ore di istanza m5.xlarge
	Utilizzo mensile del piano gratuito per i primi 6 mesi
Esperimenti	100.000 record di parametri acquisiti al mese, 1 milione di record di parametri recuperati al mese e 100.000 record di parametri archiviati al mese

Calcolatore prezzi di AWS

Calcola il costo di Amazon SageMaker e dell'architettura in un unico preventivo.

Crea ora il tuo preventivo personalizzato »

Prezzi on demand

Studio Classic
Amazon SageMaker Studio Classic
Studio Classic offre notebook Jupyter in un unico passaggio nella nostra esperienza IDE legacy. Le risorse di calcolo sottostanti sono elastiche e i notebook possono essere facilmente condivisi con altri consentendo una collaborazione senza interruzioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
JupyterLab
Amazon SageMaker JupyterLab
Avvia JupyterLab completamente gestito in pochi secondi. Utilizza il più recente ambiente di sviluppo interattivo basato sul Web per notebook, codice e dati. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
Editor di codice
Editor di codice Amazon SageMaker
L'editor di codice, basato su Code-OSS (Visual Studio Code - Open Source), consente di scrivere, testare, eseguire il debug ed eseguire analisi e codice ML. È completamente integrato con SageMaker Studio e supporta le estensioni IDE disponibili nel registro delle estensioni Open VSX.
RStudio
RStudio
RStudio offre risorse di calcolo cloud on demand per accelerare lo sviluppo dei modelli e migliorare la produttività. Ti vengono addebitati i tipi di istanza che scegli per eseguire l'applicazione RStudio Session e l'applicazione RStudio Server Pro.

App RStudioServerPro
Istanze notebook
Istanze notebook
Le istanze notebook sono istanze di calcolo che eseguono l'applicazione notebook Jupyter. Ti sarà addebitato l'importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
Processing
Amazon SageMaker Processing
Amazon SageMaker Processing consente di eseguire facilmente i carichi di lavoro di pre-elaborazione, post-elaborazione e valutazione del modello su un'infrastruttura completamente gestita. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
TensorBoard
Amazon SageMaker con TensorBoard
Amazon SageMaker con TensorBoard offre un'esperienza TensorBoard in hosting per visualizzare ed eseguire il debug dei problemi di convergenza dei modelli per le attività di addestramento Amazon SageMaker.
Data Wrangler
Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler riduce il tempo richiesto per l'aggregazione e la preparazione dei dati per il machine learning da settimane a pochi minuti. Ti sarà addebitato solo il costo del tempo impiegato per ripulire, esplorare e visualizzare i dati. I clienti che utilizzano le istanze di SageMaker Data Wrangler sono soggetti ai prezzi di seguito.* I clienti che utilizzano SageMaker Data Wrangler su istanze di workspace SageMaker Canvas sono soggetti ai prezzi di SageMaker Canvas. Consulta la pagina dei prezzi di SageMaker Canvas per maggiori dettagli.

Processi di Amazon SageMaker Data Wrangler

Un processo di Amazon SageMaker Data Wrangler viene creato quando un flusso di dati viene esportato da SageMaker Data Wrangler. Con i processi SageMaker Data Wrangler, puoi automatizzare i tuoi flussi di lavoro di preparazione dei dati. Questi processi ti consentono di applicare nuovamente i tuoi flussi di lavoro di preparazione dei dati a nuovi set di dati in modo da risparmiare tempo e poter fatturare al secondo.
Feature Store
Amazon SageMaker Feature Store
L'archivio delle funzionalità di Amazon SageMaker è un repository centrale che consente di acquisire, archiviare e utilizzare le funzionalità per il machine learning. Il gruppo di funzionalità scrittura, lettura e archiviazione di dati nell'archivio funzionalità di SageMaker sono a pagamento, con prezzi diversi per l'archivio online standard e l'archivio online in memoria.

Per l'archivio online standard, l'archiviazione di dati viene addebitata per GB al mese. Per quanto riguarda la velocità di trasmissione effettiva, è possibile scegliere tra la modalità di capacità on demand o con provisioning. Per la modalità on demand, le scritture vengono addebitate come unità di richiesta di scrittura per KB e le letture vengono addebitate come unità di richiesta di lettura per 4 KB. Per la modalità di capacità con provisioning, si specifica la capacità di lettura e scrittura che ci si aspetta che l'applicazione richieda. L'archivio funzionalità di Sagemaker addebita una WCU per ogni scrittura al secondo (fino a 1 KB) e una RCU per ogni lettura al secondo (fino a 4 KB). Ti verranno addebitati i costi per la capacità effettiva di trasmissione (letture e scritture) assegnata al gruppo di funzionalità, anche se non la utilizzi completamente.

Per l'archivio online in memoria, le scritture vengono addebitate come unità di richiesta di scrittura per KB con un minimo di 1 unità per scrittura, le letture vengono addebitate come unità di richiesta di lettura per KB con un minimo di 1 unità per lettura e l'archiviazione di dati viene addebitata per GB all'ora. È previsto un costo minimo di archiviazione di dati di 5 GiB (5,37 GB) all'ora per il negozio online in memoria.
Formazione
Amazon SageMaker Training
Amazon SageMaker semplifica la formazione dei modelli di machine learning fornendo tutto il necessario per formare, ottimizzare ed eseguire il debug dei modelli. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Debugger per eseguire il debug dei problemi e monitorare le risorse durante la formazione, puoi utilizzare le regole integrate per eseguire il debug dei processi di formazione oppure scrivere le tue regole personalizzate. L’uso delle regole integrate per il debug dei tuoi processi di formazione non implica alcun costo aggiuntivo. Per le regole personalizzate, ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
Esperimenti

Esperimenti Amazon SageMaker
Esperimenti Amazon SageMaker consente di organizzare, tracciare e confrontare gli esperimenti di ML. Vengono addebitati l'acquisizione, il recupero e l'archiviazione dei record di parametri. Un record di parametri è una coppia chiave-valore di dati parametrici. L'acquisizione e il recupero vengono addebitati in base al numero di record di parametri. L'archiviazione viene addebitata in base al numero di record di parametri archiviati al mese. Puoi utilizzare SageMaker Studio per visualizzare gli esperimenti senza costi aggiuntivi.

Tipo di costo	Prezzo
Acquisizione	1,25 USD per milione di record di parametri
Recupero	0,25 USD per milione di record di parametri
Archiviazione	0,25 USD per milione di record di parametri al mese

Inferenza in tempo reale
Amazon SageMaker Hosting: inferenza in tempo reale
Amazon SageMaker fornisce inferenza in tempo reale per i tuoi casi d’uso che hanno bisogno di previsioni in tempo reale. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Model Monitor per gestire modelli altamente precisi che forniscono inferenze in tempo reale, per monitorare i modelli puoi utilizzare le regole integrate o scriverne di personalizzate. Per le regole integrate, hai diritto all'utilizzo gratuito di massimo 30 ore di monitoraggio. I costi aggiuntivi dipenderanno dalla durata dell'utilizzo. Se invece utilizzi le tue regole personalizzate, ti verrà addebitato un importo separato.
Asynchronous Inference
Amazon SageMaker Asynchronous Inference:
Amazon SageMaker Asynchronous Inference è un'opzione di inferenza in tempo quasi reale che mette in coda richieste in entrata, elaborandole in maniera asincrona. Utilizza questa opzione quando hai bisogno di elaborare grandi payload all'arrivo dei dati o eseguire modelli che richiedono lunghi tempi di elaborazione dell'inferenza e non richiedono latenza inferiore al secondo. Pagherai per il tipo di istanza scelto.
Trasformazione in batch
Trasformazione in batch con Amazon SageMaker
Con la trasformazione in batch di Amazon SageMaker, non è necessario porzionare il set di dati o gestire gli endpoint in tempo reale. La trasformazione in batch di SageMaker permette di eseguire analisi predittive su batch di dati di piccole e grandi dimensioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
Inferenza serverless
Amazon SageMaker Serverless Inference
Il servizio Inferenza serverless Amazon SageMaker consente di implementare modelli di machine learning per l'inferenza senza configurare o gestire alcuna infrastruttura sottostante. Puoi utilizzare Inferenza serverless on demand o aggiungere la concorrenza assegnata al tuo endpoint per avere prestazioni prevedibili.

Con Inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L’addebito per il calcolo dipende dalla configurazione di memoria che scegli.

Concorrenza assegnata

Facoltativamente, puoi anche abilitare la concorrenza assegnata per i tuoi endpoint serverless. La concorrenza assegnata consente di implementare modelli su endpoint serverless con prestazioni prevedibili e scalabilità elevata, mantenendo gli endpoint pronti per un numero di richieste simultanee e il tempo specificati. Come per Inferenza serverless on demand, quando la funzionalità di concorrenza assegnata è abilitata, si paga in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. Paghi anche per l'utilizzo di concorrenza assegnata, in base alla memoria configurata, alla durata fornita e alla quantità di concorrenza abilitata.
JumpStart
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart ti aiuta a iniziare a utilizzare il machine learning rapidamente e facilmente tramite l'accesso con un clic alle raccolte di modelli popolari (note anche come "model zoo"). Jumpstart offre anche soluzioni end-to-end che risolvono casi d'uso comuni di ML e che possono essere personalizzate in base alle tue esigenze. Non sono previsti costi aggiuntivi per l'utilizzo di modelli o soluzioni JumpStart. Ti verranno addebitate le ore di istanze di formazione e inferenza sottostanti utilizzate come se le avessi create manualmente.
Profiler
Amazon SageMaker Profiler raccoglie dati a livello di sistema per la visualizzazione di grafici di traccia di CPU e GPU ad alta risoluzione. Questo strumento è progettato per aiutare i data scientist e gli ingegneri a identificare gli ostacoli prestazionali legati all'hardware nei loro modelli di deep learning, risparmiando tempi e costi di formazione end-to-end. Attualmente SageMaker Profiler supporta solo la profilazione dei processi di addestramento tramite i tipi di istanze di calcolo di addestramento ml.g4dn.12xlarge, ml.p3dn.24xlarge e ml.p4d.24xlarge.

Regioni: Stati Uniti orientali (Ohio), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Europa (Francoforte), Europa (Irlanda) e Israele (Tel Aviv).

Profilatore Amazon SageMaker è attualmente in anteprima ed è disponibile gratuitamente per i clienti nelle regioni supportate.
HyperPod
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod è stato creato appositamente per accelerare lo sviluppo di modelli di fondazione (FM). Per rendere l'addestramento del FM più resistente, monitora continuamente lo stato del cluster, ripara e sostituisce istantaneamente i nodi difettosi e salva i controlli frequenti per riprendere automaticamente l'allenamento senza perdere i progressi. SageMaker HyperPod è preconfigurato con le librerie di formazione distribuite SageMaker che consentono di migliorare le prestazioni di addestramento dei FM utilizzando appieno l'infrastruttura di calcolo e di rete del cluster

Dettagli delle istanze

Dettagli del prodotto istanza P5 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria istanza (TiB)	Modello GPU	GPU	Memoria GPU totale (GB)	Memoria per GPU (GB)	Larghezza di banda della rete (Gb/s)	GPUDirect RDMA	Peer to peer GPU	Storage dell’istanza (TB)	Larghezza di banda EBS (Gb/s)
ml.p5.48xlarge	192	2	NVIDIA H100	8	640 HBM3	80	3200 EFAv2	Sì	NVSwitch a 900 Gb/s	8x3,84 NVMe SSD	80

Dettagli del prodotto istanza P4d di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria istanza (GiB)	Modello GPU	GPU	Memoria GPU totale (GB)	Memoria per GPU (GB)	Larghezza di banda della rete (Gb/s)	GPUDirect RDMA	Peer to peer GPU	Archiviazione istanza (GB)	Larghezza di banda EBS (Gb/s)
ml.p4d.24xlarge	96	1152	NVIDIA A100	8	320 HBM 2	40	400 ENA ed EFA	Sì	NVSwitch a 600 GB/s	8x1000 SSD NVMe	19
ml.p4de.24xlarge	96	1152	NVIDIA A100	8	640 HNM2e	80	400 ENA ed EFA	Sì	NVSwitch a 600 GB/s	8X1000 NVMe SSD	19

Dettagli del prodotto istanza P3 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria istanza (GiB)	Modello GPU	GPU	Memoria GPU totale (GB)	Memoria per GPU (GB)	Larghezza di banda della rete (Gb/s)	Peer to peer GPU	Archiviazione istanza (GB)	Larghezza di banda EBS (Gb/s)
ml.p3.2xlarge	8	61	NVIDIA V100	1	16	16	Fino a 10	N/D	Solo EBS	1,5
ml.p3.8xlarge	32	244	NVIDIA V100	4	64	16	10	NVLink	Solo EBS	7
ml.p3.16xlarge	64	488	NVIDIA V100	8	128	16	25	NVLink	Solo EBS	14
ml.p3dn.24xlarge	96	768	NVIDIA V100	8	256	32	100	NVLink	2 x 900 SSD NVMe	19

Dettagli del prodotto istanza P2 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria istanza (GiB)	Modello GPU	GPU	Memoria GPU totale (GB)	Memoria per GPU (GB)	Larghezza di banda della rete (Gb/s)	Larghezza di banda EBS (Gb/s)
ml.p2.xlarge	4	61	NVIDIA K80	1	12	12	Fino a 10	Elevate
ml.p2.8xlarge	32	488	NVIDIA K80	8	96	12	10	10
ml.p2.16xlarge	64	732	NVIDIA K80	16	192	12	25	20

Dettagli del prodotto istanza G4 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria istanza (GiB)	Modello GPU	GPU	Memoria GPU totale (GB)	Memoria per GPU (GB)	Larghezza di banda della rete (Gb/s)	Archiviazione istanza (GB)	Larghezza di banda EBS (Gb/s)
ml.g4dn.xlarge	4	16	NVIDIA T4	1	16	16	Fino a 25	1 x 125 SSD NVMe	Fino a 3,5
ml.g4dn.2xlarge	8	32	NVIDIA T4	1	16	16	Fino a 25	1 x 125 SSD NVMe	Fino a 3,5
ml.g4dn.4xlarge	16	64	NVIDIA T4	1	16	16	Fino a 25	1 x 125 SSD NVMe	4,75
ml.g4dn.8xlarge	32	128	NVIDIA T4	1	16	16	50	1 x 900 SSD NVMe	9,5
ml.g4dn.16xlarge	64	256	NVIDIA T4	1	16	16	50	1 x 900 SSD NVMe	9,5
ml.g4dn.12xlarge	48	192	NVIDIA T4	4	64	16	50	1 x 900 SSD NVMe	9,5

Dettagli del prodotto istanza G5 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria istanza (GiB)	Modello GPU	GPU	Memoria GPU totale (GB)	Memoria per GPU (GB)	Larghezza di banda della rete (Gb/s)	Larghezza di banda EBS (Gb/s)	Archiviazione istanza (GB)
ml.g5n.xlarge	4	16	NVIDIA A10G	1	24	24	Fino a 10	Fino a 3,5	1x250
ml.g5.2xlarge	8	32	NVIDIA A10G	1	24	24	Fino a 10	Fino a 3,5	1x450
ml.g5.4xlarge	16	64	NVIDIA A10G	1	24	24	Fino a 25	8	1x600
ml.g5.8xlarge	32	128	NVIDIA A10G	1	24	24	25	16	1x900
ml.g5.16xlarge	64	256	NVIDIA A10G	1	24	24	25	16	1x1900
ml.g5.12xlarge	48	192	NVIDIA A10G	4	96	24	40	16	1x3800
ml.g5.24xlarge	96	384	NVIDIA A10G	4	96	24	50	19	1x3800
ml.g5.48xlarge	192	768	NVIDIA A10G	8	192	24	100	19	2x3800

Dettagli del prodotto istanza Trn1 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria (GiB)	Acceleratori Trainium	Memoria acceleratore (GB)	Memoria per acceleratore (GB)	Archiviazione istanza (GB)	Larghezza di banda di rete (Gb/s)	Larghezza di banda EBS (Gb/s)
ml.trn1.2xlarge	8	32	1	32	32	1 x 500 SSD NVMe	Fino a 12,5	Fino a 20
ml.trn1.32xlarge	128	512	16	512	32	4 x 2000 SSD NVMe	800	80

Dettagli del prodotto istanza Inf1 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria (GiB)	Acceleratori Inferentia	Memoria acceleratore (GB)	Memoria per acceleratore (GB)	Archiviazione di istanze	Interconnessione tra acceleratori	Larghezza di banda di rete (Gb/s)	Larghezza di banda EBS (Gb/s)
ml.inf1.xlarge	4	8	1	8	8	Solo EBS	N/D	Fino a 25	fino a 4,75
ml.inf1.2xlarge	8	16	1	8	8	Solo EBS	N/D	Fino a 25	fino a 4,75
ml.inf1.6xlarge	24	48	4	32	8	Solo EBS	Sì	25	4,75
ml.inf1.24xlarge	96	192	16	128	8	Solo EBS	sì	100	19

Dettagli del prodotto istanza Inf2 di Amazon SageMaker

Dimensioni istanza	vCPU	Memoria (GiB)	Acceleratori Inferentia	Memoria acceleratore (GB)	Memoria per acceleratore (GB)	Archiviazione di istanze	Interconnessione tra acceleratori	Larghezza di banda di rete (Gb/s)	Larghezza di banda EBS (Gb/s)
ml.inf2.xlarge	4	16	1	32	32	Solo EBS	N/D	Fino a 25	Fino a 10
ml.inf2.8xlarge	32	128	1	32	32	Solo EBS	N/D	Fino a 25	10
ml.inf2.24xlarge	96	384	6	196	32	Solo EBS	Sì	50	30
ml.inf2.48xlarge	192	768	12	384	32	Solo EBS	Sì	100	60

Amazon SageMaker Studio

Amazon SageMaker Studio è un'unica interfaccia basata sul Web per lo sviluppo completo di ML, che offre una scelta di ambienti di sviluppo integrati (IDE) completamente gestiti e strumenti personalizzati. È possibile accedere a SageMaker Studio gratuitamente. Ti verranno addebitati solo i costi di calcolo e archiviazione sottostanti utilizzati per diversi IDE e strumenti ML all'interno di SageMaker Studio.

Puoi utilizzare molti servizi di SageMaker Studio, AWS SDK per Python (Boto3) o Interfaccia della linea di comando AWS (AWS CLI), tra cui:

IDE su SageMaker Studio per eseguire lo sviluppo di ML completo con un ampio set di IDE completamente gestiti, tra cui JupyterLab, Code Editor basato su Code-OSS (Visual Studio Code – Open Source) ed RStudio
Pipeline di SageMaker per automatizzare e gestire i flussi di lavoro ML
Pilota automatico SageMaker per creare automaticamente modelli di ML con visibilità completa
Esperimenti SageMaker per organizzare e tenere traccia di processi e versioni
Debugger SageMaker per eseguire il debug delle anomalie durante l'addestramento
SageMaker Model Monitor per mantenere modelli di alta qualità
SageMaker Clarify per spiegare meglio i modelli ML e individuare gli errori
SageMaker JumpStart per implementare facilmente soluzioni ML per numerosi casi d'uso. Ti possono essere addebitati costi relativi ad altri servizi AWS utilizzati nella soluzione per le chiamate API sottostanti effettuate da Amazon SageMaker per tuo conto.
SageMaker Inference Recommender per ottenere suggerimenti per la corretta configurazione degli endpoint

Paghi solo per le risorse di calcolo e archiviazione sottostanti all'interno di SageMaker o altri servizi AWS, in base al tuo utilizzo.

Valutazioni dei modelli di fondazione

SageMaker Clarify supporta le valutazioni dei modelli di fondazione con metodi di valutazione automatici e a base umana. Ogni tipo di valutazione ha prezzi diversi. Se stai valutando un modello di fondazione di Amazon SageMaker JumpStart che non è ancora stato distribuito nel tuo account, SageMaker distribuirà temporaneamente il modello JumpStart su un'istanza SageMaker per la durata dell'inferenza. L'istanza specifica sarà conforme alla raccomandazione sull'istanza fornita da JumpStart per quel modello.

Valutazione automatica:
Le valutazioni dei modelli di fondazione vengono eseguite come processo di elaborazione SageMaker. Il processo di valutazione richiamerà SageMaker Inference. I clienti pagano l'inferenza e il lavoro di valutazione. Ai clienti viene addebitato solo il costo della durata del lavoro di valutazione. Il costo del processo di valutazione corrisponde alla somma del costo orario dell'istanza di valutazione e del costo orario dell'istanza di hosting.

Valutazione a base umana:
Quando si utilizza la funzionalità di valutazione a base umana e si coinvolge la propria forza lavoro, vengono addebitati tre elementi: 1) l'istanza SageMaker utilizzata per l'inferenza, 2) l'istanza utilizzata per eseguire il processo d elaborazione di SageMaker che ospita la valutazione umana e 3) un addebito di 0,21 USD per attività di valutazione umana completata. Un'attività umana è definita come l'evento in cui un lavoratore umano invia una valutazione di un singolo prompt e delle relative risposte di inferenza nell'interfaccia utente di valutazione umana. Il prezzo è lo stesso sia che tu abbia 1 o 2 modelli nel tuo processo di valutazione sia che porti la tua inferenza, ed è lo stesso indipendentemente dal numero di dimensioni di valutazione e metodi di valutazione che includi. Il prezzo di 0,21 USD per attività è lo stesso per tutte le Regioni AWS. Non è previsto alcun costo separato per la forza lavoro, poiché la forza lavoro viene fornita da te.

Valutazione gestita da AWS:
Per una valutazione da parte di esperti gestita da AWS, i prezzi sono personalizzati in base alle tue esigenze di valutazione, mediante un accordo privato con il team di valutazione degli esperti di AWS.

Amazon SageMaker Studio Lab

Puoi costruire e addestrare modelli di machine learning utilizzando Amazon SageMaker Studio Lab gratuitamente. SageMaker Studio Lab offre a sviluppatori, accademici e data scientist un ambiente di sviluppo senza configurazione per imparare e sperimentare con il machine learning senza costi aggiuntivi.

Amazon SageMaker Canvas

Amazon SageMaker Canvas espande l'accesso al ML fornendo ai business analyst la capacità di generare previsioni precise di ML utilizzando un'interfaccia grafica immediata, senza bisogno di codifica o esperienza di ML.

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling fornisce due offerte di etichettatura dei dati, Amazon SageMaker Ground Truth Plus e Amazon SageMaker Ground Truth. Puoi ottenere ulteriori informazioni su Amazon SageMaker Data Labeling, un servizio di etichettatura dei dati interamente gestito che semplifica la creazione di set di dati di addestramento altamente precisi per il machine learning.

Esecuzione di shadow test con Amazon SageMaker

SageMaker facilita l'esecuzione di shadow test per valutare un nuovo modello di ML prima del rilascio in produzione verificandone le prestazioni rispetto al modello attualmente implementato. L'esecuzione di shadow test SageMaker non prevede altri addebiti all'infuori dei costi di utilizzo delle istanze ML e dello spazio di archiviazione ML allocati per l'hosting del modello shadow. I prezzi per le istanze ML e le dimensioni di archiviazione ML corrispondono a quelli dell'opzione di inferenza in tempo reale specificata nella tabella dei prezzi di cui sopra. I dati elaborati all'interno e all'esterno delle implementazioni shadow non prevedono costi aggiuntivi.

Amazon SageMaker Edge

Scopri i prezzi di Amazon SageMaker Edge per ottimizzare, eseguire e monitorare i modelli ML sui parchi istanze di dispositivi edge.

Savings Plans di Amazon SageMaker

I Savings Plans di Amazon SageMaker contribuiscono a ridurre i costi fino al 64%. I piani si applicano automaticamente all'uso idoneo delle istanze ML SageMaker, inclusi SageMaker Studio Notebooks, istanze Notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference e SageMaker Batch Transform, indipendentemente dalla famiglia di istanze, dalla dimensione o dalla regione. Ad esempio, puoi modificare in qualsiasi momento l'uso da un'istanza CPU ml.c5.xlarge in esecuzione negli Stati Uniti orientali (Ohio) a un'istanza ml.Inf1 negli Stati Uniti occidentali (Oregon) per carichi di lavoro di inferenza e continuare automaticamente a pagare il prezzo di Savings Plans.

Ulteriori informazioni »

Costo totale di proprietà con Amazon SageMaker

Amazon SageMaker offre un costo totale di proprietà inferiore di almeno il 54% nell'arco di tre anni rispetto ad altre soluzioni basate sul cloud gestite dal cliente. Scopri di più con l’analisi TCO completa per Amazon SageMaker.

Esempi di prezzo

Esempio di prezzo #1: JupyterLab

In qualità di data scientist, trascorri 20 giorni utilizzando JupyterLab per una rapida sperimentazione su notebook, codice e dati per 6 ore al giorno su un'istanza ml.g4dn.xlarge. Crei e quindi esegui uno spazio JupyterLab per accedere all'IDE di JupyterLab. Il calcolo viene addebitato solo per l'istanza utilizzata quando lo spazio JupyterLab è in esecuzione. I costi di archiviazione per uno spazio JupyterLab maturano fino a quando non viene eliminato.

Calcolo

Istanza	Durata	Giorni	Durata totale	Costo orario	Totale
ml.g4dn.xlarge	6 ore	20	6 x 20 = 120 ore	0,7364 USD	88,368 USD

Archiviazione

Utilizzerai l'archiviazione SSD per uso generale per 480 ore (24 ore * 20 giorni). In una regione che addebita 0,1125 USD per GB al mese:
0,112 USD per GB al mese * 5 GB * 480 / (24 ore/giorno * 30 giorni al mese) = 0,373 USD

Esempio di prezzo #2: Code Editor

In qualità di ingegnere ML, trascorri 20 giorni utilizzando Code Editor per la modifica, l'esecuzione e il debug del codice di produzione ML per 6 ore al giorno su un'istanza ml.g4dn.xlarge. Viene creato e quindi si esegue uno spazio dell'editor di codice per accedere all'IDE dell'editor. Quando lo spazio dell'editor di codice è in esecuzione, il calcolo viene addebitato solo per l'istanza utilizzata. I costi di archiviazione per lo spazio dell'editor di codice si accumulano fino a quando lo spazio non viene eliminato.

Calcolo

Istanza	Durata	Giorni	Durata totale	Costo orario	Totale
ml.g4dn.xlarge	6 ore	20	6 x 20 = 120 ore	0,7364 USD	88,368 USD

Archiviazione

Esempio di prezzo #3: Studio Classic

Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo dei notebook di Amazon SageMaker Studio.

Apre il notebook 1 in un kernel TensorFlow su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
Apre il notebook 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue il notebook 1.
Lavora quindi contemporaneamente sul notebook 1 e sul notebook 2 per un'ora.
Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente sul notebook 1 e sul notebook 2, ogni applicazione del kernel verrà misurata per 0,5 ore e verrà fatturata 1 ora.

Applicazione kernel	Istanza notebook	Ore	Costo orario	Totale
TensorFlow	ml.c5.xlarge	1	0,204 USD	0,204 USD
TensorFlow	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Data Science	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Esempio di prezzo #4: RStudio

Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo di RStudio:

Avvia RSession 1 su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
Avvia RSession 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue RSession 1.
Lavora su RSesssion 1 e RSession 2 in contemporanea per un'ora.
Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente su RSession 1 e RSession 2, ogni applicazione Rsession verrà misurata per 0,5 ore e verrà fatturata 1 ora.

Nel frattempo, l'RServer è in esecuzione 24 ore su 24, 7 giorni su 7, non importa se ci sono RSessions in esecuzione o meno. Se l'amministratore sceglie "Small" (ml.t3.medium), allora è gratuito. Se l'amministratore sceglie "Medium" (ml.c5.4xlarge) o "Large" (ml.c5.9xlarge), allora viene addebitata ogni ora finché RStudio è abilitato per il dominio SageMaker.

App RSession	Istanza RSession	Ore	Costo orario	Totale
Base R	ml.c5.xlarge	1	0,204 USD	0,204 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
Base R	ml.c5.xlarge	0,5	0,204 USD	0,102 USD
				0,408 USD

Esempio di prezzo n. 5: Processing

Con Elaborazione Amazon SageMaker, sono addebitati esclusivamente i costi relativi alle istanze usate nell'esecuzione delle attività. Quando si forniscono i dati di input per l'elaborazione in Simple Storage Service (Amazon S3), Amazon SageMaker scarica i dati da Simple Storage Service (Amazon S3) nello spazio di archiviazione di file locale all'avvio di un'attività di elaborazione.

Il data analyst esegue un'attività di elaborazione per pre-elaborare e convalidare i dati su due istanze ml.m5.4xlarge per una durata di 10 minuti. Carica un set di dati da 100 GB in S3 come input dell'attività di elaborazione; i dati di output, all'incirca della stessa dimensione, vengono archiviati nuovamente in S3.

Ore	Istanze di elaborazione	Costo orario	Totale
1 * 2 * 0,167 = 0,334	ml.m5.4xlarge	0,922 USD	0,308 USD

Archiviazione (SSD) a scopo generico (GB)	Costo orario	Totale
100 GB * 2 = 200	0,14 USD	0,0032 USD

Subtotale per il processo di Amazon SageMaker Processing = 0,308 USD.
Subtotale per 200 GB di archiviazione SSD a scopo generico = 0,0032 USD.
Il costo totale per questo esempio è di 0,3112 USD.

Esempio di prezzo n. 6: Data Wrangler

Dalla tabella, usi Amazon SageMaker Data Wrangler per un totale di 18 ore in tre giorni per preparare i dati. Inoltre, crei un processo SageMaker Data Wrangler per preparare i dati aggiornati su base settimanale. Ogni processo dura 40 minuti e viene eseguito ogni settimana per un mese.

Costo mensile complessivo per l'uso di Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

Applicazione	Istanza SageMaker Studio	Giorni	Durata	Durata totale	Costo orario	Subtotale dei costi
SageMaker Data Wrangler	ml.m5.4xlarge	3	6 ore	18 ore	0,922 USD	16,596 USD
Processo SageMaker Data Wrangler	ml.m5.4xlarge	-	40 minuti	2,67 ore	0,922 USD	2,461 USD

Un data scientist passa tre giorni a utilizzare Amazon SageMaker Data Wrangler per pulire, esplorare e visualizzare i dati per 6 ore al giorno. Per eseguire la pipeline di preparazione dei dati, avvia quindi un processo di SageMaker Data Wrangler pianificato per essere eseguito settimanalmente.

La tabella di seguito riporta l'uso totale per il mese e i costi associati per l'utilizzo di Amazon SageMaker Data Wrangler.

Esempio di prezzo n. 7: archivio funzionalità

++ Tutte le unità di lettura frazionali sono arrotondate al primo numero intero successivo

Storage dei dati
Dati archiviati totali = 31,5 GB
Costo mensile per lo storage dei dati = 31,5 GB * 0,45 USD = 14,175 USD

Costo mensile complessivo per l’archivio funzionalità di Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

Giorno del mese	Scritture totali	Unità di scrittura totali	Letture totali	Unità di lettura totali
Dal giorno 1 al giorno 10	100.000 scritture (10.000 scritture * 10 giorni)	2.500.000 (100.000 * 25 KB)	100.000 (10.000 * 10 giorni)	700.000++ (100.000 * 25/4 KB)

Giorno 11	200.000 scritture	5.000.000 (200.000 * 25 KB)	200.000 letture	1.400.000++ (200.000 * 25/4 KB)

Dal giorno 12 al giorno 30	1.520.000 scritture (80.000 * 19 giorni)	38.000.000 (1.520.000 * 25 KB)	1.520.000 scritture (80.000 * 19 giorni)	10.640.000++ (1.520.000 * 25/4 KB)

Unità fatturabili totali		45.500.000 unità di scrittura		12.740.000 unità di lettura
Costo mensile per scritture e letture		56,875 USD (45,5 milioni di unità di scrittura * 1,25 USD per milione di scritture)		3,185 USD (12,74 milioni di unità di lettura * 0,25 USD per milione di letture)

Hai un'applicazione Web che emette letture e scritture di 25 KB ciascuna nell’archivio delle funzionalità di Amazon SageMaker. Per i primi 10 giorni di un mese, ricevi poco traffico sulla tua applicazione, risultando in 10.000 scritture e 10.000 letture ogni giorno nel Feature Store di SageMaker. L'undicesimo giorno, però, l'applicazione attira l'attenzione sui social media e il suo traffico si impenna raggiungendo 200.000 letture e 200.000 scritture, quel giorno. La tua applicazione finisce poi per avere un traffico più regolare, con una media di 80.000 letture e 80.000 scritture ogni giorno fino alla fine del mese.

La tabella di seguito riporta l'utilizzo totale per il mese e i costi associati per l'utilizzo dell’archivio delle funzionalità di Amazon SageMaker.

Esempio di prezzo n. 8: addestramento

Il costo totale per l’addestramento e il debug in questo esempio è 2,38 USD. Le istanze di calcolo e i volumi di archiviazione per uso generico impiegati dalle regole integrate del debugger Amazon SageMaker non comportano costi aggiuntivi.

	Archiviazione (SSD) a scopo generico per addestramento (GB)	Archiviazione (SSD) a scopo generico per le regole integrate del debugger (GB)	Archiviazione (SSD) a scopo generico per le regole personalizzate del debugger (GB)	Costo per GB/mese	Subtotale
Capacità usata	3	2	1
Costo	0 USD	Nessun costo aggiuntivo per i volumi di storage integrati	0 USD	0,10 USD	0 USD

Ore	Istanza di addestramento	Istanza di debug	Costo orario	Subtotale
4 * 0,5 = 2	ml.m4.4xlarge	n/d	0,96 USD	1,92 USD
4 * 0,5 * 2 = 4	n/d	Nessun costo aggiuntivo per le istanze di regole integrate	0 USD	0 USD
4 * 0,5 = 2	ml.m5.xlarge	n/d	0,23 USD	0,46 USD
				-------
				2,38 USD

Un data scientist ha lavorato una settimana su un modello per una nuova idea. Addestra 4 volte un modello su un ml.m4.4xlarge con processi di addestramento da 30 minuti con Amazon SageMaker Debugger abilitato e utilizzando 2 regole integrate e 1 regola personalizzata scritta da lei. Per la regola personalizzata, ha specificato l'istanza ml.m5.xlarge. Addestra utilizzando 3G di dati per la formazione in Simple Storage Service (Amazon S3), inoltrando l'output del modello da 1 GB in Simple Storage Service (Amazon S3). SageMaker crea volumi SSD (gp2) a scopo generico per ciascuna istanza di addestramento. Inoltre, crea volumi SSD (gp2) a scopo generico per ciascuna regola specificata. Per questo esempio, saranno creati in tutto 4 volumi SSD (gp2) a scopo generico. Il debugger SageMaker trasferisce 1 GB di dati di debug al bucket Amazon S3 del cliente.

Esempio di prezzo 9: esperimenti

	Costo	Totale unità	Costo mensile
Acquisizione	1,25 USD per milione di record di parametri	1 milione (= 1.000 data scientist x 10 volte x 20 periodi x 5 parametri) record di parametri acquisiti	1,25 USD (= 1,25 x 1)
Utilizzo di SageMaker Studio	0 USD		0 USD
Recupero	0,25 USD per milione di record di parametri	10 milioni (= 1 milione di parametri acquisiti * 10 recuperi per ogni parametro acquisito) di record di parametri recuperati	2,5 USD (= 0,25 * 10)
Archiviazione	0,25 USD per milione di record di parametri al mese	1 milione di record di parametri archiviati	0,25 USD (= 0,25 x 1)
Costo mensile totale			4 USD

Un workbench ML viene utilizzato da mille data scientist. Vengono condotti esperimenti addestrando i modelli con parametri e set di dati diversi. Ciascun data scientist addestra un modello dieci volte al mese in venti periodi e raccoglie cinque parametri personalizzati. Il workbench utilizza API di recupero per ottenere dati di esperimenti da Esperimenti SageMaker per eseguire analisi personalizzate. I data scientist confrontano i dati registrati attraverso dieci diverse iterazioni di addestramento per trovare il modello più idoneo. Secondo questo esempio, il costo sarebbe il seguente:

	Costo	Totale unità	Costo mensile
Acquisizione	1,25 USD per milione di record di parametri	100.000 (= 100 data scientist x 10 volte x 20 periodi x 5 parametri) record di parametri acquisiti	0,125 USD (= 1,25 x 100.000/1.000.000)
Utilizzo di SageMaker Studio	0 USD		0 USD
Recupero	0,25 USD per milione di record di parametri	0	0 USD
Archiviazione	0,25 USD per milione di record di parametri al mese	100.000 record di parametri archiviati	0,025 USD (= 0,25 x 100.000/1.000.000)
Costo mensile totale			0,15 USD

Un team di cento data scientist sta lavorando a un progetto per una nuova idea. Vengono condotti esperimenti addestrando i modelli con parametri e set di dati diversi. In media, ciascun data scientist addestra un modello dieci volte al mese in venti periodi e raccoglie cinque parametri personalizzati. I data scientist utilizzano SageMaker Studio per analizzare gli esperimenti. Secondo questo esempio, il costo sarebbe il seguente:

Esempio di prezzo n. 10: inferenza in tempo reale

Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese = 0,054 USD. Il costo totale per questo esempio è di 305,881 USD al mese.

Nota: per le regole integrate con istanze ml.m5.xlarge, vengono aggregate fino a 30 ore al mese di monitoraggio in tutti gli endpoint senza alcun costo.

Dati in entrata al mese - Hosting	Dati in uscita al mese - Hosting	Costo per GB in entrata o in uscita	Totale
100 MB * 31 = 3.100 MB		0,016 USD	0,0496 USD
	10 MB * 31 = 310 MB	0,016 USD	0,00496 USD

Ore al mese	Istanze di hosting	Istanze di monitoraggio modelli	Costo orario	Totale
24 * 31 * 2 = 1.488	ml.c5.xlarge		0,204 USD	303,522 USD
31 * 0,08 = 2,5		ml.m5.4xlarge	0,922 USD	2,305 USD

Il modello dell'esempio n. 5 viene implementato in produzione in due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Amazon SageMaker Model Monitor è abilitato con una (1) istanza ml.m5.4xlarge e il monitoraggio delle attività è pianificato una volta al giorno. Ciascuna attività di monitoraggio richiede 5 minuti per il completamento. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.

Esempio di prezzo n. 11: inferenza asincrona

Il subtotale per l’inferenza asincrona di SageMaker è di 15,81 USD + 0,56 USD + (2 * 0,0048) = 16,38 USD. Il costo totale dell’inferenza asincrona per questo esempio è di 16,38 USD al mese.

Dati in entrata al mese	Dati in uscita al mese	Costo per GB in entrata o in uscita	Totale
10 KB * 1.024 * 31 = 310 MB	10 KB * 1.024 * 31 = 310 MB	0,02 USD	0,0048
	10 KB * 1.024 * 31 = 310 MB	0,02 USD	0,0048

Archiviazione (SSD) a scopo generico (GB)	Costo per GB/mese	Totale
4	0,14 USD	0,56 USD

Ore al mese	Istanze di hosting	Costo orario	Totale
2,5 * 31 * 1 = 77,5	ml.c5.xlarge	0,20 USD	15,81 USD

L’inferenza asincrona di Amazon SageMaker addebita i costi per le istanze utilizzate dall'endpoint. Quando non stai elaborando attivamente delle richieste, puoi configurare la scalabilità automatica per dimensionare il conto delle istanze a zero e risparmiare sui costi. Per payload di input in Simple Storage Service (Amazon S3), non ci sono costi per leggere dati di input da Simple Storage Service (Amazon S3) e scrivere i dati di output su S3 nella stessa regione.

Il modello dell'esempio n. 5 è utilizzato per eseguire un endpoint SageMaker Asynchronous Inference. L'endpoint viene configurato per essere eseguito su 1 istanza ml.c5.xlarge e per ridurre il conto delle istanze a zero quando non stai elaborando attivamente delle richieste. L'istanza ml.c5.xlarge nell'endpoint ha uno spazio di archiviazione (SSD) a scopo generico allegato di 4 GB. In questo esempio, l'endpoint mantiene un costo delle istanze di 1 per 2 ore al giorno e ha un tempo di raffreddamento di 30 minuti, dopo il quale si riduce a un conto delle istanze pari a zero per il resto della giornata. Pertanto, pagherai per 2,5 ore di utilizzo al giorno.

L'endpoint elabora 1.024 richieste al giorno. La dimensione di ciascun corpo di richiesta/risposta di chiamata è di 10 KB e ogni payload di richiesta di inferenza in Simple Storage Service (Amazon S3) è di 100 MB. Gli output delle inferenze sono pari a 1/10 della dimensione dei dati di input archiviati in Simple Storage Service (Amazon S3) nella stessa regione. In questo esempio, i costi per l'elaborazione dei dati si applicano al corpo della richiesta e della risposta, ma non ai dati trasferiti a/da Amazon S3.

Esempio di prezzo n. 12: trasformazione in batch

Gli addebiti totali per l'inferenza in questo esempio sarebbero 2,88 USD.

Ore	Istanze di hosting	Costo orario	Totale
3 * 0,25 * 4 = 3 ore	ml.m4.4xlarge	0,96 USD	2,88 USD

Il modello dell'esempio n. 5 è utilizzato per eseguire una trasformazione in batch con SageMaker. Il data scientist esegue quattro processi di trasformazione in batc SageMaker separati su 3 istanze ml.m4.4xlarge per una durata di 15 minuti per ciascuna esecuzione. Carica poi un set di dati di valutazione di 1 GB in S3 per ciascuna esecuzione; le inferenze saranno 1/10 delle dimensioni dei dati in ingresso memorizzati in S3.

Esempio di prezzo n. 13: inferenza serverless on demand

Costi mensili di elaborazione dei dati

Elaborazione dei dati (GB)	Costo per GB in entrata o in uscita	Costi mensili di elaborazione dei dati
10 GB	0,016 USD	0,16 USD

Il subtotale per il costo della durata di SageMaker Serverless inference on demand è 40 USD. Il subtotale per il costo di elaborazione dei dati da 10 GB è 0,16 USD. Il costo complessivo per questo esempio è di 40,16 USD.

Costi di calcolo mensili

Numero di richieste	Durata di ciascuna richiesta	Durata totale dell’inferenza (sec)	Costo al secondo	Costi mensili per la durata dell’inferenza
10 milioni	100 ms	1 milione	0,00004 USD	40 USD

Con l’inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L'addebito per il calcolo dipende dalla configurazione di memoria che scegli.

Supponiamo che siano stati allocati 2 GB di memoria al proprio endpoint, questo sia stato eseguito 10 milioni di volte in un mese, abbia funzionato per 100 ms ogni volta e siano stati elaborati 10 GB di dati in entrata e in uscita in totale. Gli addebiti vengono calcolati come segue:

Esempio di prezzo n. 14: concorrenza assegnata su inferenza serverless

Supponiamo che tu stia gestendo un servizio di chatbot per un'azienda di elaborazione di buste paga. Ti aspetti un picco nelle richieste dei clienti a fine marzo, prima della scadenza per la presentazione della dichiarazione dei redditi. Tuttavia, per il resto del mese, prevedi un traffico basso. Quindi, decidi di implementare un endpoint serverless con 2 GB di memoria e di aggiungere una simultaneità assegnata di 100 per gli ultimi 5 giorni del mese nella fascia oraria 9:00-17:00 (8 ore), durante i quali l'endpoint elabora un totale di 10 milioni di richieste e 10 GB di dati in entrata e in uscita. Nel resto del mese, il chatbot funziona su Inferenza serverless on demand ed elabora 3 milioni di richieste e 3 GB di dati in entrata e in uscita. Supponiamo che la durata di ogni richiesta sia di 100 ms.

Costi della simultaneità assegnata (Provisioned Concurrency, PC)
Il prezzo della PC è di 0,000010 USD/s
Durata di utilizzo della PC (s) = 5 giorni * 100 PC * 8 ore * 3.600 s = 14.400.000 s
Costo di utilizzo della PC = 14.400.000 s * 0,000010 USD/s = 144 USD.

Costi della durata dell'inferenza per il traffico servito dalla simultaneità assegnata
Il prezzo della durata dell'inferenza è di 0,000023 USD/s
Durata totale dell'inferenza per PC (s) = 10 milioni * (100 ms)/1.000 = 1 milione di secondi.
Costi per la durata dell'inferenza per PC = 1.000.000 s * 0.,000023 USD/s = 23 USD

Costi della durata dell'inferenza on demand
Il prezzo di calcolo mensile è di 0,00004 USD/s e il piano gratuito offre 150.000 s.
Calcolo totale (s) = (3) milioni * (100 ms)/1.000 = 0,3 milioni di secondi.
Calcolo totale - calcolo incluso nel piano gratuito = calcolo fatturabili al mese in secondi
0,3 milioni s - 150.000 s = 150.000 s
Costi mensili per l'elaborazione = 150.000 * 0,00004 USD = 6 USD

Elaborazione dati
Costo/GB di dati elaborati in entrata/uscita = 0,016 USD
Totale GB elaborati = 10 + 3 = 13
Costo totale = 0,016 USD * 13 = 0,208 USD

Costi totali per marzo
Costi totali = costi di simultaneità assegnata + durata dell'inferenza per simultaneità assegnata + durata dell'inferenza per calcolo on demand + costi di elaborazione dati
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

Esempio di prezzo n. 15: Jumpstart

Il cliente utilizza JumpStart per implementare un modello BERT Base Uncased pre-addestrato per classificare il sentiment delle recensioni dei clienti come positivo o negativo.

Il cliente implementa il modello a due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.

Ore al mese	Istanze di hosting	Costo orario	Totale
24 * 31 * 2 = 1.488	ml.c5.xlarge	0,204 USD	303,55 USD

Dati in entrata al mese - Hosting	Dati in uscita al mese - Hosting	Costo per GB in entrata o in uscita	Totale
100 MB * 31 = 3.100 MB		0,02 USD	0,06 USD
	10 MB * 31 = 310 MB	0,02 USD	0,01 USD

Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Il subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese è 0,06 USD. Il costo totale per questo esempio è di 305,887 USD al mese.

Esempio di prezzo n. 16: HyperPod

Supponiamo che tu voglia un cluster di 64 p5 per 3 mesi di utilizzo continuo per supportare l'implementazione di modelli end-to-end.

Ore	Istanza di addestramento	Costo orario
3 mesi * 30 giorni * 24 ore = 2.160 ore	ml.p5.48xlarge	113,07 USD

Il costo totale per il cluster in questo esempio è di 244.321,20 USD

Esempio di prezzo n. 17: valutazioni del modello di fondazione (valutazione automatica)

Le valutazioni dei modelli di fondazione con SageMaker Clarify ti addebiteranno solo le istanze utilizzate durante l'esecuzione dei lavori di valutazione automatici. Quando si seleziona un'attività di valutazione automatica e un set di dati, SageMaker carica il set di dati prompt da Amazon S3 su un'istanza di valutazione SageMaker.

Nell'esempio seguente, un ingegnere ML esegue una valutazione del modello Llama2 7B negli Stati Uniti orientali (Virginia settentrionale) per rilevare l'accuratezza delle attività di riepilogo. Il tipo di istanza consigliato per l'inferenza per Llama 2 7B è ml.g5.2xlarge. L'istanza minima consigliata per una valutazione è ml.m5.2xlarge. In questo esempio, il processo viene eseguito per 45 minuti (a seconda delle dimensioni del set di dati). In questo esempio, il costo sarebbe di 1,48 USD per il lavoro di valutazione e i risultati dettagliati.

Ore del processo di elaborazione (esempio)	Regione	Tipo di istanza	Istanza	Costo orario	Costo
0,45	US-east-1	Hosting LLM	ml.g5.2xlarge	1,52 USD	1,14 USD
0,45	US-east-1	valutazione	ml.m5.2xlarge	0,46 USD	0,35 USD
Totale					1,48 USD

Nel prossimo esempio, lo stesso tecnico in Virginia esegue un altro lavoro di valutazione per l'accuratezza delle attività di riepilogo, ma utilizza una versione personalizzata di Llama 2 7B che viene distribuita sul proprio account ed entra in funzione. In questo caso, poiché il modello è già distribuito nel suo account, l'unico costo incrementale sarebbe quello dell'istanza di valutazione.

Ore del processo di elaborazione	Regione	Tipo di istanza	Istanza	Costo orario	Costo
0,45	US-east-1	valutazione	ml.m5.2xlarge	0,46 USD	0,35 USD
Totale					0,35 USD

Esempio di prezzo n. 18: valutazioni del modello di fondazione (valutazione a base umana)

Nell'esempio seguente, un ingegnere di machine learning negli Stati Uniti orientali (Virginia settentrionale) esegue una valutazione a base umana di Llama-2-7B per rilevare la precisione delle attività di riepilogo e utilizza la propria forza lavoro privata per questa valutazione. Il tipo di istanza consigliato per Llama-2-7B è ml.g5.2xlarge. L'istanza minima consigliata per un processo di elaborazione di valutazione a base umana è ml.t3.medium. L'inferenza su Llama-2-7B viene eseguita per 45 minuti (a seconda della dimensione del set di dati). Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 collaboratori per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro «collaboratore per prompt»). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni collaboratore: 2 collaboratori x 50 set di risposta rapida = 100 attività umane). La forza lavoro umana impiega un giorno (24 ore) per completare tutte le 100 attività di valutazione umana nel lavoro di valutazione (a seconda del numero e dal livello di abilità dei collaboratori e dalla lunghezza/complessità dei prompt e delle risposte di inferenza).

Ore di calcolo	Attività umane	Regione	Tipo di istanza	Istanza	Costo orario	Costo per attività umana	Costo totale
0,45		Stati Uniti orientali (Virginia settentrionale)	Hosting LLM	ml.g5.2xlarge	1,52 USD		1,14 USD
24		Stati Uniti orientali (Virginia settentrionale)	Processo di elaborazione	ml.t3.medium	0,05 USD		1,20 USD
	100	Qualsiasi				0,21 USD	21,00 USD
Totale							23,34 USD

Nel prossimo esempio, lo stesso tecnico negli Stati Uniti orientali (Virginia settentrionale) esegue lo stesso lavoro di valutazione ma utilizza Llama-2-7B già installato sul proprio account e già in funzione. In questo caso, l'unico costo incrementale sarebbe per il processo di elaborazione della valutazione e le attività umane.

Ore di calcolo	Attività umane	Regione	Tipo di istanza	Istanza	Costo orario	Costo per attività umana	Costo totale
24		Stati Uniti orientali (Virginia settentrionale)	Processo di elaborazione	ml.t3.medium	0,05 USD		1,20 USD
	100	Qualsiasi				0,21 USD	21,00 USD
Totale							22,20 USD

Fasi successive

Feature Page

Scopri la vasta gamma di funzionalità SageMaker

Ulteriori informazioni

Console

Inizia subito a utilizzare SageMaker nella Console di gestione AWS

Registrati ora

Prezzi di Amazon SageMaker