Amazon SageMaker aiuta sviluppatori e data scientist a preparare, creare, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità combinando un’ampia gamma di funzionalità create ad hoc per il ML. SageMaker supporta i framework di machine learning, i kit di strumenti e i linguaggi di programmazione principali
I prezzi di SageMaker sono calcolati in base all'uso effettivo. Esistono due opzioni di pagamento: i prezzi on demand, senza tariffa minima né impegni anticipati, e i Savings Plans di SageMaker, che offrono un modello di determinazione dei prezzi flessibile e basato sul consumo in cambio dell'impegno ad un uso costante del servizio.
Piano gratuito di Amazon SageMaker
La prova di Amazon SageMaker Studio è gratuita. Grazie al piano gratuito di AWS, puoi iniziare a utilizzare Amazon SageMaker gratuitamente. Il piano gratuito si attiva il primo giorno del mese in cui crei la tua prima risorsa SageMaker. I dettagli del piano gratuito per Amazon SageMaker sono riportati nella tabella di seguito.
Funzionalità di Amazon SageMaker | Uso del piano gratuito mensile per i primi 2 mesi |
Notebook Studio e istanze notebook | 250 ore di istanza ml.t3.medium sui notebook Studio OPPURE 250 ore di istanza ml.t2 medium o ml.t3.medium su istanze notebook |
RStudio su SageMaker | 250 ore di istanze ml.t3.medium su app RSession E istanza ml.t3.medium gratuita per app RStudioServerPro |
Data Wrangler | 25 ore di istanza ml.m5.4xlarge |
Feature Store | 10 milioni di unità di scrittura, 10 milioni di unità di lettura, 25 GB di archiviazione |
Formazione | 50 ore di istanze m4.xlarge o m5.xlarge |
Amazon SageMaker con TensorBoard | 300 ore di istanza ml.r5.large |
Inferenza in tempo reale | 125 ore di istanze m4.xlarge o m5.xlarge |
Inferenza serverless | Durata di 150.000 secondi dell'inferenza on demand |
Canvas | 160 ore al mese per tempo di sessione e fino a 10 richieste di creazione di modelli al mese, ognuna con un massimo di 1 milione di celle per richiesta di creazione di modelli |
Utilizzo mensile del piano gratuito per i primi 6 mesi | |
Esperimenti |
100.000 record di parametri acquisiti al mese, 1 milione di record di parametri recuperati al mese e 100.000 record di parametri archiviati al mese |
Prezzi on demand
-
Notebook Studio
-
RStudio su SageMaker
-
Istanze notebook
-
Processing
-
TensorBoard
-
Data Wrangler
-
Feature Store
-
Formazione
-
Esperimenti
-
Inferenza in tempo reale
-
Asynchronous Inference
-
Trasformazione in batch
-
Inferenza serverless
-
JumpStart
-
Profiler
-
Notebook Studio
-
Notebook Amazon SageMaker Studio
I notebook Amazon SageMaker Studio sono notebook Jupyter che possono essere attivati rapidamente con un semplice clic. Le risorse di calcolo sottostanti sono elastiche e i notebook possono essere facilmente condivisi con altri consentendo una collaborazione senza interruzioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
RStudio su SageMaker
-
RStudio su SageMaker
RStudio su SageMaker offre risorse di calcolo cloud on demand per accelerare lo sviluppo dei modelli e migliorare la produttività. Ti vengono addebitati i tipi di istanza che scegli per eseguire l'applicazione RStudio Session e l'applicazione RStudio Server Pro.
App RStudioServerPro
-
Istanze notebook
-
Istanze notebook
Le istanze notebook sono istanze di calcolo che eseguono l'applicazione notebook Jupyter. Ti sarà addebitato l'importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
Processing
-
Amazon SageMaker Processing
Amazon SageMaker Processing consente di eseguire facilmente i carichi di lavoro di pre-elaborazione, post-elaborazione e valutazione del modello su un'infrastruttura completamente gestita. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
TensorBoard
-
Amazon SageMaker con TensorBoard
Amazon SageMaker con TensorBoard offre un'esperienza TensorBoard in hosting per visualizzare ed eseguire il debug dei problemi di convergenza dei modelli per le attività di addestramento Amazon SageMaker.
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler riduce il tempo richiesto per l'aggregazione e la preparazione dei dati per il machine learning da settimane a pochi minuti. Ti sarà addebitato solo il costo del tempo impiegato per ripulire, esplorare e visualizzare i dati. SageMaker Data Wrangler viene fatturato per tipo di istanza al secondo.*
Processi di Amazon SageMaker Data Wrangler
Un processo di Amazon SageMaker Data Wrangler viene creato quando un flusso di dati viene esportato da SageMaker Data Wrangler. Con i processi SageMaker Data Wrangler, puoi automatizzare i tuoi flussi di lavoro di preparazione dei dati. Questi processi ti consentono di applicare nuovamente i tuoi flussi di lavoro di preparazione dei dati a nuovi set di dati in modo da risparmiare tempo e poter fatturare al secondo.
-
Feature Store
-
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store è un repository centrale che consente di acquisire, archiviare e utilizzare le funzionalità per il machine learning. Ti saranno addebitate le operazioni di scrittura, lettura e storage dei dati nel Feature Store di SageMaker. Le scritture vengono addebitate come unità di richiesta di scrittura per KB, le letture vengono addebitate come unità di richiesta di lettura per 4KB e lo storage dei dati viene addebitato per GB al mese.
-
Formazione
-
Amazon SageMaker Training
Amazon SageMaker semplifica la formazione dei modelli di machine learning fornendo tutto il necessario per formare, ottimizzare ed eseguire il debug dei modelli. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Debugger per eseguire il debug dei problemi e monitorare le risorse durante la formazione, puoi utilizzare le regole integrate per eseguire il debug dei processi di formazione oppure scrivere le tue regole personalizzate. L’uso delle regole integrate per il debug dei tuoi processi di formazione non implica alcun costo aggiuntivo. Per le regole personalizzate, ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
Esperimenti
-
Esperimenti Amazon SageMaker
Esperimenti Amazon SageMaker consente di organizzare, tracciare e confrontare gli esperimenti di ML. Vengono addebitati l'acquisizione, il recupero e l'archiviazione dei record di parametri. Un record di parametri è una coppia chiave-valore di dati parametrici. L'acquisizione e il recupero vengono addebitati in base al numero di record di parametri. L'archiviazione viene addebitata in base al numero di record di parametri archiviati al mese. Puoi utilizzare SageMaker Studio per visualizzare gli esperimenti senza costi aggiuntivi.
Tipo di costo Prezzo Acquisizione 1,25 USD per milione di record di parametri Recupero 0,25 USD per milione di record di parametri Archiviazione 0,25 USD per milione di record di parametri al mese -
Inferenza in tempo reale
-
Amazon SageMaker Hosting: inferenza in tempo reale
Amazon SageMaker fornisce inferenza in tempo reale per i tuoi casi d’uso che hanno bisogno di previsioni in tempo reale. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Model Monitor per gestire modelli altamente precisi che forniscono inferenze in tempo reale, per monitorare i modelli puoi utilizzare le regole integrate o scriverne di personalizzate. Per le regole integrate, hai diritto all'utilizzo gratuito di massimo 30 ore di monitoraggio. I costi aggiuntivi dipenderanno dalla durata dell'utilizzo. Se invece utilizzi le tue regole personalizzate, ti verrà addebitato un importo separato.
-
Asynchronous Inference
-
Amazon SageMaker Asynchronous Inference:
Amazon SageMaker Asynchronous Inference è un'opzione di inferenza in tempo quasi reale che mette in coda richieste in entrata, elaborandole in maniera asincrona. Utilizza questa opzione quando hai bisogno di elaborare grandi payload all'arrivo dei dati o eseguire modelli che richiedono lunghi tempi di elaborazione dell'inferenza e non richiedono latenza inferiore al secondo. Pagherai per il tipo di istanza scelto. -
Trasformazione in batch
-
Trasformazione in batch con Amazon SageMaker
Con la trasformazione in batch di Amazon SageMaker, non è necessario porzionare il set di dati o gestire gli endpoint in tempo reale. La trasformazione in batch di SageMaker permette di eseguire analisi predittive su batch di dati di piccole e grandi dimensioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
Inferenza serverless
-
Amazon SageMaker Serverless Inference
Il servizio Inferenza serverless Amazon SageMaker consente di implementare modelli di machine learning per l'inferenza senza configurare o gestire alcuna infrastruttura sottostante. Puoi utilizzare Inferenza serverless on demand o aggiungere la concorrenza assegnata al tuo endpoint per avere prestazioni prevedibili.Con Inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L’addebito per il calcolo dipende dalla configurazione di memoria che scegli.
Concorrenza assegnataFacoltativamente, puoi anche abilitare la concorrenza assegnata per i tuoi endpoint serverless. La concorrenza assegnata consente di implementare modelli su endpoint serverless con prestazioni prevedibili e scalabilità elevata, mantenendo gli endpoint pronti per un numero di richieste simultanee e il tempo specificati. Come per Inferenza serverless on demand, quando la funzionalità di concorrenza assegnata è abilitata, si paga in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. Paghi anche per l'utilizzo di concorrenza assegnata, in base alla memoria configurata, alla durata fornita e alla quantità di concorrenza abilitata.
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart ti aiuta a iniziare a utilizzare il machine learning rapidamente e facilmente tramite l'accesso con un clic alle raccolte di modelli popolari (note anche come "model zoo"). Jumpstart offre anche soluzioni end-to-end che risolvono casi d'uso comuni di ML e che possono essere personalizzate in base alle tue esigenze. Non sono previsti costi aggiuntivi per l'utilizzo di modelli o soluzioni JumpStart. Ti verranno addebitate le ore di istanze di formazione e inferenza sottostanti utilizzate come se le avessi create manualmente.
-
Profiler
-
Amazon SageMaker Profiler raccoglie dati a livello di sistema per la visualizzazione di grafici di traccia di CPU e GPU ad alta risoluzione. Questo strumento è progettato per aiutare i data scientist e gli ingegneri a identificare gli ostacoli prestazionali legati all'hardware nei loro modelli di deep learning, risparmiando tempi e costi di formazione end-to-end. Attualmente SageMaker Profiler supporta solo la profilazione dei processi di addestramento tramite i tipi di istanze di calcolo di addestramento ml.g4dn.12xlarge, ml.p3dn.24xlarge e ml.p4d.24xlarge.
Regioni: Stati Uniti orientali (Ohio), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Europa (Francoforte), Europa (Irlanda) e Israele (Tel Aviv).Amazon SageMaker Profiler è attualmente in anteprima ed è disponibile gratuitamente per i clienti nelle regioni supportate.
Dettagli delle istanze
Dettagli del prodotto istanza P5 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (TiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | GPUDirect RDMA | Peer to peer GPU | Storage dell’istanza (TB) | Larghezza di banda EBS (Gb/s) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | Sì | NVSwitch a 900 Gb/s | 8x3,84 NVMe SSD | 80 |
Dettagli del prodotto istanza P4d di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | GPUDirect RDMA | Peer to peer GPU | Archiviazione istanza (GB) | Larghezza di banda EBS (Gb/s) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA ed EFA | Sì | NVSwitch a 600 GB/s | 8x1000 SSD NVMe | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA ed EFA | Sì | NVSwitch a 600 GB/s | 8X1000 NVMe SSD | 19 |
Dettagli del prodotto istanza P3 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Peer to peer GPU | Archiviazione istanza (GB) | Larghezza di banda EBS (Gb/s) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | Fino a 10 | N/D | Solo EBS | 1,5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | Solo EBS | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | Solo EBS | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900SSD NVMe | 19 |
Dettagli del prodotto istanza P2 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | Fino a 10 | Elevate |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Dettagli del prodotto istanza G4 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Archiviazione istanza (GB) | Larghezza di banda EBS (Gb/s) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | Fino a 25 | 1 x 125 SSD NVMe | Fino a 3,5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | Fino a 25 | 1 x 125 SSD NVMe | Fino a 3,5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | Fino a 25 | 1 x 125 SSD NVMe | 4,75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
Dettagli del prodotto istanza G5 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Larghezza di banda EBS (Gb/s) | Archiviazione istanza (GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | Fino a 10 | Fino a 3,5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | Fino a 10 | Fino a 3,5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | Fino a 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
Dettagli del prodotto istanza Trn1 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria (GiB) | Acceleratori Trainium | Memoria acceleratore (GB) | Memoria per acceleratore (GB) | Archiviazione istanza (GB) | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 SSD NVMe | Fino a 12,5 | Fino a 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 SSD NVMe | 800 | 80 |
Dettagli del prodotto istanza Inf1 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria (GiB) | Acceleratori Inferentia | Memoria acceleratore (GB) | Memoria per acceleratore (GB) | Archiviazione di istanze | Interconnessione tra acceleratori | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | Solo EBS | N/D | Fino a 25 | fino a 4,75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | Solo EBS | N/D | Fino a 25 | fino a 4,75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | Solo EBS | Sì | 25 | 4,75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | Solo EBS | sì | 100 | 19 |
Dettagli del prodotto istanza Inf2 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria (GiB) | Acceleratori Inferentia | Memoria acceleratore (GB) | Memoria per acceleratore (GB) | Archiviazione di istanze | Interconnessione tra acceleratori | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | Solo EBS | N/D | Fino a 25 | Fino a 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | Solo EBS | N/D | Fino a 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | Solo EBS | Sì | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | Solo EBS | Sì | 100 | 60 |
Amazon SageMaker Studio
Ora puoi accedere ad Amazon SageMaker Studio, il primo ambiente di sviluppo completamente integrato (IDE) senza costi aggiuntivi. SageMaker Studio ti offre accesso, controllo e visibilità completi su ogni fase necessaria alla costruzione, all'addestramento e all’implementazione dei modelli. Usando SageMaker Studio, paghi solo per il calcolo e l’archiviazione sottostante che usi all'interno di Studio.
Puoi utilizzare numerosi servizi su SageMaker Studio, AWS SDK per Python (Boto3) o AWS CLI, tra cui:
- SageMaker Pipelines per automatizzare e gestire i flussi di lavoro ML
- Pilota automatico SageMaker per creare automaticamente modelli di ML con visibilità completa
- Esperimenti SageMaker per organizzare e tenere traccia di processi e versioni
- Debugger SageMaker per eseguire il debug delle anomalie durante l'addestramento
- SageMaker Model Monitor per mantenere modelli di alta qualità
- SageMaker Clarify per spiegare meglio i modelli ML e individuare gli errori
- SageMaker JumpStart per implementare facilmente soluzioni ML per numerosi casi d'uso. Ti possono essere addebitati costi relativi ad altri servizi AWS utilizzati nella soluzione per le chiamate API sottostanti effettuate da Amazon SageMaker per tuo conto.
- SageMaker Inference Recommender per ottenere suggerimenti per la corretta configurazione degli endpoint
Paghi solo per le risorse di calcolo e archiviazione sottostanti all'interno di SageMaker o altri servizi AWS, in base al tuo utilizzo.
Amazon SageMaker Studio Lab
Puoi costruire e addestrare modelli di machine learning utilizzando Amazon SageMaker Studio Lab gratuitamente. SageMaker Studio Lab offre a sviluppatori, accademici e data scientist un ambiente di sviluppo senza configurazione per imparare e sperimentare con il machine learning senza costi aggiuntivi.
Amazon SageMaker Canvas
Amazon SageMaker Canvas espande l'accesso al ML fornendo ai business analyst la capacità di generare previsioni precise di ML utilizzando un'interfaccia grafica immediata, senza bisogno di codifica o esperienza di ML.
Amazon SageMaker Data Labeling
Amazon SageMaker Data Labeling fornisce due offerte di etichettatura dei dati, Amazon SageMaker Ground Truth Plus e Amazon SageMaker Ground Truth. Puoi ottenere ulteriori informazioni su Amazon SageMaker Data Labeling, un servizio di etichettatura dei dati interamente gestito che semplifica la creazione di set di dati di addestramento altamente precisi per il machine learning.
Esecuzione di shadow test con Amazon SageMaker
SageMaker facilita l'esecuzione di shadow test per valutare un nuovo modello di ML prima del rilascio in produzione verificandone le prestazioni rispetto al modello attualmente implementato. L'esecuzione di shadow test SageMaker non prevede altri addebiti all'infuori dei costi di utilizzo delle istanze ML e dello spazio di archiviazione ML allocati per l'hosting del modello shadow. I prezzi per le istanze ML e le dimensioni di archiviazione ML corrispondono a quelli dell'opzione di inferenza in tempo reale specificata nella tabella dei prezzi di cui sopra. I dati elaborati all'interno e all'esterno delle implementazioni shadow non prevedono costi aggiuntivi.
Amazon SageMaker Edge
Scopri i prezzi di Amazon SageMaker Edge per ottimizzare, eseguire e monitorare i modelli ML sui parchi istanze di dispositivi edge.
Savings Plans di Amazon SageMaker
I Savings Plans di Amazon SageMaker contribuiscono a ridurre i costi fino al 64%. I piani si applicano automaticamente all'uso idoneo delle istanze ML SageMaker, inclusi SageMaker Studio Notebooks, istanze Notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference e SageMaker Batch Transform, indipendentemente dalla famiglia di istanze, dalla dimensione o dalla regione. Ad esempio, puoi modificare in qualsiasi momento l'uso da un'istanza CPU ml.c5.xlarge in esecuzione negli Stati Uniti orientali (Ohio) a un'istanza ml.Inf1 negli Stati Uniti occidentali (Oregon) per carichi di lavoro di inferenza e continuare automaticamente a pagare il prezzo di Savings Plans.
Costo totale di proprietà con Amazon SageMaker
Amazon SageMaker offre un costo totale di proprietà inferiore di almeno il 54% nell'arco di tre anni rispetto ad altre soluzioni basate sul cloud gestite dal cliente. Scopri di più con l’analisi TCO completa per Amazon SageMaker.
Esempi di prezzo
-
Esempio di prezzo n. 1: notebook Studio
Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo dei notebook di Amazon SageMaker Studio.
- Apre il notebook 1 in un kernel TensorFlow su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
- Apre notebook 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue il notebook 1.
- Lavora quindi contemporaneamente sul notebook 1 e sul notebook 2 per un'ora.
- Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente sul notebook 1 e sul notebook 2, ogni applicazione del kernel verrà misurata per 0,5 ore e le verrà fatturata 1 ora.
Applicazione kernel Istanza notebook Ore Costo orario Totale TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD Data Science ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Esempio di prezzo n. 2: RStudio su SageMaker
Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo di RStudio su SageMaker:
- Avvia RSession 1 su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
- Avvia RSession 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue RSession 1.
- Lavora su RSesssion 1 e RSession 2 in contemporanea per un'ora.
- Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente su RSession 1 e RSession 2, ogni applicazione Rsession verrà misurata per 0,5 ore e verrà fatturata 1 ora.
Nel frattempo, l'RServer è in esecuzione 24 ore su 24, 7 giorni su 7, non importa se ci sono RSessions in esecuzione o meno. Se l'amministratore sceglie "Small" (ml.t3.medium), allora è gratuito. Se l'amministratore sceglie "Medium" (ml.c5.4xlarge) o "Large" (ml.c5.9xlarge), allora viene addebitata ogni ora finché RStudio è abilitato per il dominio SageMaker.
App RSession Istanza RSession Ore Costo orario Totale Base R ml.c5.xlarge 1 0,204 USD 0,204 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Esempio di prezzo n. 3: Processing
Con Amazon SageMaker Processing, sono addebitati esclusivamente i costi relativi alle istanze usate nell'esecuzione delle attività. Quando si forniscono i dati di input per l'elaborazione in Simple Storage Service (Amazon S3), Amazon SageMaker scarica i dati da Simple Storage Service (Amazon S3) nello spazio di archiviazione di file locale all'avvio di un'attività di elaborazione.
Il data analyst esegue un'attività di elaborazione per pre-elaborare e convalidare i dati su due istanze ml.m5.4xlarge per una durata di 10 minuti. Carica un set di dati da 100 GB in S3 come input dell'attività di elaborazione; i dati di output, all'incirca della stessa dimensione, vengono archiviati nuovamente in S3.
Ore Istanze di elaborazione Costo orario Totale 1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD Archiviazione (SSD) a scopo generico (GB) Costo orario Totale 100 GB * 2 = 200 0,14 USD 0,0032 USD Subtotale per il processo di Amazon SageMaker Processing = 0,308 USD.
Subtotale per 200 GB di archiviazione SSD a scopo generico = 0,0032 USD.
Il costo totale per questo esempio è di 0,3112 USD
-
Esempio di prezzo n. 4: Data Wrangler
Un data scientist passa tre giorni a utilizzare Amazon SageMaker Data Wrangler per pulire, esplorare e visualizzare i dati per 6 ore al giorno. Per eseguire la pipeline di preparazione dei dati, avvia quindi un processo di SageMaker Data Wrangler pianificato per essere eseguito settimanalmente.
La tabella di seguito riporta l'uso totale per il mese e i costi associati per l'utilizzo di Amazon SageMaker Data Wrangler.
Applicazione Istanza SageMaker Studio Giorni Durata Durata totale Costo orario Subtotale dei costi SageMaker Data Wrangler ml.m5.4xlarge 3 6 ore 18 ore 0,922 USD 16,596 USD Processo SageMaker Data Wrangler ml.m5.4xlarge - 40 minuti 2,67 ore 0,922 USD 2,461 USD Dalla tabella, usi Amazon SageMaker Data Wrangler per un totale di 18 ore in tre giorni per preparare i dati. Inoltre, crei un processo SageMaker Data Wrangler per preparare i dati aggiornati su base settimanale. Ogni processo dura 40 minuti e viene eseguito ogni settimana per un mese.
Costo mensile complessivo per l'uso di Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD
-
Esempio di prezzo n. 5: Feature Store
Hai un'applicazione Web che emette letture e scritture di 25 KB ciascuna nel Feature Store di Amazon SageMaker. Per i primi 10 giorni di un mese, ricevi poco traffico sulla tua applicazione, risultando in 10.000 scritture e 10.000 letture ogni giorno nel Feature Store di SageMaker. L'undicesimo giorno, però, l'applicazione attira l'attenzione sui social media e il suo traffico si impenna raggiungendo 200.000 letture e 200.000 scritture, quel giorno. La tua applicazione finisce poi per avere un traffico più regolare, con una media di 80.000 letture e 80.000 scritture ogni giorno fino alla fine del mese.
La tabella di seguito riporta l'utilizzo totale per il mese e i costi associati per l'utilizzo di Amazon SageMaker Feature Store.
Giorno del mese Scritture totali Unità di scrittura totali Letture totali Unità di lettura totali Dal giorno 1 al giorno 10 100.000 scritture
(10.000 scritture * 10 giorni)2.500.000
(100.000 * 25 KB)100.000
(10.000 * 10 giorni)700.000++
(100.000 * 25/4 KB)Giorno 11 200.000 scritture 5.000.000
(200.000 * 25 KB)200.000 letture 1.400.000++
(200.000 * 25/4 KB)Dal giorno 12 al giorno 30 1.520.000 scritture
(80.000 * 19 giorni)38.000.000
(1.520.000 * 25 KB)1.520.000 scritture
(80.000 * 19 giorni)10.640.000++
(1.520.000 * 25/4 KB)Unità fatturabili totali 45.500.000 unità di scrittura 12.740.000 unità di lettura Costo mensile per scritture e letture 56,875 USD
(45,5 milioni di unità di scrittura * 1,25 USD per milione di scritture)3,185 USD
(12,74 milioni di unità di lettura * 0,25 USD per milione di letture)++ Tutte le unità di lettura frazionali sono arrotondate al primo numero intero successivo
Storage dei dati
Dati archiviati totali = 31,5 GB
Costo mensile per lo storage dei dati = 31,5 GB * 0,45 USD = 14,175 USDCosto mensile complessivo per Amazon SageMaker Feature Store = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD
-
Esempio di prezzo n. 6: addestramento
Un data scientist ha lavorato una settimana su un modello per una nuova idea. Addestra 4 volte un modello su un ml.m4.4xlarge con processi di addestramento da 30 minuti con Amazon SageMaker Debugger abilitato e utilizzando 2 regole integrate e 1 regola personalizzata scritta da lei. Per la regola personalizzata, ha specificato l'istanza ml.m5.xlarge. Addestra utilizzando 3G di dati per la formazione in Simple Storage Service (Amazon S3), inoltrando l'output del modello da 1 GB in Simple Storage Service (Amazon S3). SageMaker crea volumi SSD (gp2) a scopo generico per ciascuna istanza di addestramento. Inoltre, crea volumi SSD (gp2) a scopo generico per ciascuna regola specificata. Per questo esempio, saranno creati in tutto 4 volumi SSD (gp2) a scopo generico. SageMaker Debugger trasferisce 1 GB di dati di debug al bucket Amazon S3 del cliente.
Ore Istanza di addestramento Istanza di debug Costo orario Subtotale 4 * 0,5 = 2 ml.m4.4xlarge n/d 0,96 USD 1,92 USD 4 * 0,5 * 2 = 4 n/d Nessun costo aggiuntivo per le istanze di regole integrate 0 USD 0 USD 4 * 0,5 = 2 ml.m5.xlarge n/d 0,23 USD 0,46 USD ------- 2,38 USD Archiviazione (SSD) a scopo generico per addestramento (GB) Archiviazione (SSD) a scopo generico per le regole integrate del debugger (GB) Archiviazione (SSD) a scopo generico per le regole personalizzate del debugger (GB) Costo per GB/mese Subtotale Capacità usata 3 2 1 Costo 0 USD Nessun costo aggiuntivo per i volumi di storage integrati 0 USD 0,10 USD 0 USD Il costo totale per la formazione e il debug in questo esempio è 2,38 USD. Le istanze di calcolo e i volumi di archiviazione per uso generico impiegati dalle regole integrate di Debugger Amazon SageMaker non comportano costi aggiuntivi.
-
Esempio di prezzo 7: esperimenti
Un team di cento data scientist sta lavorando a un progetto per una nuova idea. Vengono condotti esperimenti addestrando i modelli con parametri e set di dati diversi. In media, ciascun data scientist addestra un modello dieci volte al mese in venti periodi e raccoglie cinque parametri personalizzati. I data scientist utilizzano SageMaker Studio per analizzare gli esperimenti. Secondo questo esempio, il costo sarebbe il seguente:
Costo Totale unità Costo mensile Acquisizione 1,25 USD per milione di record di parametri 100.000 (= 100 data scientist x 10 volte x 20 periodi x 5 parametri) record di parametri acquisiti 0,125 USD (= 1,25 x 100.000/1.000.000) Utilizzo di SageMaker Studio 0 USD 0 USD Recupero 0,25 USD per milione di record di parametri 0 0 USD Archiviazione 0,25 USD per milione di record di parametri al mese 100.000 record di parametri archiviati 0,025 USD (= 0,25 x 100.000/1.000.000) Costo mensile totale 0,15 USD Un workbench ML viene utilizzato da mille data scientist. Vengono condotti esperimenti addestrando i modelli con parametri e set di dati diversi. Ciascun data scientist addestra un modello dieci volte al mese in venti periodi e raccoglie cinque parametri personalizzati. Il workbench utilizza API di recupero per ottenere dati di esperimenti da Esperimenti SageMaker per eseguire analisi personalizzate. I data scientist confrontano i dati registrati attraverso dieci diverse iterazioni di addestramento per trovare il modello più idoneo. Secondo questo esempio, il costo sarebbe il seguente:
Costo Totale unità Costo mensile Acquisizione 1,25 USD per milione di record di parametri 1 milione (= 1.000 data scientist x 10 volte x 20 periodi x 5 parametri) record di parametri acquisiti 1,25 USD (= 1,25 x 1) Utilizzo di SageMaker Studio 0 USD 0 USD Recupero 0,25 USD per milione di record di parametri 10 milioni (= 1 milione di parametri acquisiti x 10 recuperi per ogni parametro acquisito) di record di parametri recuperati 2,5 USD (= 0,25 x 10) Archiviazione 0,25 USD per milione di record di parametri al mese 1 milione di record di parametri archiviati 0,25 USD (= 0,25 x 1) Costo mensile totale 4 USD -
Esempio di prezzo 8: inferenza in tempo reale
Il modello dell'esempio 5 viene implementato in produzione in due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Amazon SageMaker Model Monitor è abilitato con una (1) istanza ml.m5.4xlarge e il monitoraggio delle attività è pianificato una volta al giorno. Ciascuna attività di monitoraggio richiede 5 minuti per il completamento. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.
Ore al mese Istanze di hosting Istanze di monitoraggio modelli Costo orario Totale 24 * 31 * 2 = 1.488 ml.c5.xlarge 0,204 USD 303,522 USD 31 * 0,08 = 2,5 ml.m5.4xlarge 0,922 USD 2,305 USD Dati in entrata al mese - Hosting Dati in uscita al mese - Hosting Costo per GB in entrata o in uscita Totale 100 MB * 31 = 3.100 MB 0,016 USD 0,0496 USD 10 MB * 31 = 310 MB 0,016 USD 0,00496 USD Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese = 0,054 USD. Il costo totale per questo esempio è di 305,881 USD al mese.
Nota: per le regole integrate con istanze ml.m5.xlarge, vengono aggregate fino a 30 ore al mese di monitoraggio in tutti gli endpoint senza alcun costo.
-
Esempio di prezzo 9: Asynchronous Inference
Amazon SageMaker Asynchronous Inference addebita i costi per le istanze utilizzate dall'endpoint. Quando non stai elaborando attivamente delle richieste, puoi configurare la scalabilità automatica per dimensionare il conto delle istanze a zero e risparmiare sui costi. Per payload di input in Simple Storage Service (Amazon S3), non ci sono costi per leggere dati di input da Simple Storage Service (Amazon S3) e scrivere i dati di output su S3 nella stessa regione.
Il modello dell'esempio n. 5 è utilizzato per eseguire un endpoint SageMaker Asynchronous Inference. L'endpoint viene configurato per essere eseguito su 1 istanza ml.c5.xlarge e per ridurre il conto delle istanze a zero quando non stai elaborando attivamente delle richieste. L'istanza ml.c5.xlarge nell'endpoint ha uno spazio di archiviazione (SSD) a scopo generico allegato di 4 GB. In questo esempio, l'endpoint mantiene un costo delle istanze di 1 per 2 ore al giorno e ha un tempo di raffreddamento di 30 minuti, dopo il quale si riduce a un conto delle istanze pari a zero per il resto della giornata. Pertanto, pagherai per 2,5 ore di utilizzo al giorno.
L'endpoint elabora 1.024 richieste al giorno. La dimensione di ciascun corpo di richiesta/risposta di chiamata è di 10 KB e ogni payload di richiesta di inferenza in Simple Storage Service (Amazon S3) è di 100 MB. Gli output delle inferenze sono pari a 1/10 della dimensione dei dati di input archiviati in Simple Storage Service (Amazon S3) nella stessa regione. In questo esempio, i costi per l'elaborazione dei dati si applicano al corpo della richiesta e della risposta, ma non ai dati trasferiti a/da Simple Storage Service (Amazon S3).
Ore al mese Istanze di hosting Costo orario Totale 2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD Archiviazione (SSD) a scopo generico (GB) Costo per GB/mese Totale 4 0,14 USD 0,56 USD Dati in entrata al mese Dati in uscita al mese Costo per GB in entrata o in uscita Totale 10 KB * 1.024 * 31 = 310 MB 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048 Il subtotale per SageMaker Asynchronous Inference è di 15,81 USD + 0,56 USD + (2 * 0,0048) = 16,38 USD. Il costo totale di Asynchronous Inference per questo esempio è di 16,38 USD al mese.
-
Esempio di prezzo 10: trasformazione di batch
Il modello dell'esempio 5 è utilizzato per eseguire una trasformazione in batch con SageMaker. Il data scientist esegue quattro processi di trasformazione in batc SageMaker separati su 3 istanze ml.m4.4xlarge per una durata di 15 minuti per ciascuna esecuzione. Carica poi un set di dati di valutazione di 1 GB in S3 per ciascuna esecuzione; le inferenze saranno 1/10 delle dimensioni dei dati in ingresso memorizzati in S3.
Ore Istanze di hosting Costo orario Totale 3 * 0,25 * 4 = 3 ore ml.m4.4xlarge 0,96 USD 2,88 USD Gli addebiti totali per l'inferenza in questo esempio sarebbero 2,88 USD.
-
Esempio di prezzo n. 11: Inferenza serverless on demand
Con Inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L'addebito per il calcolo dipende dalla configurazione di memoria che scegli.
Supponiamo che siano stati allocati 2 GB di memoria al proprio endpoint, questo sia stato eseguito 10 milioni di volte in un mese, abbia funzionato per 100 ms ogni volta e siano stati elaborati 10 GB di dati in entrata e in uscita in totale. Gli addebiti vengono calcolati come segue:
Costi di calcolo mensili
Numero di richieste Durata di ciascuna richiesta Durata totale dell’inferenza (sec) Costo al secondo Costi mensili per la durata dell’inferenza 10 milioni 100 ms 1 milione 0,00004 USD 40 USD
Costi mensili di elaborazione dei dati
Elaborazione dei dati (GB) Costo per GB in entrata o in uscita Costi mensili di elaborazione dei dati 10 GB 0,016 USD 0,16 USD Il subtotale per il costo della durata di SageMaker Serverless inference on demand è 40 USD. Il subtotale per il costo di elaborazione dei dati da 10 GB è 0,16 USD. Il costo complessivo per questo esempio è di 40,16 USD.
-
Esempio di prezzo 12: concorrenza assegnata su Inferenza serverless
Supponiamo che tu stia gestendo un servizio di chatbot per un'azienda di elaborazione di buste paga. Ti aspetti un picco nelle richieste dei clienti a fine marzo, prima della scadenza per la presentazione della dichiarazione dei redditi. Tuttavia, per il resto del mese, prevedi un traffico basso. Quindi, decidi di implementare un endpoint serverless con 2 GB di memoria e di aggiungere una simultaneità assegnata di 100 per gli ultimi 5 giorni del mese nella fascia oraria 9:00-17:00 (8 ore), durante i quali l'endpoint elabora un totale di 10 milioni di richieste e 10 GB di dati in entrata e in uscita. Nel resto del mese, il chatbot funziona su Inferenza serverless on demand ed elabora 3 milioni di richieste e 3 GB di dati in entrata e in uscita. Supponiamo che la durata di ogni richiesta sia di 100 ms.
Costi della simultaneità assegnata (Provisioned Concurrency, PC)
Il prezzo della PC è di 0,000010 USD/s
Durata di utilizzo della PC (s) = 5 giorni * 100 PC * 8 ore * 3.600 s = 14.400.000 s
Costo di utilizzo della PC = 14.400.000 s * 0,000010 USD/s = 144 USD.Costi della durata dell'inferenza per il traffico servito dalla simultaneità assegnata
Il prezzo della durata dell'inferenza è di 0,000023 USD/s
Durata totale dell'inferenza per PC (s) = 10 milioni * (100 ms)/1.000 = 1 milione di secondi.
Costi per la durata dell'inferenza per PC = 1.000.000 s * 0.,000023 USD/s = 23 USDCosti della durata dell'inferenza on demand
Il prezzo di calcolo mensile è di 0,00004 USD/s e il piano gratuito offre 150.000 s.
Calcolo totale (s) = (3) milioni * (100 ms)/1.000 = 0,3 milioni di secondi.
Calcolo totale - calcolo incluso nel piano gratuito = calcolo fatturabili al mese in secondi
0,3 milioni s - 150.000 s = 150.000 s
Costi mensili per l'elaborazione = 150.000 * 0,00004 USD = 6 USDElaborazione dati
Costo/GB di dati elaborati in entrata/uscita = 0,016 USD
Totale GB elaborati = 10 + 3 = 13
Costo totale = 0,016 USD * 13 = 0,208 USD
Costi totali per marzo
Costi totali = costi di simultaneità assegnata + durata dell'inferenza per simultaneità assegnata + durata dell'inferenza per calcolo on demand + costi di elaborazione dati
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD -
Esempio di prezzo 13: Jumpstart
Il cliente utilizza JumpStart per implementare un modello BERT Base Uncased pre-addestrato per classificare il sentiment delle recensioni dei clienti come positivo o negativo.
Il cliente implementa il modello a due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.
Ore al mese Istanze di hosting Costo orario Totale 24 * 31 * 2 = 1.488 ml.c5.xlarge 0,204 USD 303,55 USD Dati in entrata al mese - Hosting Dati in uscita al mese - Hosting Costo per GB in entrata o in uscita
Totale
100 MB * 31 = 3.100 MB 0,02 USD 0,06 USD 10 MB * 31 = 310 MB 0,02 USD 0,01 USD Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Il subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese è 0,06 USD. Il costo totale per questo esempio è di 305,887 USD al mese.
Ulteriori informazioni su Amazon SageMaker