Prezzi di Amazon SageMaker
Panoramica dei prezzi
Amazon SageMaker aiuta sviluppatori e data scientist a preparare, costruire, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità combinando un’ampia gamma di funzionalità create ad hoc per il ML. SageMaker supporta i framework di machine learning, i kit di strumenti e i linguaggi di programmazione principali
I prezzi di SageMaker sono calcolati in base all'uso effettivo. Esistono due opzioni di pagamento: i prezzi on demand, senza tariffa minima né impegni anticipati, e i Savings Plans di SageMaker, che offrono un modello di determinazione dei prezzi flessibile e basato sul consumo in cambio dell'impegno ad un uso costante del servizio.
Piano gratuito di Amazon SageMaker
La prova di Amazon SageMaker Studio è gratuita. Grazie al piano gratuito di AWS, puoi iniziare a utilizzare Amazon SageMaker gratuitamente. Il piano gratuito si attiva il primo giorno del mese in cui crei la tua prima risorsa SageMaker. I dettagli del piano gratuito per Amazon SageMaker sono riportati nella tabella di seguito.
Funzionalità di Amazon SageMaker | Uso del piano gratuito mensile per i primi 2 mesi |
Notebook Studio e istanze notebook | 250 ore di istanza ml.t3.medium sui notebook Studio OPPURE 250 ore di istanza ml.t2 medium o ml.t3.medium su istanze notebook |
RStudio su SageMaker | 250 ore di istanze ml.t3.medium su app RSession E istanza ml.t3.medium gratuita per app RStudioServerPro |
Data Wrangler | 25 ore di istanza ml.m5.4xlarge |
Archivio funzionalità | 10 milioni di unità di scrittura, 10 milioni di unità di lettura, 25 GB di spazio di archiviazione (negozio online standard) |
Formazione | 50 ore di istanze m4.xlarge o m5.xlarge |
Amazon SageMaker con TensorBoard | 300 ore di istanza ml.r5.large |
Inferenza in tempo reale | 125 ore di istanze m4.xlarge o m5.xlarge |
Inferenza serverless | Durata di 150.000 secondi dell'inferenza on demand |
Canvas | 160 ore/mese per la durata della sessione |
HyperPod | 50 ore di istanza m5.xlarge |
Prezzi on demand
-
Studio Classic
-
JupyterLab
-
Editor di codice
-
RStudio
-
Istanze notebook
-
Elaborazione
-
TensorBoard
-
Data Wrangler
-
Feature Store
-
Formazione
-
MLflow
-
Inferenza in tempo reale
-
Inferenza asincrona
-
Trasformazione in batch
-
Inferenza serverless
-
JumpStart
-
Profilatore
-
HyperPod
-
Ottimizzazione dell'inferenza
-
Studio Classic
-
Amazon SageMaker Studio Classic
Studio Classic offre notebook Jupyter in un unico passaggio nella nostra esperienza IDE legacy. Le risorse di calcolo sottostanti sono elastiche e i notebook possono essere facilmente condivisi con altri consentendo una collaborazione senza interruzioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo. -
JupyterLab
-
Amazon SageMaker JupyterLab
Avvia JupyterLab completamente gestito in pochi secondi. Utilizza il più recente ambiente di sviluppo interattivo basato sul Web per notebook, codice e dati. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo. -
Editor di codice
-
Editor di codice Amazon SageMaker
L'editor di codice, basato su Code-OSS (Visual Studio Code - Open Source), consente di scrivere, testare, eseguire il debug ed eseguire analisi e codice ML. È completamente integrato con SageMaker Studio e supporta le estensioni IDE disponibili nel registro delle estensioni Open VSX. -
RStudio
-
RStudio
RStudio offre risorse di calcolo cloud on demand per accelerare lo sviluppo dei modelli e migliorare la produttività. Ti vengono addebitati i tipi di istanza che scegli per eseguire l'applicazione RStudio Session e l'applicazione RStudio Server Pro.
App RStudioServerPro
-
Istanze notebook
-
Istanze notebook
Le istanze notebook sono istanze di calcolo che eseguono l'applicazione notebook Jupyter. Ti sarà addebitato l'importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
Elaborazione
-
Amazon SageMaker Processing
Amazon SageMaker Processing consente di eseguire facilmente i carichi di lavoro di pre-elaborazione, post-elaborazione e valutazione del modello su un'infrastruttura completamente gestita. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
TensorBoard
-
Amazon SageMaker con TensorBoard
Amazon SageMaker con TensorBoard offre un'esperienza TensorBoard in hosting per visualizzare ed eseguire il debug dei problemi di convergenza dei modelli per le attività di addestramento Amazon SageMaker.
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler riduce il tempo richiesto per l'aggregazione e la preparazione dei dati per il machine learning da settimane a pochi minuti. Ti sarà addebitato solo il costo del tempo impiegato per ripulire, esplorare e visualizzare i dati. I clienti che utilizzano le istanze di SageMaker Data Wrangler sono soggetti ai prezzi di seguito.* I clienti che utilizzano SageMaker Data Wrangler su istanze di workspace SageMaker Canvas sono soggetti ai prezzi di SageMaker Canvas. Consulta la pagina dei prezzi di SageMaker Canvas per maggiori dettagli.
Processi di Amazon SageMaker Data Wrangler
Un processo di Amazon SageMaker Data Wrangler viene creato quando un flusso di dati viene esportato da SageMaker Data Wrangler. Con i processi SageMaker Data Wrangler, puoi automatizzare i tuoi flussi di lavoro di preparazione dei dati. Questi processi ti consentono di applicare nuovamente i tuoi flussi di lavoro di preparazione dei dati a nuovi set di dati in modo da risparmiare tempo e poter fatturare al secondo.
-
Feature Store
-
Amazon SageMaker Feature Store
L'archivio delle funzionalità di Amazon SageMaker è un repository centrale che consente di acquisire, archiviare e utilizzare le funzionalità per il machine learning. Il gruppo di funzionalità scrittura, lettura e archiviazione di dati nell'archivio funzionalità di SageMaker sono a pagamento, con prezzi diversi per l'archivio online standard e l'archivio online in memoria.Per l'archivio online standard, l'archiviazione di dati viene addebitata per GB al mese. Per quanto riguarda la velocità di trasmissione effettiva, è possibile scegliere tra la modalità di capacità on demand o con provisioning. Per la modalità on demand, le scritture vengono addebitate come unità di richiesta di scrittura per KB e le letture vengono addebitate come unità di richiesta di lettura per 4 KB. Per la modalità di capacità con provisioning, si specifica la capacità di lettura e scrittura che ci si aspetta che l'applicazione richieda. L'archivio funzionalità di Sagemaker addebita una WCU per ogni scrittura al secondo (fino a 1 KB) e una RCU per ogni lettura al secondo (fino a 4 KB). Ti verranno addebitati i costi per la capacità effettiva di trasmissione (letture e scritture) assegnata al gruppo di funzionalità, anche se non la utilizzi completamente.
Per l'archivio online in memoria, le scritture vengono addebitate come unità di richiesta di scrittura per KB con un minimo di 1 unità per scrittura, le letture vengono addebitate come unità di richiesta di lettura per KB con un minimo di 1 unità per lettura e l'archiviazione di dati viene addebitata per GB all'ora. È previsto un costo minimo di archiviazione di dati di 5 GiB (5,37 GB) all'ora per il negozio online in memoria.
-
Formazione
-
Amazon SageMaker Training
Amazon SageMaker semplifica la formazione dei modelli di machine learning fornendo tutto il necessario per formare, ottimizzare ed eseguire il debug dei modelli. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Debugger per eseguire il debug dei problemi e monitorare le risorse durante la formazione, puoi utilizzare le regole integrate per eseguire il debug dei processi di formazione oppure scrivere le tue regole personalizzate. L’uso delle regole integrate per il debug dei tuoi processi di formazione non implica alcun costo aggiuntivo. Per le regole personalizzate, ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
MLflow
-
Amazon SageMaker con MLflow
Amazon SageMaker con MLflow consente ai clienti di pagare solo ciò che usano. I clienti pagano i server di monitoraggio MLflow in base ai costi di elaborazione e archiviazione.
I clienti pagheranno per l'elaborazione in base alle dimensioni del server di monitoraggio e al numero di ore di funzionamento. Inoltre, i clienti pagheranno per tutti i metadati archiviati sul server di monitoraggio MLflow.
-
Inferenza in tempo reale
-
Amazon SageMaker Hosting: inferenza in tempo reale
Amazon SageMaker fornisce inferenza in tempo reale per i tuoi casi d’uso che hanno bisogno di previsioni in tempo reale. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Model Monitor per gestire modelli altamente precisi che forniscono inferenze in tempo reale, per monitorare i modelli puoi utilizzare le regole integrate o scriverne di personalizzate. Per le regole integrate, hai diritto all'utilizzo gratuito di massimo 30 ore di monitoraggio. I costi aggiuntivi dipenderanno dalla durata dell'utilizzo. Se invece utilizzi le tue regole personalizzate, ti verrà addebitato un importo separato.
-
Inferenza asincrona
-
Amazon SageMaker Asynchronous Inference:
Amazon SageMaker Asynchronous Inference è un'opzione di inferenza in tempo quasi reale che mette in coda richieste in entrata, elaborandole in maniera asincrona. Utilizza questa opzione quando hai bisogno di elaborare grandi payload all'arrivo dei dati o eseguire modelli che richiedono lunghi tempi di elaborazione dell'inferenza e non richiedono latenza inferiore al secondo. Pagherai per il tipo di istanza scelto. -
Trasformazione in batch
-
Trasformazione in batch con Amazon SageMaker
Con la trasformazione in batch di Amazon SageMaker, non è necessario porzionare il set di dati o gestire gli endpoint in tempo reale. La trasformazione in batch di SageMaker permette di eseguire analisi predittive su batch di dati di piccole e grandi dimensioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.
-
Inferenza serverless
-
Amazon SageMaker Serverless Inference
Il servizio Inferenza serverless Amazon SageMaker consente di implementare modelli di machine learning per l'inferenza senza configurare o gestire alcuna infrastruttura sottostante. Puoi utilizzare Inferenza serverless on demand o aggiungere la concorrenza assegnata al tuo endpoint per avere prestazioni prevedibili.Con Inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L’addebito per il calcolo dipende dalla configurazione di memoria che scegli.
Simultaneità con provisioningFacoltativamente, puoi anche abilitare la concorrenza assegnata per i tuoi endpoint serverless. La concorrenza assegnata consente di implementare modelli su endpoint serverless con prestazioni prevedibili e scalabilità elevata, mantenendo gli endpoint pronti per un numero di richieste simultanee e il tempo specificati. Come per Inferenza serverless on demand, quando la funzionalità di concorrenza assegnata è abilitata, si paga in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. Paghi anche per l'utilizzo di concorrenza assegnata, in base alla memoria configurata, alla durata fornita e alla quantità di concorrenza abilitata.
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart ti aiuta a iniziare a utilizzare il machine learning rapidamente e facilmente tramite l'accesso con un clic alle raccolte di modelli popolari (note anche come "model zoo"). Jumpstart offre anche soluzioni end-to-end che risolvono casi d'uso comuni di ML e che possono essere personalizzate in base alle tue esigenze. Non sono previsti costi aggiuntivi per l'utilizzo di modelli o soluzioni JumpStart. Ti verranno addebitate le ore di istanze di formazione e inferenza sottostanti utilizzate come se le avessi create manualmente.
-
Profilatore
-
Amazon SageMaker Profiler raccoglie dati a livello di sistema per la visualizzazione di grafici di traccia di CPU e GPU ad alta risoluzione. Questo strumento è progettato per aiutare i data scientist e gli ingegneri a identificare gli ostacoli prestazionali legati all'hardware nei loro modelli di deep learning, risparmiando tempi e costi di formazione end-to-end. Attualmente SageMaker Profiler supporta solo la profilazione dei processi di addestramento tramite i tipi di istanze di calcolo di addestramento ml.g4dn.12xlarge, ml.p3dn.24xlarge e ml.p4d.24xlarge.
Regioni: Stati Uniti orientali (Ohio), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Europa (Francoforte), Europa (Irlanda) e Israele (Tel Aviv).Profilatore Amazon SageMaker è attualmente in anteprima ed è disponibile gratuitamente per i clienti nelle regioni supportate.
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker HyperPod è stato creato appositamente per accelerare lo sviluppo di modelli di fondazione (FM). Per rendere l'addestramento del FM più resistente, monitora continuamente lo stato del cluster, ripara e sostituisce istantaneamente i nodi difettosi e salva i controlli frequenti per riprendere automaticamente l'allenamento senza perdere i progressi. SageMaker HyperPod è preconfigurato con le librerie di addestramento distribuite SageMaker che consentono di migliorare le prestazioni di addestramento dei FM utilizzando appieno l'infrastruttura di calcolo e di rete del clusterNota: i prezzi di SageMaker HyperPod non coprono i costi per i servizi collegati ai cluster HyperPod, come Amazon EKS, Amazon FSx per Lustre e Amazon Simple Storage Service (Amazon S3).
-
Ottimizzazione dell'inferenza
-
Il kit di strumenti per l'ottimizzazione dell'inferenza semplifica l'implementazione delle più recenti tecniche di ottimizzazione dell'inferenza per ottenere prestazioni all'avanguardia (SOTA) in termini di costi su Amazon SageMaker, risparmiando mesi sui tempi di sviluppo. È possibile scegliere da un menu di tecniche di ottimizzazione popolari fornite da SageMaker ed eseguire lavori di ottimizzazione in anticipo, confrontare il modello per le metriche di prestazioni e precisione e, quindi, implementare il modello ottimizzato su un endpoint SageMaker per l'inferenza.
Dettagli delle istanze
Dettagli del prodotto istanza P5 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (TiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | GPUDirect RDMA | Peer to peer GPU | Storage dell’istanza (TB) | Larghezza di banda EBS (Gb/s) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | Sì | NVSwitch a 900 Gb/s | 8x3,84 NVMe SSD | 80 |
Dettagli del prodotto istanza P4d di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | GPUDirect RDMA | Peer to peer GPU | Archiviazione istanza (GB) | Larghezza di banda EBS (Gb/s) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA ed EFA | Sì | NVSwitch a 600 GB/s | 8x1000 SSD NVMe | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA ed EFA | Sì | NVSwitch a 600 GB/s | 8X1000 NVMe SSD | 19 |
Dettagli del prodotto istanza P3 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Peer to peer GPU | Archiviazione istanza (GB) | Larghezza di banda EBS (Gb/s) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | Fino a 10 | N/D | Solo EBS | 1,5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | Solo EBS | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | Solo EBS | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900 SSD NVMe | 19 |
Dettagli del prodotto istanza P2 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | Fino a 10 | Elevate |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Dettagli del prodotto istanza G4 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Archiviazione istanza (GB) | Larghezza di banda EBS (Gb/s) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | Fino a 25 | 1 x 125 SSD NVMe | Fino a 3,5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | Fino a 25 | 1 x 125 SSD NVMe | Fino a 3,5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | Fino a 25 | 1 x 125 SSD NVMe | 4,75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 SSD NVMe | 9,5 |
Dettagli del prodotto istanza G5 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria istanza (GiB) | Modello GPU | GPU | Memoria GPU totale (GB) | Memoria per GPU (GB) | Larghezza di banda della rete (Gb/s) | Larghezza di banda EBS (Gb/s) | Archiviazione istanza (GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | Fino a 10 | Fino a 3,5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | Fino a 10 | Fino a 3,5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | Fino a 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
Dettagli del prodotto istanza Trn1 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria (GiB) | Acceleratori Trainium | Memoria acceleratore (GB) | Memoria per acceleratore (GB) | Archiviazione istanza (GB) | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 SSD NVMe | Fino a 12,5 | Fino a 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 SSD NVMe | 800 | 80 |
Dettagli del prodotto istanza Inf1 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria (GiB) | Acceleratori Inferentia | Memoria acceleratore (GB) | Memoria per acceleratore (GB) | Archiviazione di istanze | Interconnessione tra acceleratori | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | Solo EBS | N/D | Fino a 25 | fino a 4,75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | Solo EBS | N/D | Fino a 25 | fino a 4,75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | Solo EBS | Sì | 25 | 4,75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | Solo EBS | sì | 100 | 19 |
Dettagli del prodotto istanza Inf2 di Amazon SageMaker
Dimensioni istanza | vCPU | Memoria (GiB) | Acceleratori Inferentia | Memoria acceleratore (GB) | Memoria per acceleratore (GB) | Archiviazione di istanze | Interconnessione tra acceleratori | Larghezza di banda di rete (Gb/s) | Larghezza di banda EBS (Gb/s) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | Solo EBS | N/D | Fino a 25 | Fino a 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | Solo EBS | N/D | Fino a 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | Solo EBS | Sì | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | Solo EBS | Sì | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio è un'unica interfaccia basata sul Web per lo sviluppo completo di ML, che offre una scelta di ambienti di sviluppo integrati (IDE) completamente gestiti e strumenti personalizzati. È possibile accedere a SageMaker Studio gratuitamente. Ti verranno addebitati solo i costi di calcolo e archiviazione sottostanti utilizzati per diversi IDE e strumenti ML all'interno di SageMaker Studio.
Puoi utilizzare molti servizi di SageMaker Studio, AWS SDK per Python (Boto3) o Interfaccia della linea di comando AWS (AWS CLI), tra cui:
- IDE su SageMaker Studio per eseguire lo sviluppo di ML completo con un ampio set di IDE completamente gestiti, tra cui JupyterLab, Code Editor basato su Code-OSS (Visual Studio Code – Open Source) ed RStudio
- Pipeline di SageMaker per automatizzare e gestire i flussi di lavoro ML
- Pilota automatico SageMaker per creare automaticamente modelli di ML con visibilità completa
- Esperimenti SageMaker per organizzare e tenere traccia di processi e versioni
- Debugger SageMaker per eseguire il debug delle anomalie durante l'addestramento
- SageMaker Model Monitor per mantenere modelli di alta qualità
- SageMaker Clarify per spiegare meglio i modelli ML e individuare gli errori
- SageMaker JumpStart per implementare facilmente soluzioni ML per numerosi casi d'uso. Ti possono essere addebitati costi relativi ad altri servizi AWS utilizzati nella soluzione per le chiamate API sottostanti effettuate da Amazon SageMaker per tuo conto.
- SageMaker Inference Recommender per ottenere suggerimenti per la corretta configurazione degli endpoint
Vengono addebitate solamente le risorse di calcolo e archiviazione sottostanti all'interno di SageMaker o altri servizi AWS, in base all'utilizzo.
Per usufruire del piano gratuito di Amazon Q Developer su Jupyter Lab e Code Editor, segui queste istruzioni. Per utilizzare Amazon Q Developer Pro su Jupyter Lab è necessario un abbonamento ad Amazon Q Developer. I prezzi di Amazon Q Developer sono disponibili qui.
Valutazioni dei modelli di fondazione
SageMaker Clarify supporta le valutazioni dei modelli di fondazione con metodi di valutazione automatici e a base umana. Ogni tipo di valutazione ha prezzi diversi. Se stai valutando un modello di fondazione di Amazon SageMaker JumpStart che non è ancora stato distribuito nel tuo account, SageMaker distribuirà temporaneamente il modello JumpStart su un'istanza SageMaker per la durata dell'inferenza. L'istanza specifica sarà conforme alla raccomandazione sull'istanza fornita da JumpStart per quel modello.
Valutazione automatica:
Le valutazioni dei modelli di fondazione vengono eseguite come processo di elaborazione SageMaker. Il processo di valutazione richiamerà SageMaker Inference. I clienti pagano l'inferenza e il lavoro di valutazione. Ai clienti viene addebitato solo il costo della durata del lavoro di valutazione. Il costo del processo di valutazione corrisponde alla somma del costo orario dell'istanza di valutazione e del costo orario dell'istanza di hosting.
Valutazione a base umana:
Quando si utilizza la funzionalità di valutazione a base umana e si coinvolge la propria forza lavoro, vengono addebitati tre elementi: 1) l'istanza SageMaker utilizzata per l'inferenza, 2) l'istanza utilizzata per eseguire il processo d elaborazione di SageMaker che ospita la valutazione umana e 3) un addebito di 0,21 USD per attività di valutazione umana completata. Un'attività umana è definita come l'evento in cui un lavoratore umano invia una valutazione di un singolo prompt e delle relative risposte di inferenza nell'interfaccia utente di valutazione umana. Il prezzo è lo stesso sia che tu abbia 1 o 2 modelli nel tuo processo di valutazione sia che porti la tua inferenza, ed è lo stesso indipendentemente dal numero di dimensioni di valutazione e metodi di valutazione che includi. Il prezzo di 0,21 USD per attività è lo stesso per tutte le Regioni AWS. Non è previsto alcun costo separato per la forza lavoro, poiché la forza lavoro viene fornita da te.
Valutazione gestita da AWS:
Per una valutazione da parte di esperti gestita da AWS, i prezzi sono personalizzati in base alle tue esigenze di valutazione, mediante un accordo privato con il team di valutazione degli esperti di AWS.
Amazon SageMaker Studio Lab
Puoi costruire e addestrare modelli di machine learning utilizzando Amazon SageMaker Studio Lab gratuitamente. SageMaker Studio Lab offre a sviluppatori, accademici e data scientist un ambiente di sviluppo senza configurazione per imparare e sperimentare con il machine learning senza costi aggiuntivi.
Amazon SageMaker Canvas
Amazon SageMaker Canvas espande l'accesso al ML fornendo ai business analyst la capacità di generare previsioni precise di ML utilizzando un'interfaccia grafica immediata, senza bisogno di codifica o esperienza di ML.
Amazon SageMaker Data Labeling
Amazon SageMaker Data Labeling fornisce due offerte di etichettatura dei dati, Amazon SageMaker Ground Truth Plus e Amazon SageMaker Ground Truth. Puoi ottenere ulteriori informazioni su Amazon SageMaker Data Labeling, un servizio di etichettatura dei dati interamente gestito che semplifica la creazione di set di dati di addestramento altamente precisi per il machine learning.
Esecuzione di shadow test con Amazon SageMaker
SageMaker facilita l'esecuzione di shadow test per valutare un nuovo modello di ML prima del rilascio in produzione verificandone le prestazioni rispetto al modello attualmente implementato. L'esecuzione di shadow test SageMaker non prevede altri addebiti all'infuori dei costi di utilizzo delle istanze ML e dello spazio di archiviazione ML allocati per l'hosting del modello shadow. I prezzi per le istanze ML e le dimensioni di archiviazione ML corrispondono a quelli dell'opzione di inferenza in tempo reale specificata nella tabella dei prezzi di cui sopra. I dati elaborati all'interno e all'esterno delle implementazioni shadow non prevedono costi aggiuntivi.
Amazon SageMaker Edge
Scopri i prezzi di Amazon SageMaker Edge per ottimizzare, eseguire e monitorare i modelli ML sui parchi istanze di dispositivi edge.
Savings Plans di Amazon SageMaker
I Savings Plans di Amazon SageMaker contribuiscono a ridurre i costi fino al 64%. I piani si applicano automaticamente all'uso idoneo delle istanze ML SageMaker, inclusi SageMaker Studio Notebooks, istanze Notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference e SageMaker Batch Transform, indipendentemente dalla famiglia di istanze, dalla dimensione o dalla regione. Ad esempio, puoi modificare in qualsiasi momento l'uso da un'istanza CPU ml.c5.xlarge in esecuzione negli Stati Uniti orientali (Ohio) a un'istanza ml.Inf1 negli Stati Uniti occidentali (Oregon) per carichi di lavoro di inferenza e continuare automaticamente a pagare il prezzo di Savings Plans.
Costo totale di proprietà con Amazon SageMaker
Amazon SageMaker offre un costo totale di proprietà inferiore di almeno il 54% nell'arco di tre anni rispetto ad altre soluzioni basate sul cloud gestite dal cliente. Scopri di più con l’analisi TCO completa per Amazon SageMaker.
Esempi di prezzo
-
Esempio di prezzo #1: JupyterLab
In qualità di data scientist, trascorri 20 giorni utilizzando JupyterLab per una rapida sperimentazione su notebook, codice e dati per 6 ore al giorno su un'istanza ml.g4dn.xlarge. Crei e quindi esegui uno spazio JupyterLab per accedere all'IDE di JupyterLab. Il calcolo viene addebitato solo per l'istanza utilizzata quando lo spazio JupyterLab è in esecuzione. I costi di archiviazione per uno spazio JupyterLab maturano fino a quando non viene eliminato.Calcolo
Istanza Durata Giorni Durata totale Costo orario Totale ml.g4dn.xlarge 6 ore 20 6 x 20 = 120 ore 0,7364 USD 88,368 USD Archiviazione
Utilizzerai l'archiviazione SSD per uso generale per 480 ore (24 ore * 20 giorni). In una regione che addebita 0,1125 USD per GB al mese:
0,112 USD per GB al mese * 5 GB * 480 / (24 ore/giorno * 30 giorni al mese) = 0,373 USD -
Esempio di prezzo #2: Code Editor
In qualità di ingegnere ML, trascorri 20 giorni utilizzando Code Editor per la modifica, l'esecuzione e il debug del codice di produzione ML per 6 ore al giorno su un'istanza ml.g4dn.xlarge. Viene creato e quindi si esegue uno spazio dell'editor di codice per accedere all'IDE dell'editor. Quando lo spazio dell'editor di codice è in esecuzione, il calcolo viene addebitato solo per l'istanza utilizzata. I costi di archiviazione per lo spazio dell'editor di codice si accumulano fino a quando lo spazio non viene eliminato.Calcolo
Istanza Durata Giorni Durata totale Costo orario Totale ml.g4dn.xlarge 6 ore 20 6 x 20 = 120 ore 0,7364 USD 88,368 USD Archiviazione
Utilizzerai l'archiviazione SSD per uso generale per 480 ore (24 ore * 20 giorni). In una regione che addebita 0,1125 USD per GB al mese:
0,112 USD per GB al mese * 5 GB * 480 / (24 ore/giorno * 30 giorni al mese) = 0,373 USD
-
Esempio di prezzo #3: Studio Classic
Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo dei notebook di Amazon SageMaker Studio.
- Apre il notebook 1 in un kernel TensorFlow su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
- Apre il notebook 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue il notebook 1.
- Lavora quindi contemporaneamente sul notebook 1 e sul notebook 2 per un'ora.
- Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente sul notebook 1 e sul notebook 2, ogni applicazione del kernel verrà misurata per 0,5 ore e verrà fatturata 1 ora.
Applicazione kernel Istanza notebook Ore Costo orario Totale TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD Data Science ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Esempio di prezzo #4: RStudio
Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo di RStudio:
- Avvia RSession 1 su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
- Avvia RSession 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue RSession 1.
- Lavora su RSesssion 1 e RSession 2 in contemporanea per un'ora.
- Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente su RSession 1 e RSession 2, ogni applicazione Rsession verrà misurata per 0,5 ore e verrà fatturata 1 ora.
Nel frattempo, l'RServer è in esecuzione 24 ore su 24, 7 giorni su 7, non importa se ci sono RSessions in esecuzione o meno. Se l'amministratore sceglie "Small" (ml.t3.medium), allora è gratuito. Se l'amministratore sceglie "Medium" (ml.c5.4xlarge) o "Large" (ml.c5.9xlarge), allora viene addebitata ogni ora finché RStudio è abilitato per il dominio SageMaker.
App RSession Istanza RSession Ore Costo orario Totale Base R ml.c5.xlarge 1 0,204 USD 0,204 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD 0,408 USD -
Esempio di prezzo n. 5: Processing
Con Elaborazione Amazon SageMaker, sono addebitati esclusivamente i costi relativi alle istanze usate nell'esecuzione delle attività. Quando si forniscono i dati di input per l'elaborazione in Simple Storage Service (Amazon S3), Amazon SageMaker scarica i dati da Simple Storage Service (Amazon S3) nello spazio di archiviazione di file locale all'avvio di un'attività di elaborazione.
Il data analyst esegue un'attività di elaborazione per pre-elaborare e convalidare i dati su due istanze ml.m5.4xlarge per una durata di 10 minuti. Carica un set di dati da 100 GB in S3 come input dell'attività di elaborazione; i dati di output, all'incirca della stessa dimensione, vengono archiviati nuovamente in S3.
Ore Istanze di elaborazione Costo orario Totale 1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD Archiviazione (SSD) a scopo generico (GB) Costo orario Totale 100 GB * 2 = 200 0,14 USD 0,0032 USD Subtotale per il processo di Amazon SageMaker Processing = 0,308 USD.
Subtotale per 200 GB di archiviazione SSD a scopo generico = 0,0032 USD.
Il costo totale per questo esempio è di 0,3112 USD.
-
Esempio di prezzo n. 6: Data Wrangler
Dalla tabella, usi Amazon SageMaker Data Wrangler per un totale di 18 ore in tre giorni per preparare i dati. Inoltre, crei un processo SageMaker Data Wrangler per preparare i dati aggiornati su base settimanale. Ogni processo dura 40 minuti e viene eseguito ogni settimana per un mese.
Costo mensile complessivo per l'uso di Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD
Applicazione Istanza SageMaker Studio Giorni Durata Durata totale Costo orario Subtotale dei costi SageMaker Data Wrangler ml.m5.4xlarge 3 6 ore 18 ore 0,922 USD 16,596 USD Processo SageMaker Data Wrangler ml.m5.4xlarge - 40 minuti 2,67 ore 0,922 USD 2,461 USD Un data scientist passa tre giorni a utilizzare Amazon SageMaker Data Wrangler per pulire, esplorare e visualizzare i dati per 6 ore al giorno. Per eseguire la pipeline di preparazione dei dati, avvia quindi un processo di SageMaker Data Wrangler pianificato per essere eseguito settimanalmente.
La tabella di seguito riporta l'uso totale per il mese e i costi associati per l'utilizzo di Amazon SageMaker Data Wrangler.
-
Esempio di prezzo n. 7: archivio funzionalità
++ Tutte le unità di lettura frazionali sono arrotondate al primo numero intero successivo
Storage dei dati
Dati archiviati totali = 31,5 GB
Costo mensile per lo storage dei dati = 31,5 GB * 0,45 USD = 14,175 USDCosto mensile complessivo per l’archivio funzionalità di Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD
Giorno del mese Scritture totali Unità di scrittura totali Letture totali Unità di lettura totali Dal giorno 1 al giorno 10 100.000 scritture
(10.000 scritture * 10 giorni)2.500.000
(100.000 * 25 KB)100.000
(10.000 * 10 giorni)700.000++
(100.000 * 25/4 KB)Giorno 11 200.000 scritture 5.000.000
(200.000 * 25 KB)200.000 letture 1.400.000++
(200.000 * 25/4 KB)Dal giorno 12 al giorno 30 1.520.000 scritture
(80.000 * 19 giorni)38.000.000
(1.520.000 * 25 KB)1.520.000 scritture
(80.000 * 19 giorni)10.640.000++
(1.520.000 * 25/4 KB)Unità fatturabili totali 45.500.000 unità di scrittura 12.740.000 unità di lettura Costo mensile per scritture e letture 56,875 USD
(45,5 milioni di unità di scrittura * 1,25 USD per milione di scritture)3,185 USD
(12,74 milioni di unità di lettura * 0,25 USD per milione di letture)Hai un'applicazione Web che emette letture e scritture di 25 KB ciascuna nell’archivio delle funzionalità di Amazon SageMaker. Per i primi 10 giorni di un mese, ricevi poco traffico sulla tua applicazione, risultando in 10.000 scritture e 10.000 letture ogni giorno nel Feature Store di SageMaker. L'undicesimo giorno, però, l'applicazione attira l'attenzione sui social media e il suo traffico si impenna raggiungendo 200.000 letture e 200.000 scritture, quel giorno. La tua applicazione finisce poi per avere un traffico più regolare, con una media di 80.000 letture e 80.000 scritture ogni giorno fino alla fine del mese.
La tabella di seguito riporta l'utilizzo totale per il mese e i costi associati per l'utilizzo dell’archivio delle funzionalità di Amazon SageMaker.
-
Esempio di prezzo n. 8: addestramento
Il costo totale per l’addestramento e il debug in questo esempio è 2,38 USD. Le istanze di calcolo e i volumi di archiviazione per uso generico impiegati dalle regole integrate del debugger Amazon SageMaker non comportano costi aggiuntivi.
Archiviazione (SSD) a scopo generico per addestramento (GB) Archiviazione (SSD) a scopo generico per le regole integrate del debugger (GB) Archiviazione (SSD) a scopo generico per le regole personalizzate del debugger (GB) Costo per GB/mese Subtotale Capacità usata 3 2 1 Costo 0 USD Nessun costo aggiuntivo per i volumi di storage integrati 0 USD 0,10 USD 0 USD Ore Istanza di addestramento Istanza di debug Costo orario Subtotale 4 * 0,5 = 2 ml.m4.4xlarge n/d 0,96 USD 1,92 USD 4 * 0,5 * 2 = 4 n/d Nessun costo aggiuntivo per le istanze di regole integrate 0 USD 0 USD 4 * 0,5 = 2 ml.m5.xlarge n/d 0,23 USD 0,46 USD ------- 2,38 USD Un data scientist ha lavorato una settimana su un modello per una nuova idea. Addestra 4 volte un modello su un ml.m4.4xlarge con processi di addestramento da 30 minuti con Amazon SageMaker Debugger abilitato e utilizzando 2 regole integrate e 1 regola personalizzata scritta da lei. Per la regola personalizzata, ha specificato l'istanza ml.m5.xlarge. Addestra utilizzando 3G di dati per la formazione in Simple Storage Service (Amazon S3), inoltrando l'output del modello da 1 GB in Simple Storage Service (Amazon S3). SageMaker crea volumi SSD (gp2) a scopo generico per ciascuna istanza di addestramento. Inoltre, crea volumi SSD (gp2) a scopo generico per ciascuna regola specificata. Per questo esempio, saranno creati in tutto 4 volumi SSD (gp2) a scopo generico. Il Debugger SageMaker trasferisce 1 GB di dati di debug al bucket Amazon S3 del cliente.
-
Esempio di prezzo #9: MLflow
Ci sono due team di data scientist. Un team con 10 data scientist e l'altro team con 40 data scientist. Per soddisfare questi due team, scegli di abilitare due diversi server di monitoraggio MLflow: uno piccolo e uno medio. Ogni team sta conducendo esperimenti di machine learning (ML) e deve registrare metriche, parametri e artefatti prodotti dai propri tentativi di formazione. Vogliono utilizzare i server di monitoraggio MLflow per 160 ore al mese. Supponiamo che ogni team di Data Science memorizzi 1 GB di metadati per tenere traccia delle esecuzioni negli esperimenti. La fattura alla fine del mese verrebbe calcolata come segue:
Costi di calcolo per Small Instance: 160 × 0,60 USD = 96 USD
Costi di calcolo per Medium Instance: 160 × 1,40 USD = 166,4 USD
Costi di archiviazione per due squadre: 2 × 1 × 0,10 = 0,20 USDTotale = 262,60 USD
-
Esempio di prezzo n. 10: inferenza in tempo reale
Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese = 0,054 USD. Il costo totale per questo esempio è di 305,881 USD al mese.
Nota: per le regole integrate con istanze ml.m5.xlarge, vengono aggregate fino a 30 ore al mese di monitoraggio in tutti gli endpoint senza alcun costo.
Dati in entrata al mese - Hosting Dati in uscita al mese - Hosting Costo per GB in entrata o in uscita Totale 100 MB * 31 = 3.100 MB 0,016 USD 0,0496 USD 10 MB * 31 = 310 MB 0,016 USD 0,00496 USD Ore al mese Istanze di hosting Istanze di monitoraggio modelli Costo orario Totale 24 * 31 * 2 = 1.488 ml.c5.xlarge 0,204 USD 303,522 USD 31 * 0,08 = 2,5 ml.m5.4xlarge 0,922 USD 2,305 USD Il modello dell'esempio n. 5 viene implementato in produzione in due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Amazon SageMaker Model Monitor è abilitato con una (1) istanza ml.m5.4xlarge e il monitoraggio delle attività è pianificato una volta al giorno. Ciascuna attività di monitoraggio richiede 5 minuti per il completamento. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.
-
Esempio di prezzo n. 11: inferenza asincrona
Il subtotale per l’inferenza asincrona di SageMaker è di 15,81 USD + 0,56 USD + (2 * 0,0048) = 16,38 USD. Il costo totale dell’inferenza asincrona per questo esempio è di 16,38 USD al mese.
Dati in entrata al mese Dati in uscita al mese Costo per GB in entrata o in uscita Totale 10 KB * 1.024 * 31 = 310 MB 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048 Archiviazione (SSD) a scopo generico (GB) Costo per GB/mese Totale 4 0,14 USD 0,56 USD Ore al mese Istanze di hosting Costo orario Totale 2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD L’inferenza asincrona di Amazon SageMaker addebita i costi per le istanze utilizzate dall'endpoint. Quando non stai elaborando attivamente delle richieste, puoi configurare la scalabilità automatica per dimensionare il conto delle istanze a zero e risparmiare sui costi. Per payload di input in Simple Storage Service (Amazon S3), non ci sono costi per leggere dati di input da Simple Storage Service (Amazon S3) e scrivere i dati di output su S3 nella stessa regione.
Il modello dell'esempio n. 5 è utilizzato per eseguire un endpoint SageMaker Asynchronous Inference. L'endpoint viene configurato per essere eseguito su 1 istanza ml.c5.xlarge e per ridurre il conto delle istanze a zero quando non stai elaborando attivamente delle richieste. L'istanza ml.c5.xlarge nell'endpoint ha uno spazio di archiviazione (SSD) a scopo generico allegato di 4 GB. In questo esempio, l'endpoint mantiene un costo delle istanze di 1 per 2 ore al giorno e ha un tempo di raffreddamento di 30 minuti, dopo il quale si riduce a un conto delle istanze pari a zero per il resto della giornata. Pertanto, pagherai per 2,5 ore di utilizzo al giorno.
L'endpoint elabora 1.024 richieste al giorno. La dimensione di ciascun corpo di richiesta/risposta di chiamata è di 10 KB e ogni payload di richiesta di inferenza in Simple Storage Service (Amazon S3) è di 100 MB. Gli output delle inferenze sono pari a 1/10 della dimensione dei dati di input archiviati in Simple Storage Service (Amazon S3) nella stessa regione. In questo esempio, i costi per l'elaborazione dei dati si applicano al corpo della richiesta e della risposta, ma non ai dati trasferiti a/da Amazon S3.
-
Esempio di prezzo n. 12: trasformazione in batch
Gli addebiti totali per l'inferenza in questo esempio sarebbero 2,88 USD.
Ore Istanze di hosting Costo orario Totale 3 * 0,25 * 4 = 3 ore ml.m4.4xlarge 0,96 USD 2,88 USD Il modello dell'esempio n. 5 è utilizzato per eseguire una trasformazione in batch con SageMaker. Il data scientist esegue quattro processi di trasformazione in batc SageMaker separati su 3 istanze ml.m4.4xlarge per una durata di 15 minuti per ciascuna esecuzione. Carica poi un set di dati di valutazione di 1 GB in S3 per ciascuna esecuzione; le inferenze saranno 1/10 delle dimensioni dei dati in ingresso memorizzati in S3.
-
Esempio di prezzo n. 13: inferenza serverless on demand
Costi mensili di elaborazione dei dati
Elaborazione dei dati (GB) Costo per GB in entrata o in uscita Costi mensili di elaborazione dei dati 10 GB 0,016 USD 0,16 USD Il subtotale per il costo della durata di SageMaker Serverless inference on demand è 40 USD. Il subtotale per il costo di elaborazione dei dati da 10 GB è 0,16 USD. Il costo complessivo per questo esempio è di 40,16 USD.
Costi di calcolo mensili
Numero di richieste Durata di ciascuna richiesta Durata totale dell’inferenza (sec) Costo al secondo Costi mensili per la durata dell’inferenza 10 milioni 100 ms 1 milione 0,00004 USD 40 USD
Con l’inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L'addebito per il calcolo dipende dalla configurazione di memoria che scegli.
Supponiamo che siano stati allocati 2 GB di memoria al proprio endpoint, questo sia stato eseguito 10 milioni di volte in un mese, abbia funzionato per 100 ms ogni volta e siano stati elaborati 10 GB di dati in entrata e in uscita in totale. Gli addebiti vengono calcolati come segue:
-
Esempio di prezzo n. 14: concorrenza assegnata su inferenza serverless
Supponiamo che tu stia gestendo un servizio di chatbot per un'azienda di elaborazione di buste paga. Ti aspetti un picco nelle richieste dei clienti a fine marzo, prima della scadenza per la presentazione della dichiarazione dei redditi. Tuttavia, per il resto del mese, prevedi un traffico basso. Quindi, decidi di implementare un endpoint serverless con 2 GB di memoria e di aggiungere una simultaneità assegnata di 100 per gli ultimi 5 giorni del mese nella fascia oraria 9:00-17:00 (8 ore), durante i quali l'endpoint elabora un totale di 10 milioni di richieste e 10 GB di dati in entrata e in uscita. Nel resto del mese, il chatbot funziona su Inferenza serverless on demand ed elabora 3 milioni di richieste e 3 GB di dati in entrata e in uscita. Supponiamo che la durata di ogni richiesta sia di 100 ms.
Costi della simultaneità assegnata (Provisioned Concurrency, PC)
Il prezzo della PC è di 0,000010 USD/s
Durata di utilizzo della PC (s) = 5 giorni * 100 PC * 8 ore * 3.600 s = 14.400.000 s
Costo di utilizzo della PC = 14.400.000 s * 0,000010 USD/s = 144 USD.Costi della durata dell'inferenza per il traffico servito dalla simultaneità assegnata
Il prezzo della durata dell'inferenza è di 0,000023 USD/s
Durata totale dell'inferenza per PC (s) = 10 milioni * (100 ms)/1.000 = 1 milione di secondi.
Costi per la durata dell'inferenza per PC = 1.000.000 s * 0.,000023 USD/s = 23 USDCosti della durata dell'inferenza on demand
Il prezzo di calcolo mensile è di 0,00004 USD/s e il piano gratuito offre 150.000 s.
Calcolo totale (s) = (3) milioni * (100 ms)/1.000 = 0,3 milioni di secondi.
Calcolo totale - calcolo incluso nel piano gratuito = calcolo fatturabili al mese in secondi
0,3 milioni s - 150.000 s = 150.000 s
Costi mensili per l'elaborazione = 150.000 * 0,00004 USD = 6 USDElaborazione dati
Costo/GB di dati elaborati in entrata/uscita = 0,016 USD
Totale GB elaborati = 10 + 3 = 13
Costo totale = 0,016 USD * 13 = 0,208 USD
Costi totali per marzo
Costi totali = costi di simultaneità assegnata + durata dell'inferenza per simultaneità assegnata + durata dell'inferenza per calcolo on demand + costi di elaborazione dati
= 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD -
Esempio di prezzo n. 15: JumpStart
Il cliente utilizza JumpStart per implementare un modello BERT Base Uncased pre-addestrato per classificare il sentiment delle recensioni dei clienti come positivo o negativo.
Il cliente implementa il modello a due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.
Ore al mese Istanze di hosting Costo orario Totale 24 * 31 * 2 = 1.488 ml.c5.xlarge 0,204 USD 303,55 USD Dati in entrata al mese - Hosting Dati in uscita al mese - Hosting Costo per GB in entrata o in uscita
Totale
100 MB * 31 = 3.100 MB 0,02 USD 0,06 USD 10 MB * 31 = 310 MB 0,02 USD 0,01 USD Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Il subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese è 0,06 USD. Il costo totale per questo esempio è di 305,887 USD al mese.
-
Esempio di prezzo n. 16: cluster HyperPod
Supponiamo di voler effettuare il provisioning di un cluster di 4 ml.g5.24xlarge per 1 mese (30 giorni) con 100 GB di spazio di archiviazione aggiuntivo per istanza per supportare lo sviluppo del modello. I costi totali per il cluster e lo spazio di archiviazione aggiuntivo in questo esempio sono di 29.374,40 USD.Calcolo
Istanza Durata Istanze Costo orario Subtotale ml.g5.24xlarge 30 giorni × 24 ore = 720 ore 4 10,18 USD 29.318,40 USD Archiviazione
Archiviazione per uso generico (SSD) Durata Istanze Costo per GB/mese Subtotale 100 GB 30 giorni × 24 ore = 720 ore 4 0,14 USD 56,00 USD -
Esempio di prezzo n. 17: valutazioni del modello di fondazione (valutazione automatica)
Le valutazioni dei modelli di fondazione con SageMaker Clarify ti addebiteranno solo le istanze utilizzate durante l'esecuzione dei lavori di valutazione automatici. Quando si seleziona un'attività di valutazione automatica e un set di dati, SageMaker carica il set di dati prompt da Amazon S3 su un'istanza di valutazione SageMaker.
Nell'esempio seguente, un ingegnere ML esegue una valutazione del modello Llama2 7B negli Stati Uniti orientali (Virginia settentrionale) per rilevare l'accuratezza delle attività di riepilogo. Il tipo di istanza consigliato per l'inferenza per Llama 2 7B è ml.g5.2xlarge. L'istanza minima consigliata per una valutazione è ml.m5.2xlarge. In questo esempio, il processo viene eseguito per 45 minuti (a seconda delle dimensioni del set di dati). In questo esempio, il costo sarebbe di 1,48 USD per il lavoro di valutazione e i risultati dettagliati.Ore del processo di elaborazione (esempio)
Regione
Tipo di istanza
Istanza
Costo orario
Costo
0,45
US-east-1
Hosting LLM
ml.g5.2xlarge
1,52 USD
1,14 USD
0,45
US-east-1
valutazione
ml.m5.2xlarge
0,46 USD
0,35 USD
Totale
1,48 USD
Nel prossimo esempio, lo stesso tecnico in Virginia esegue un altro lavoro di valutazione per l'accuratezza delle attività di riepilogo, ma utilizza una versione personalizzata di Llama 2 7B che viene distribuita sul proprio account ed entra in funzione. In questo caso, poiché il modello è già distribuito nel suo account, l'unico costo incrementale sarebbe quello dell'istanza di valutazione.
Ore del processo di elaborazione
Regione
Tipo di istanza
Istanza
Costo orario
Costo
0,45
US-east-1
valutazione
ml.m5.2xlarge
0,46 USD
0,35 USD
Totale
0,35 USD
-
Esempio di prezzo n. 18: valutazioni del modello di fondazione (valutazione a base umana)
Nell'esempio seguente, un ingegnere di machine learning negli Stati Uniti orientali (Virginia settentrionale) esegue una valutazione a base umana di Llama-2-7B per rilevare la precisione delle attività di riepilogo e utilizza la propria forza lavoro privata per questa valutazione. Il tipo di istanza consigliato per Llama-2-7B è ml.g5.2xlarge. L'istanza minima consigliata per un processo di elaborazione di valutazione a base umana è ml.t3.medium. L'inferenza su Llama-2-7B viene eseguita per 45 minuti (a seconda della dimensione del set di dati). Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 collaboratori per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro «collaboratore per prompt»). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni collaboratore: 2 collaboratori x 50 set di risposta rapida = 100 attività umane). La forza lavoro umana impiega un giorno (24 ore) per completare tutte le 100 attività di valutazione umana nel lavoro di valutazione (a seconda del numero e dal livello di abilità dei collaboratori e dalla lunghezza/complessità dei prompt e delle risposte di inferenza).
Ore di calcolo
Attività umane
Regione
Tipo di istanza
Istanza
Costo orario
Costo per attività umana
Costo totale
0,45
Stati Uniti orientali (Virginia settentrionale)
Hosting LLM
ml.g5.2xlarge
1,52 USD
1,14 USD
24
Stati Uniti orientali (Virginia settentrionale)
Processo di elaborazione
ml.t3.medium
0,05 USD
1,20 USD
100
Qualsiasi
0,21 USD
21,00 USD
Totale
23,34 USD
Nel prossimo esempio, lo stesso tecnico negli Stati Uniti orientali (Virginia settentrionale) esegue lo stesso lavoro di valutazione ma utilizza Llama-2-7B già installato sul proprio account e già in funzione. In questo caso, l'unico costo incrementale sarebbe per il processo di elaborazione della valutazione e le attività umane.
Ore di calcolo
Attività umane
Regione
Tipo di istanza
Istanza
Costo orario
Costo per attività umana
Costo totale
24
Stati Uniti orientali (Virginia settentrionale)
Processo di elaborazione
ml.t3.medium
0,05 USD
1,20 USD
100
Qualsiasi
0,21 USD
21,00 USD
Totale
22,20 USD