Piano gratuito di Amazon SageMaker

La prova di Amazon SageMaker Studio è gratuita. Grazie al piano gratuito di AWS, puoi iniziare a utilizzare Amazon SageMaker gratuitamente. Il piano gratuito si attiva il primo giorno del mese in cui crei la tua prima risorsa SageMaker. I dettagli del piano gratuito per Amazon SageMaker sono riportati nella tabella di seguito.

Funzionalità di Amazon SageMaker Uso del piano gratuito mensile per i primi 2 mesi
Notebook Studio e istanze notebook 250 ore di istanza ml.t3.medium sui notebook Studio OPPURE 250 ore di istanza ml.t2 medium o ml.t3.medium su istanze notebook
RStudio su SageMaker 250 ore di istanze ml.t3.medium su app RSession E istanza ml.t3.medium gratuita per app RStudioServerPro
Data Wrangler 25 ore di istanza ml.m5.4xlarge
Archivio funzionalità 10 milioni di unità di scrittura, 10 milioni di unità di lettura, 25 GB di spazio di archiviazione (negozio online standard)
Formazione 50 ore di istanze m4.xlarge o m5.xlarge
Amazon SageMaker con TensorBoard 300 ore di istanza ml.r5.large
Inferenza in tempo reale 125 ore di istanze m4.xlarge o m5.xlarge
Inferenza serverless Durata di 150.000 secondi dell'inferenza on demand
Canvas 160 ore/mese per la durata della sessione
HyperPod 50 ore di istanza m5.xlarge

Prezzi on demand

  • Studio Classic
  • Amazon SageMaker Studio Classic
    Studio Classic offre notebook Jupyter in un unico passaggio nella nostra esperienza IDE legacy. Le risorse di calcolo sottostanti sono elastiche e i notebook possono essere facilmente condivisi con altri consentendo una collaborazione senza interruzioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.

  • JupyterLab
  • Amazon SageMaker JupyterLab
    Avvia JupyterLab completamente gestito in pochi secondi. Utilizza il più recente ambiente di sviluppo interattivo basato sul Web per notebook, codice e dati. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.

  • Editor di codice
  • Editor di codice Amazon SageMaker
    L'editor di codice, basato su Code-OSS (Visual Studio Code - Open Source), consente di scrivere, testare, eseguire il debug ed eseguire analisi e codice ML. È completamente integrato con SageMaker Studio e supporta le estensioni IDE disponibili nel registro delle estensioni Open VSX.

  • RStudio
  • RStudio
    RStudio offre risorse di calcolo cloud on demand per accelerare lo sviluppo dei modelli e migliorare la produttività. Ti vengono addebitati i tipi di istanza che scegli per eseguire l'applicazione RStudio Session e l'applicazione RStudio Server Pro.

    App RStudioServerPro

  • Istanze notebook
  • Istanze notebook
    Le istanze notebook sono istanze di calcolo che eseguono l'applicazione notebook Jupyter. Ti sarà addebitato l'importo per il tipo di istanza scelto in base alla durata dell’utilizzo.

  • Elaborazione
  • Amazon SageMaker Processing
    Amazon SageMaker Processing consente di eseguire facilmente i carichi di lavoro di pre-elaborazione, post-elaborazione e valutazione del modello su un'infrastruttura completamente gestita. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.

  • TensorBoard
  • Amazon SageMaker con TensorBoard
    Amazon SageMaker con TensorBoard offre un'esperienza TensorBoard in hosting per visualizzare ed eseguire il debug dei problemi di convergenza dei modelli per le attività di addestramento Amazon SageMaker.

  • Data Wrangler
  • Amazon SageMaker Data Wrangler

    Amazon SageMaker Data Wrangler riduce il tempo richiesto per l'aggregazione e la preparazione dei dati per il machine learning da settimane a pochi minuti. Ti sarà addebitato solo il costo del tempo impiegato per ripulire, esplorare e visualizzare i dati. I clienti che utilizzano le istanze di SageMaker Data Wrangler sono soggetti ai prezzi di seguito.* I clienti che utilizzano SageMaker Data Wrangler su istanze di workspace SageMaker Canvas sono soggetti ai prezzi di SageMaker Canvas. Consulta la pagina dei prezzi di SageMaker Canvas per maggiori dettagli.

    Processi di Amazon SageMaker Data Wrangler

    Un processo di Amazon SageMaker Data Wrangler viene creato quando un flusso di dati viene esportato da SageMaker Data Wrangler. Con i processi SageMaker Data Wrangler, puoi automatizzare i tuoi flussi di lavoro di preparazione dei dati. Questi processi ti consentono di applicare nuovamente i tuoi flussi di lavoro di preparazione dei dati a nuovi set di dati in modo da risparmiare tempo e poter fatturare al secondo.

  • Feature Store
  • Amazon SageMaker Feature Store
    L'archivio delle funzionalità di Amazon SageMaker è un repository centrale che consente di acquisire, archiviare e utilizzare le funzionalità per il machine learning. Il gruppo di funzionalità scrittura, lettura e archiviazione di dati nell'archivio funzionalità di SageMaker sono a pagamento, con prezzi diversi per l'archivio online standard e l'archivio online in memoria.

     Per l'archivio online standard, l'archiviazione di dati viene addebitata per GB al mese. Per quanto riguarda la velocità di trasmissione effettiva, è possibile scegliere tra la modalità di capacità on demand o con provisioning. Per la modalità on demand, le scritture vengono addebitate come unità di richiesta di scrittura per KB e le letture vengono addebitate come unità di richiesta di lettura per 4 KB. Per la modalità di capacità con provisioning, si specifica la capacità di lettura e scrittura che ci si aspetta che l'applicazione richieda. L'archivio funzionalità di Sagemaker addebita una WCU per ogni scrittura al secondo (fino a 1 KB) e una RCU per ogni lettura al secondo (fino a 4 KB). Ti verranno addebitati i costi per la capacità effettiva di trasmissione (letture e scritture) assegnata al gruppo di funzionalità, anche se non la utilizzi completamente.

    Per l'archivio online in memoria, le scritture vengono addebitate come unità di richiesta di scrittura per KB con un minimo di 1 unità per scrittura, le letture vengono addebitate come unità di richiesta di lettura per KB con un minimo di 1 unità per lettura e l'archiviazione di dati viene addebitata per GB all'ora. È previsto un costo minimo di archiviazione di dati di 5 GiB (5,37 GB) all'ora per il negozio online in memoria.

  • Formazione
  • Amazon SageMaker Training
    Amazon SageMaker semplifica la formazione dei modelli di machine learning fornendo tutto il necessario per formare, ottimizzare ed eseguire il debug dei modelli. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Debugger per eseguire il debug dei problemi e monitorare le risorse durante la formazione, puoi utilizzare le regole integrate per eseguire il debug dei processi di formazione oppure scrivere le tue regole personalizzate. L’uso delle regole integrate per il debug dei tuoi processi di formazione non implica alcun costo aggiuntivo. Per le regole personalizzate, ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.

  • MLflow
  • Amazon SageMaker con MLflow
    Amazon SageMaker con MLflow consente ai clienti di pagare solo ciò che usano. I clienti pagano i server di monitoraggio MLflow in base ai costi di elaborazione e archiviazione.

    I clienti pagheranno per l'elaborazione in base alle dimensioni del server di monitoraggio e al numero di ore di funzionamento. Inoltre, i clienti pagheranno per tutti i metadati archiviati sul server di monitoraggio MLflow.

  • Inferenza in tempo reale
  • Amazon SageMaker Hosting: inferenza in tempo reale
    Amazon SageMaker fornisce inferenza in tempo reale per i tuoi casi d’uso che hanno bisogno di previsioni in tempo reale. Ti sarà addebitato l'utilizzo del tipo di istanza che scegli. Se utilizzi Amazon SageMaker Model Monitor per gestire modelli altamente precisi che forniscono inferenze in tempo reale, per monitorare i modelli puoi utilizzare le regole integrate o scriverne di personalizzate. Per le regole integrate, hai diritto all'utilizzo gratuito di massimo 30 ore di monitoraggio. I costi aggiuntivi dipenderanno dalla durata dell'utilizzo. Se invece utilizzi le tue regole personalizzate, ti verrà addebitato un importo separato.

  • Inferenza asincrona
  • Amazon SageMaker Asynchronous Inference:
    Amazon SageMaker Asynchronous Inference è un'opzione di inferenza in tempo quasi reale che mette in coda richieste in entrata, elaborandole in maniera asincrona. Utilizza questa opzione quando hai bisogno di elaborare grandi payload all'arrivo dei dati o eseguire modelli che richiedono lunghi tempi di elaborazione dell'inferenza e non richiedono latenza inferiore al secondo. Pagherai per il tipo di istanza scelto.

  • Trasformazione in batch
  • Trasformazione in batch con Amazon SageMaker
    Con la trasformazione in batch di Amazon SageMaker, non è necessario porzionare il set di dati o gestire gli endpoint in tempo reale. La trasformazione in batch di SageMaker permette di eseguire analisi predittive su batch di dati di piccole e grandi dimensioni. Ti sarà addebitato l’importo per il tipo di istanza scelto in base alla durata dell’utilizzo.

  • Inferenza serverless
  • Amazon SageMaker Serverless Inference
    Il servizio Inferenza serverless Amazon SageMaker consente di implementare modelli di machine learning per l'inferenza senza configurare o gestire alcuna infrastruttura sottostante. Puoi utilizzare Inferenza serverless on demand o aggiungere la concorrenza assegnata al tuo endpoint per avere prestazioni prevedibili.

    Con Inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L’addebito per il calcolo dipende dalla configurazione di memoria che scegli.

    Simultaneità con provisioning

    Facoltativamente, puoi anche abilitare la concorrenza assegnata per i tuoi endpoint serverless. La concorrenza assegnata consente di implementare modelli su endpoint serverless con prestazioni prevedibili e scalabilità elevata, mantenendo gli endpoint pronti per un numero di richieste simultanee e il tempo specificati. Come per Inferenza serverless on demand, quando la funzionalità di concorrenza assegnata è abilitata, si paga in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. Paghi anche per l'utilizzo di concorrenza assegnata, in base alla memoria configurata, alla durata fornita e alla quantità di concorrenza abilitata.

  • JumpStart
  • Amazon SageMaker JumpStart
    Amazon SageMaker JumpStart ti aiuta a iniziare a utilizzare il machine learning rapidamente e facilmente tramite l'accesso con un clic alle raccolte di modelli popolari (note anche come "model zoo"). Jumpstart offre anche soluzioni end-to-end che risolvono casi d'uso comuni di ML e che possono essere personalizzate in base alle tue esigenze. Non sono previsti costi aggiuntivi per l'utilizzo di modelli o soluzioni JumpStart. Ti verranno addebitate le ore di istanze di formazione e inferenza sottostanti utilizzate come se le avessi create manualmente.

  • Profilatore
  • Amazon SageMaker Profiler raccoglie dati a livello di sistema per la visualizzazione di grafici di traccia di CPU e GPU ad alta risoluzione. Questo strumento è progettato per aiutare i data scientist e gli ingegneri a identificare gli ostacoli prestazionali legati all'hardware nei loro modelli di deep learning, risparmiando tempi e costi di formazione end-to-end. Attualmente SageMaker Profiler supporta solo la profilazione dei processi di addestramento tramite i tipi di istanze di calcolo di addestramento ml.g4dn.12xlarge, ml.p3dn.24xlarge e ml.p4d.24xlarge.

    Regioni: Stati Uniti orientali (Ohio), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Europa (Francoforte), Europa (Irlanda) e Israele (Tel Aviv).

    Profilatore Amazon SageMaker è attualmente in anteprima ed è disponibile gratuitamente per i clienti nelle regioni supportate. 

  • HyperPod
  • Amazon SageMaker HyperPod
    Amazon SageMaker HyperPod è stato creato appositamente per accelerare lo sviluppo di modelli di fondazione (FM). Per rendere l'addestramento del FM più resistente, monitora continuamente lo stato del cluster, ripara e sostituisce istantaneamente i nodi difettosi e salva i controlli frequenti per riprendere automaticamente l'allenamento senza perdere i progressi. SageMaker HyperPod è preconfigurato con le librerie di addestramento distribuite SageMaker che consentono di migliorare le prestazioni di addestramento dei FM utilizzando appieno l'infrastruttura di calcolo e di rete del cluster

    Nota: i prezzi di SageMaker HyperPod non coprono i costi per i servizi collegati ai cluster HyperPod, come Amazon EKS, Amazon FSx per Lustre e Amazon Simple Storage Service (Amazon S3).

  • Ottimizzazione dell'inferenza
  • Il kit di strumenti per l'ottimizzazione dell'inferenza semplifica l'implementazione delle più recenti tecniche di ottimizzazione dell'inferenza per ottenere prestazioni all'avanguardia (SOTA) in termini di costi su Amazon SageMaker, risparmiando mesi sui tempi di sviluppo. È possibile scegliere da un menu di tecniche di ottimizzazione popolari fornite da SageMaker ed eseguire lavori di ottimizzazione in anticipo, confrontare il modello per le metriche di prestazioni e precisione e, quindi, implementare il modello ottimizzato su un endpoint SageMaker per l'inferenza.

Dettagli delle istanze

Dettagli del prodotto istanza P5 di Amazon SageMaker

Dimensioni istanza vCPU Memoria istanza (TiB) Modello GPU GPU Memoria GPU totale (GB) Memoria per GPU (GB) Larghezza di banda della rete (Gb/s) GPUDirect RDMA Peer to peer GPU Storage dell’istanza (TB) Larghezza di banda EBS (Gb/s)
ml.p5.48xlarge 192 2 NVIDIA H100 8 640 HBM3 80 3200 EFAv2   NVSwitch a 900 Gb/s   8x3,84 NVMe SSD 80

Dettagli del prodotto istanza P4d di Amazon SageMaker

Dimensioni istanza vCPU Memoria istanza (GiB) Modello GPU GPU Memoria GPU totale (GB) Memoria per GPU (GB) Larghezza di banda della rete (Gb/s) GPUDirect RDMA Peer to peer GPU Archiviazione istanza (GB) Larghezza di banda EBS (Gb/s)
ml.p4d.24xlarge 96 1152 NVIDIA A100 8 320 HBM 2 40 400 ENA ed EFA NVSwitch a 600 GB/s 8x1000 SSD NVMe 19
ml.p4de.24xlarge 96 1152 NVIDIA A100 8 640 HNM2e 80 400 ENA ed EFA NVSwitch a 600 GB/s 8X1000 NVMe SSD 19

Dettagli del prodotto istanza P3 di Amazon SageMaker

Dimensioni istanza vCPU Memoria istanza (GiB) Modello GPU GPU Memoria GPU totale (GB) Memoria per GPU (GB) Larghezza di banda della rete (Gb/s) Peer to peer GPU Archiviazione istanza (GB) Larghezza di banda EBS (Gb/s)
ml.p3.2xlarge 8 61 NVIDIA V100 1 16 16 Fino a 10 N/D Solo EBS 1,5
ml.p3.8xlarge 32 244 NVIDIA V100 4 64 16 10 NVLink Solo EBS 7
ml.p3.16xlarge 64 488 NVIDIA V100 8 128 16 25 NVLink Solo EBS 14
ml.p3dn.24xlarge 96 768 NVIDIA V100 8 256 32 100 NVLink 2 x 900 SSD NVMe 19

Dettagli del prodotto istanza P2 di Amazon SageMaker

Dimensioni istanza vCPU Memoria istanza (GiB) Modello GPU GPU Memoria GPU totale (GB) Memoria per GPU (GB) Larghezza di banda della rete (Gb/s) Larghezza di banda EBS (Gb/s)
ml.p2.xlarge 4 61 NVIDIA K80 1 12 12 Fino a 10 Elevate
ml.p2.8xlarge 32 488 NVIDIA K80 8 96 12 10 10
ml.p2.16xlarge 64 732 NVIDIA K80 16 192 12 25 20

Dettagli del prodotto istanza G4 di Amazon SageMaker

Dimensioni istanza vCPU Memoria istanza (GiB) Modello GPU GPU Memoria GPU totale (GB) Memoria per GPU (GB) Larghezza di banda della rete (Gb/s) Archiviazione istanza (GB) Larghezza di banda EBS (Gb/s)
ml.g4dn.xlarge 4 16 NVIDIA T4 1 16 16 Fino a 25 1 x 125 SSD NVMe Fino a 3,5
ml.g4dn.2xlarge 8 32 NVIDIA T4 1 16 16 Fino a 25 1 x 125 SSD NVMe Fino a 3,5
ml.g4dn.4xlarge 16 64 NVIDIA T4 1 16 16 Fino a 25 1 x 125 SSD NVMe 4,75
ml.g4dn.8xlarge 32 128 NVIDIA T4 1 16 16 50 1 x 900 SSD NVMe 9,5
ml.g4dn.16xlarge 64 256 NVIDIA T4 1 16 16 50 1 x 900 SSD NVMe 9,5
ml.g4dn.12xlarge 48 192 NVIDIA T4 4 64 16 50 1 x 900 SSD NVMe 9,5

Dettagli del prodotto istanza G5 di Amazon SageMaker

Dimensioni istanza vCPU Memoria istanza (GiB) Modello GPU GPU Memoria GPU totale (GB) Memoria per GPU (GB) Larghezza di banda della rete (Gb/s) Larghezza di banda EBS (Gb/s) Archiviazione istanza (GB)
ml.g5n.xlarge 4 16 NVIDIA A10G 1 24 24 Fino a 10 Fino a 3,5 1x250
ml.g5.2xlarge 8 32 NVIDIA A10G 1 24 24 Fino a 10 Fino a 3,5 1x450
ml.g5.4xlarge 16 64 NVIDIA A10G 1 24 24 Fino a 25 8 1x600
ml.g5.8xlarge 32 128 NVIDIA A10G 1 24 24 25 16 1x900
ml.g5.16xlarge 64 256 NVIDIA A10G 1 24 24 25 16 1x1900
ml.g5.12xlarge 48 192 NVIDIA A10G 4 96 24 40 16 1x3800
ml.g5.24xlarge 96 384 NVIDIA A10G 4 96 24 50 19 1x3800
ml.g5.48xlarge 192 768 NVIDIA A10G 8 192 24 100 19 2x3800

Dettagli del prodotto istanza Trn1 di Amazon SageMaker

Dimensioni istanza vCPU Memoria (GiB) Acceleratori Trainium Memoria acceleratore (GB) Memoria per acceleratore (GB) Archiviazione istanza (GB) Larghezza di banda di rete (Gb/s) Larghezza di banda EBS (Gb/s)
ml.trn1.2xlarge 8 32 1 32 32 1 x 500 SSD NVMe Fino a 12,5 Fino a 20
ml.trn1.32xlarge 128 512 16 512 32 4 x 2000 SSD NVMe 800 80

Dettagli del prodotto istanza Inf1 di Amazon SageMaker

Dimensioni istanza vCPU Memoria (GiB) Acceleratori Inferentia Memoria acceleratore (GB) Memoria per acceleratore (GB) Archiviazione di istanze Interconnessione tra acceleratori Larghezza di banda di rete (Gb/s) Larghezza di banda EBS (Gb/s)
ml.inf1.xlarge 4 8 1 8 8 Solo EBS N/D Fino a 25 fino a 4,75
ml.inf1.2xlarge 8 16 1 8 8 Solo EBS N/D Fino a 25 fino a 4,75
ml.inf1.6xlarge 24 48 4 32 8 Solo EBS 25 4,75
ml.inf1.24xlarge 96 192 16 128 8 Solo EBS 100 19

Dettagli del prodotto istanza Inf2 di Amazon SageMaker

Dimensioni istanza vCPU Memoria (GiB) Acceleratori Inferentia Memoria acceleratore (GB) Memoria per acceleratore (GB) Archiviazione di istanze Interconnessione tra acceleratori Larghezza di banda di rete (Gb/s) Larghezza di banda EBS (Gb/s)
ml.inf2.xlarge 4 16 1 32 32 Solo EBS N/D Fino a 25 Fino a 10
ml.inf2.8xlarge 32 128 1 32 32 Solo EBS N/D Fino a 25 10
ml.inf2.24xlarge 96 384 6 196 32 Solo EBS 50 30
ml.inf2.48xlarge 192 768 12 384 32 Solo EBS 100 60

Amazon SageMaker Studio

Amazon SageMaker Studio è un'unica interfaccia basata sul Web per lo sviluppo completo di ML, che offre una scelta di ambienti di sviluppo integrati (IDE) completamente gestiti e strumenti personalizzati. È possibile accedere a SageMaker Studio gratuitamente. Ti verranno addebitati solo i costi di calcolo e archiviazione sottostanti utilizzati per diversi IDE e strumenti ML all'interno di SageMaker Studio.

Puoi utilizzare molti servizi di SageMaker Studio, AWS SDK per Python (Boto3) o Interfaccia della linea di comando AWS (AWS CLI), tra cui:

  • IDE su SageMaker Studio per eseguire lo sviluppo di ML completo con un ampio set di IDE completamente gestiti, tra cui JupyterLab, Code Editor basato su Code-OSS (Visual Studio Code – Open Source) ed RStudio
  • Pipeline di SageMaker per automatizzare e gestire i flussi di lavoro ML
  • Pilota automatico SageMaker per creare automaticamente modelli di ML con visibilità completa
  • Esperimenti SageMaker per organizzare e tenere traccia di processi e versioni
  • Debugger SageMaker per eseguire il debug delle anomalie durante l'addestramento
  • SageMaker Model Monitor per mantenere modelli di alta qualità
  • SageMaker Clarify per spiegare meglio i modelli ML e individuare gli errori
  • SageMaker JumpStart per implementare facilmente soluzioni ML per numerosi casi d'uso. Ti possono essere addebitati costi relativi ad altri servizi AWS utilizzati nella soluzione per le chiamate API sottostanti effettuate da Amazon SageMaker per tuo conto.
  • SageMaker Inference Recommender per ottenere suggerimenti per la corretta configurazione degli endpoint

Vengono addebitate solamente le risorse di calcolo e archiviazione sottostanti all'interno di SageMaker o altri servizi AWS, in base all'utilizzo.

Per usufruire del piano gratuito di Amazon Q Developer su Jupyter Lab e Code Editor, segui queste istruzioni. Per utilizzare Amazon Q Developer Pro su Jupyter Lab è necessario un abbonamento ad Amazon Q Developer. I prezzi di Amazon Q Developer sono disponibili qui.

Valutazioni dei modelli di fondazione

SageMaker Clarify supporta le valutazioni dei modelli di fondazione con metodi di valutazione automatici e a base umana. Ogni tipo di valutazione ha prezzi diversi. Se stai valutando un modello di fondazione di Amazon SageMaker JumpStart che non è ancora stato distribuito nel tuo account, SageMaker distribuirà temporaneamente il modello JumpStart su un'istanza SageMaker per la durata dell'inferenza. L'istanza specifica sarà conforme alla raccomandazione sull'istanza fornita da JumpStart per quel modello.

Valutazione automatica:
Le valutazioni dei modelli di fondazione vengono eseguite come processo di elaborazione SageMaker. Il processo di valutazione richiamerà SageMaker Inference. I clienti pagano l'inferenza e il lavoro di valutazione. Ai clienti viene addebitato solo il costo della durata del lavoro di valutazione. Il costo del processo di valutazione corrisponde alla somma del costo orario dell'istanza di valutazione e del costo orario dell'istanza di hosting.

Valutazione a base umana:
Quando si utilizza la funzionalità di valutazione a base umana e si coinvolge la propria forza lavoro, vengono addebitati tre elementi: 1) l'istanza SageMaker utilizzata per l'inferenza, 2) l'istanza utilizzata per eseguire il processo d elaborazione di SageMaker che ospita la valutazione umana e 3) un addebito di 0,21 USD per attività di valutazione umana completata. Un'attività umana è definita come l'evento in cui un lavoratore umano invia una valutazione di un singolo prompt e delle relative risposte di inferenza nell'interfaccia utente di valutazione umana. Il prezzo è lo stesso sia che tu abbia 1 o 2 modelli nel tuo processo di valutazione sia che porti la tua inferenza, ed è lo stesso indipendentemente dal numero di dimensioni di valutazione e metodi di valutazione che includi. Il prezzo di 0,21 USD per attività è lo stesso per tutte le Regioni AWS. Non è previsto alcun costo separato per la forza lavoro, poiché la forza lavoro viene fornita da te.

Valutazione gestita da AWS:
Per una valutazione da parte di esperti gestita da AWS, i prezzi sono personalizzati in base alle tue esigenze di valutazione, mediante un accordo privato con il team di valutazione degli esperti di AWS.

Amazon SageMaker Studio Lab

Puoi costruire e addestrare modelli di machine learning utilizzando Amazon SageMaker Studio Lab gratuitamente. SageMaker Studio Lab offre a sviluppatori, accademici e data scientist un ambiente di sviluppo senza configurazione per imparare e sperimentare con il machine learning senza costi aggiuntivi.

Amazon SageMaker Canvas

Amazon SageMaker Canvas espande l'accesso al ML fornendo ai business analyst la capacità di generare previsioni precise di ML utilizzando un'interfaccia grafica immediata, senza bisogno di codifica o esperienza di ML.

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling fornisce due offerte di etichettatura dei dati, Amazon SageMaker Ground Truth Plus e Amazon SageMaker Ground Truth. Puoi ottenere ulteriori informazioni su Amazon SageMaker Data Labeling, un servizio di etichettatura dei dati interamente gestito che semplifica la creazione di set di dati di addestramento altamente precisi per il machine learning.

Esecuzione di shadow test con Amazon SageMaker

SageMaker facilita l'esecuzione di shadow test per valutare un nuovo modello di ML prima del rilascio in produzione verificandone le prestazioni rispetto al modello attualmente implementato. L'esecuzione di shadow test SageMaker non prevede altri addebiti all'infuori dei costi di utilizzo delle istanze ML e dello spazio di archiviazione ML allocati per l'hosting del modello shadow. I prezzi per le istanze ML e le dimensioni di archiviazione ML corrispondono a quelli dell'opzione di inferenza in tempo reale specificata nella tabella dei prezzi di cui sopra. I dati elaborati all'interno e all'esterno delle implementazioni shadow non prevedono costi aggiuntivi.

Amazon SageMaker Edge

Scopri i prezzi di Amazon SageMaker Edge per ottimizzare, eseguire e monitorare i modelli ML sui parchi istanze di dispositivi edge. 

Savings Plans di Amazon SageMaker

I Savings Plans di Amazon SageMaker contribuiscono a ridurre i costi fino al 64%. I piani si applicano automaticamente all'uso idoneo delle istanze ML SageMaker, inclusi SageMaker Studio Notebooks, istanze Notebook SageMaker, SageMaker Processing, SageMaker Data Wrangler, SageMaker Training, SageMaker Real-Time Inference e SageMaker Batch Transform, indipendentemente dalla famiglia di istanze, dalla dimensione o dalla regione. Ad esempio, puoi modificare in qualsiasi momento l'uso da un'istanza CPU ml.c5.xlarge in esecuzione negli Stati Uniti orientali (Ohio) a un'istanza ml.Inf1 negli Stati Uniti occidentali (Oregon) per carichi di lavoro di inferenza e continuare automaticamente a pagare il prezzo di Savings Plans. 

Ulteriori informazioni »

Costo totale di proprietà con Amazon SageMaker

Amazon SageMaker offre un costo totale di proprietà inferiore di almeno il 54% nell'arco di tre anni rispetto ad altre soluzioni basate sul cloud gestite dal cliente. Scopri di più con l’analisi TCO completa per Amazon SageMaker.

Esempi di prezzo

  • In qualità di data scientist, trascorri 20 giorni utilizzando JupyterLab per una rapida sperimentazione su notebook, codice e dati per 6 ore al giorno su un'istanza ml.g4dn.xlarge. Crei e quindi esegui uno spazio JupyterLab per accedere all'IDE di JupyterLab. Il calcolo viene addebitato solo per l'istanza utilizzata quando lo spazio JupyterLab è in esecuzione. I costi di archiviazione per uno spazio JupyterLab maturano fino a quando non viene eliminato.

    Calcolo

    Istanza Durata Giorni Durata totale Costo orario Totale
    ml.g4dn.xlarge 6 ore 20 6 x 20 = 120 ore 0,7364 USD 88,368 USD

    Archiviazione

    Utilizzerai l'archiviazione SSD per uso generale per 480 ore (24 ore * 20 giorni). In una regione che addebita 0,1125 USD per GB al mese:
    0,112 USD per GB al mese * 5 GB * 480 / (24 ore/giorno * 30 giorni al mese) = 0,373 USD

  • In qualità di ingegnere ML, trascorri 20 giorni utilizzando Code Editor per la modifica, l'esecuzione e il debug del codice di produzione ML per 6 ore al giorno su un'istanza ml.g4dn.xlarge. Viene creato e quindi si esegue uno spazio dell'editor di codice per accedere all'IDE dell'editor. Quando lo spazio dell'editor di codice è in esecuzione, il calcolo viene addebitato solo per l'istanza utilizzata. I costi di archiviazione per lo spazio dell'editor di codice si accumulano fino a quando lo spazio non viene eliminato.

    Calcolo

    Istanza Durata Giorni Durata totale Costo orario Totale
    ml.g4dn.xlarge 6 ore 20 6 x 20 = 120 ore 0,7364 USD 88,368 USD

    Archiviazione

    Utilizzerai l'archiviazione SSD per uso generale per 480 ore (24 ore * 20 giorni). In una regione che addebita 0,1125 USD per GB al mese:
    0,112 USD per GB al mese * 5 GB * 480 / (24 ore/giorno * 30 giorni al mese) = 0,373 USD

  • Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo dei notebook di Amazon SageMaker Studio.

    1. Apre il notebook 1 in un kernel TensorFlow su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
    2. Apre il notebook 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue il notebook 1. 
    3. Lavora quindi contemporaneamente sul notebook 1 e sul notebook 2 per un'ora.
    4. Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente sul notebook 1 e sul notebook 2, ogni applicazione del kernel verrà misurata per 0,5 ore e verrà fatturata 1 ora.
    Applicazione kernel Istanza notebook Ore Costo orario Totale
    TensorFlow ml.c5.xlarge 1 0,204 USD 0,204 USD
    TensorFlow ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Data Science ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Un data scientist esegue la sequenza di azioni riportata di seguito durante l'utilizzo di RStudio:

    1. Avvia RSession 1 su un'istanza ml.c5.xlarge, quindi lavora su questo notebook per un'ora.
    2. Avvia RSession 2 su un'istanza ml.c5.xlarge. Si aprirà automaticamente nella stessa istanza ml.c5.xlarge che esegue RSession 1.
    3. Lavora su RSesssion 1 e RSession 2 in contemporanea per un'ora.
    4. Al data scientist verrà fatturato un totale di due (2) ore per l'utilizzo di ml.c5.xlarge. Per l'ora sovrapposta in cui ha lavorato contemporaneamente su RSession 1 e RSession 2, ogni applicazione Rsession verrà misurata per 0,5 ore e verrà fatturata 1 ora.

    Nel frattempo, l'RServer è in esecuzione 24 ore su 24, 7 giorni su 7, non importa se ci sono RSessions in esecuzione o meno. Se l'amministratore sceglie "Small" (ml.t3.medium), allora è gratuito. Se l'amministratore sceglie "Medium" (ml.c5.4xlarge) o "Large" (ml.c5.9xlarge), allora viene addebitata ogni ora finché RStudio è abilitato per il dominio SageMaker.

    App RSession Istanza RSession Ore Costo orario Totale
    Base R ml.c5.xlarge 1 0,204 USD 0,204 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
    Base R ml.c5.xlarge 0,5 0,204 USD 0,102 USD
            0,408 USD
  • Con Elaborazione Amazon SageMaker, sono addebitati esclusivamente i costi relativi alle istanze usate nell'esecuzione delle attività. Quando si forniscono i dati di input per l'elaborazione in Simple Storage Service (Amazon S3), Amazon SageMaker scarica i dati da Simple Storage Service (Amazon S3) nello spazio di archiviazione di file locale all'avvio di un'attività di elaborazione.

    Il data analyst esegue un'attività di elaborazione per pre-elaborare e convalidare i dati su due istanze ml.m5.4xlarge per una durata di 10 minuti. Carica un set di dati da 100 GB in S3 come input dell'attività di elaborazione; i dati di output, all'incirca della stessa dimensione, vengono archiviati nuovamente in S3.

    Ore  Istanze di elaborazione Costo orario Totale
    1 * 2 * 0,167 = 0,334 ml.m5.4xlarge 0,922 USD 0,308 USD
    Archiviazione (SSD) a scopo generico (GB) Costo orario Totale
    100 GB * 2 = 200 0,14 USD 0,0032 USD

    Subtotale per il processo di Amazon SageMaker Processing = 0,308 USD.
    Subtotale per 200 GB di archiviazione SSD a scopo generico = 0,0032 USD.
    Il costo totale per questo esempio è di 0,3112 USD.

  • Dalla tabella, usi Amazon SageMaker Data Wrangler per un totale di 18 ore in tre giorni per preparare i dati. Inoltre, crei un processo SageMaker Data Wrangler per preparare i dati aggiornati su base settimanale. Ogni processo dura 40 minuti e viene eseguito ogni settimana per un mese.

    Costo mensile complessivo per l'uso di Data Wrangler = 16,596 USD + 2,461 USD = 19,097 USD

    Applicazione Istanza SageMaker Studio Giorni Durata Durata totale Costo orario  Subtotale dei costi
    SageMaker Data Wrangler ml.m5.4xlarge 3 6 ore 18 ore 0,922 USD 16,596 USD
    Processo SageMaker Data Wrangler ml.m5.4xlarge - 40 minuti 2,67 ore 0,922 USD 2,461 USD

    Un data scientist passa tre giorni a utilizzare Amazon SageMaker Data Wrangler per pulire, esplorare e visualizzare i dati per 6 ore al giorno. Per eseguire la pipeline di preparazione dei dati, avvia quindi un processo di SageMaker Data Wrangler pianificato per essere eseguito settimanalmente.

    La tabella di seguito riporta l'uso totale per il mese e i costi associati per l'utilizzo di Amazon SageMaker Data Wrangler.

  • ++ Tutte le unità di lettura frazionali sono arrotondate al primo numero intero successivo

    Storage dei dati
    Dati archiviati totali = 31,5 GB
    Costo mensile per lo storage dei dati = 31,5 GB * 0,45 USD = 14,175 USD

    Costo mensile complessivo per l’archivio funzionalità di Amazon SageMaker = 56,875 USD + 3,185 USD + 14,175 USD = 74,235 USD

    Giorno del mese Scritture totali Unità di scrittura totali Letture totali Unità di lettura totali
    Dal giorno 1 al giorno 10 100.000 scritture 
    (10.000 scritture * 10 giorni)
    2.500.000 
    (100.000 * 25 KB)
    100.000 
    (10.000 * 10 giorni)
    700.000++ 
    (100.000 * 25/4 KB)
             
    Giorno 11 200.000 scritture 5.000.000 
    (200.000 * 25 KB)
    200.000 letture 1.400.000++ 
    (200.000 * 25/4 KB)
             
    Dal giorno 12 al giorno 30 1.520.000 scritture 
    (80.000 * 19 giorni)
    38.000.000 
    (1.520.000 * 25 KB)
    1.520.000 scritture
    (80.000 * 19 giorni)
    10.640.000++
    (1.520.000 * 25/4 KB)
             
    Unità fatturabili totali   45.500.000 unità di scrittura   12.740.000 unità di lettura
    Costo mensile per scritture e letture 56,875 USD 
    (45,5 milioni di unità di scrittura * 1,25 USD per milione di scritture)
    3,185 USD 
    (12,74 milioni di unità di lettura * 0,25 USD per milione di letture)

    Hai un'applicazione Web che emette letture e scritture di 25 KB ciascuna nell’archivio delle funzionalità di Amazon SageMaker. Per i primi 10 giorni di un mese, ricevi poco traffico sulla tua applicazione, risultando in 10.000 scritture e 10.000 letture ogni giorno nel Feature Store di SageMaker. L'undicesimo giorno, però, l'applicazione attira l'attenzione sui social media e il suo traffico si impenna raggiungendo 200.000 letture e 200.000 scritture, quel giorno. La tua applicazione finisce poi per avere un traffico più regolare, con una media di 80.000 letture e 80.000 scritture ogni giorno fino alla fine del mese.

    La tabella di seguito riporta l'utilizzo totale per il mese e i costi associati per l'utilizzo dell’archivio delle funzionalità di Amazon SageMaker.

  • Il costo totale per l’addestramento e il debug in questo esempio è 2,38 USD. Le istanze di calcolo e i volumi di archiviazione per uso generico impiegati dalle regole integrate del debugger Amazon SageMaker non comportano costi aggiuntivi.

      Archiviazione (SSD) a scopo generico per addestramento (GB) Archiviazione (SSD) a scopo generico per le regole integrate del debugger (GB) Archiviazione (SSD) a scopo generico per le regole personalizzate del debugger (GB) Costo per GB/mese Subtotale
    Capacità usata 3 2 1    
    Costo 0 USD Nessun costo aggiuntivo per i volumi di storage integrati 0 USD 0,10 USD 0 USD

     

    Ore Istanza di addestramento Istanza di debug Costo orario  Subtotale
    4 * 0,5 = 2 ml.m4.4xlarge n/d 0,96 USD 1,92 USD
    4 * 0,5 * 2 = 4 n/d Nessun costo aggiuntivo per le istanze di regole integrate 0 USD 0 USD
    4 * 0,5 = 2 ml.m5.xlarge n/d 0,23 USD 0,46 USD
            -------
            2,38 USD

    Un data scientist ha lavorato una settimana su un modello per una nuova idea. Addestra 4 volte un modello su un ml.m4.4xlarge con processi di addestramento da 30 minuti con Amazon SageMaker Debugger abilitato e utilizzando 2 regole integrate e 1 regola personalizzata scritta da lei. Per la regola personalizzata, ha specificato l'istanza ml.m5.xlarge. Addestra utilizzando 3G di dati per la formazione in Simple Storage Service (Amazon S3), inoltrando l'output del modello da 1 GB in Simple Storage Service (Amazon S3). SageMaker crea volumi SSD (gp2) a scopo generico per ciascuna istanza di addestramento. Inoltre, crea volumi SSD (gp2) a scopo generico per ciascuna regola specificata. Per questo esempio, saranno creati in tutto 4 volumi SSD (gp2) a scopo generico. Il Debugger SageMaker trasferisce 1 GB di dati di debug al bucket Amazon S3 del cliente.

  • Ci sono due team di data scientist. Un team con 10 data scientist e l'altro team con 40 data scientist. Per soddisfare questi due team, scegli di abilitare due diversi server di monitoraggio MLflow: uno piccolo e uno medio. Ogni team sta conducendo esperimenti di machine learning (ML) e deve registrare metriche, parametri e artefatti prodotti dai propri tentativi di formazione. Vogliono utilizzare i server di monitoraggio MLflow per 160 ore al mese. Supponiamo che ogni team di Data Science memorizzi 1 GB di metadati per tenere traccia delle esecuzioni negli esperimenti. La fattura alla fine del mese verrebbe calcolata come segue:  

    Costi di calcolo per Small Instance: 160 × 0,60 USD = 96 USD
    Costi di calcolo per Medium Instance: 160 × 1,40 USD = 166,4 USD
    Costi di archiviazione per due squadre: 2 × 1 × 0,10 = 0,20 USD

    Totale = 262,60 USD

  • Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese = 0,054 USD. Il costo totale per questo esempio è di 305,881 USD al mese.

    Nota: per le regole integrate con istanze ml.m5.xlarge, vengono aggregate fino a 30 ore al mese di monitoraggio in tutti gli endpoint senza alcun costo.

     

    Dati in entrata al mese - Hosting Dati in uscita al mese - Hosting Costo per GB in entrata o in uscita Totale
    100 MB * 31 = 3.100 MB   0,016 USD 0,0496 USD
      10 MB * 31 = 310 MB 0,016 USD 0,00496 USD
    Ore al mese Istanze di hosting Istanze di monitoraggio modelli  Costo orario Totale
    24 * 31 * 2 = 1.488 ml.c5.xlarge   0,204 USD 303,522 USD
    31 * 0,08 = 2,5   ml.m5.4xlarge 0,922 USD 2,305 USD

    Il modello dell'esempio n. 5 viene implementato in produzione in due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Amazon SageMaker Model Monitor è abilitato con una (1) istanza ml.m5.4xlarge e il monitoraggio delle attività è pianificato una volta al giorno. Ciascuna attività di monitoraggio richiede 5 minuti per il completamento. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.

  • Il subtotale per l’inferenza asincrona di SageMaker è di 15,81 USD + 0,56 USD + (2 * 0,0048) = 16,38 USD. Il costo totale dell’inferenza asincrona per questo esempio è di 16,38 USD al mese. 

    Dati in entrata al mese Dati in uscita al mese Costo per GB in entrata o in uscita Totale
    10 KB * 1.024 * 31 = 310 MB 10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048
      10 KB * 1.024 * 31 = 310 MB 0,02 USD 0,0048
    Archiviazione (SSD) a scopo generico (GB) Costo per GB/mese Totale
    4 0,14 USD 0,56 USD
    Ore al mese Istanze di hosting Costo orario Totale
    2,5 * 31 * 1 = 77,5 ml.c5.xlarge 0,20 USD 15,81 USD

    L’inferenza asincrona di Amazon SageMaker addebita i costi per le istanze utilizzate dall'endpoint. Quando non stai elaborando attivamente delle richieste, puoi configurare la scalabilità automatica per dimensionare il conto delle istanze a zero e risparmiare sui costi. Per payload di input in Simple Storage Service (Amazon S3), non ci sono costi per leggere dati di input da Simple Storage Service (Amazon S3) e scrivere i dati di output su S3 nella stessa regione.

    Il modello dell'esempio n. 5 è utilizzato per eseguire un endpoint SageMaker Asynchronous Inference. L'endpoint viene configurato per essere eseguito su 1 istanza ml.c5.xlarge e per ridurre il conto delle istanze a zero quando non stai elaborando attivamente delle richieste. L'istanza ml.c5.xlarge nell'endpoint ha uno spazio di archiviazione (SSD) a scopo generico allegato di 4 GB. In questo esempio, l'endpoint mantiene un costo delle istanze di 1 per 2 ore al giorno e ha un tempo di raffreddamento di 30 minuti, dopo il quale si riduce a un conto delle istanze pari a zero per il resto della giornata. Pertanto, pagherai per 2,5 ore di utilizzo al giorno. 

    L'endpoint elabora 1.024 richieste al giorno. La dimensione di ciascun corpo di richiesta/risposta di chiamata è di 10 KB e ogni payload di richiesta di inferenza in Simple Storage Service (Amazon S3) è di 100 MB. Gli output delle inferenze sono pari a 1/10 della dimensione dei dati di input archiviati in Simple Storage Service (Amazon S3) nella stessa regione. In questo esempio, i costi per l'elaborazione dei dati si applicano al corpo della richiesta e della risposta, ma non ai dati trasferiti a/da Amazon S3. 

  • Gli addebiti totali per l'inferenza in questo esempio sarebbero 2,88 USD.

    Ore  Istanze di hosting Costo orario Totale
    3 * 0,25 * 4 = 3 ore ml.m4.4xlarge 0,96 USD 2,88 USD

    Il modello dell'esempio n. 5 è utilizzato per eseguire una trasformazione in batch con SageMaker. Il data scientist esegue quattro processi di trasformazione in batc SageMaker separati su 3 istanze ml.m4.4xlarge per una durata di 15 minuti per ciascuna esecuzione. Carica poi un set di dati di valutazione di 1 GB in S3 per ciascuna esecuzione; le inferenze saranno 1/10 delle dimensioni dei dati in ingresso memorizzati in S3.

  • Costi mensili di elaborazione dei dati

    Elaborazione dei dati (GB) Costo per GB in entrata o in uscita Costi mensili di elaborazione dei dati
    10 GB 0,016 USD 0,16 USD

    Il subtotale per il costo della durata di SageMaker Serverless inference on demand è 40 USD. Il subtotale per il costo di elaborazione dei dati da 10 GB è 0,16 USD. Il costo complessivo per questo esempio è di 40,16 USD.

    Costi di calcolo mensili

    Numero di richieste Durata di ciascuna richiesta Durata totale dell’inferenza (sec) Costo al secondo Costi mensili per la durata dell’inferenza
    10 milioni 100 ms 1 milione 0,00004 USD 40 USD

    Con l’inferenza serverless on demand, si paga solo in base alla capacità di calcolo utilizzata per elaborare le richieste di inferenza, fatturata al millisecondo, e alla quantità di dati elaborati. L'addebito per il calcolo dipende dalla configurazione di memoria che scegli.

    Supponiamo che siano stati allocati 2 GB di memoria al proprio endpoint, questo sia stato eseguito 10 milioni di volte in un mese, abbia funzionato per 100 ms ogni volta e siano stati elaborati 10 GB di dati in entrata e in uscita in totale. Gli addebiti vengono calcolati come segue:

  • Supponiamo che tu stia gestendo un servizio di chatbot per un'azienda di elaborazione di buste paga. Ti aspetti un picco nelle richieste dei clienti a fine marzo, prima della scadenza per la presentazione della dichiarazione dei redditi. Tuttavia, per il resto del mese, prevedi un traffico basso. Quindi, decidi di implementare un endpoint serverless con 2 GB di memoria e di aggiungere una simultaneità assegnata di 100 per gli ultimi 5 giorni del mese nella fascia oraria 9:00-17:00 (8 ore), durante i quali l'endpoint elabora un totale di 10 milioni di richieste e 10 GB di dati in entrata e in uscita. Nel resto del mese, il chatbot funziona su Inferenza serverless on demand ed elabora 3 milioni di richieste e 3 GB di dati in entrata e in uscita. Supponiamo che la durata di ogni richiesta sia di 100 ms.

    Costi della simultaneità assegnata (Provisioned Concurrency, PC)
    Il prezzo della PC è di 0,000010 USD/s
    Durata di utilizzo della PC (s) = 5 giorni * 100 PC * 8 ore * 3.600 s = 14.400.000 s
    Costo di utilizzo della PC = 14.400.000 s * 0,000010 USD/s = 144 USD.

    Costi della durata dell'inferenza per il traffico servito dalla simultaneità assegnata
    Il prezzo della durata dell'inferenza è di 0,000023 USD/s
    Durata totale dell'inferenza per PC (s) = 10 milioni * (100 ms)/1.000 = 1 milione di secondi.
    Costi per la durata dell'inferenza per PC = 1.000.000 s * 0.,000023 USD/s = 23 USD

    Costi della durata dell'inferenza on demand
    Il prezzo di calcolo mensile è di 0,00004 USD/s e il piano gratuito offre 150.000 s.
    Calcolo totale (s) = (3) milioni * (100 ms)/1.000 = 0,3 milioni di secondi.
    Calcolo totale - calcolo incluso nel piano gratuito = calcolo fatturabili al mese in secondi
    0,3 milioni s - 150.000 s = 150.000 s
    Costi mensili per l'elaborazione = 150.000 * 0,00004 USD = 6 USD

    Elaborazione dati
    Costo/GB di dati elaborati in entrata/uscita = 0,016 USD
    Totale GB elaborati = 10 + 3 = 13
    Costo totale = 0,016 USD * 13 = 0,208 USD

    Costi totali per marzo
    Costi totali = costi di simultaneità assegnata + durata dell'inferenza per simultaneità assegnata + durata dell'inferenza per calcolo on demand + costi di elaborazione dati
    = 144 USD + 23 USD + 6 USD + 0,208 USD = 173,2 USD

  • Il cliente utilizza JumpStart per implementare un modello BERT Base Uncased pre-addestrato per classificare il sentiment delle recensioni dei clienti come positivo o negativo.

    Il cliente implementa il modello a due (2) istanze ml.c5.xlarge per un hosting multi-AZ affidabile. Il modello riceve 100 MB di dati al giorno e le dimensioni delle inferenze sono 1/10 rispetto a quelle dei dati in entrata.

    Ore al mese Istanze di hosting Costo orario Totale
    24 * 31 * 2 = 1.488 ml.c5.xlarge 0,204 USD 303,55 USD
     
    Dati in entrata al mese - Hosting Dati in uscita al mese - Hosting Costo per GB in entrata o in uscita

    Totale

    100 MB * 31 = 3.100 MB   0,02 USD 0,06 USD
      10 MB * 31 = 310 MB 0,02 USD 0,01 USD
     

    Il subtotale per l’addestramento, l’hosting e il monitoraggio = 305,827 USD. Il subtotale per 3.100 MB di dati elaborati in entrata e 310 MB di dati elaborati in uscita per l'hosting al mese è 0,06 USD. Il costo totale per questo esempio è di 305,887 USD al mese.

  • Supponiamo di voler effettuare il provisioning di un cluster di 4 ml.g5.24xlarge per 1 mese (30 giorni) con 100 GB di spazio di archiviazione aggiuntivo per istanza per supportare lo sviluppo del modello. I costi totali per il cluster e lo spazio di archiviazione aggiuntivo in questo esempio sono di 29.374,40 USD.

    Calcolo

    Istanza Durata Istanze Costo orario Subtotale
    ml.g5.24xlarge 30 giorni × 24 ore = 720 ore 4 10,18 USD 29.318,40 USD

    Archiviazione

    Archiviazione per uso generico (SSD) Durata Istanze Costo per GB/mese Subtotale
    100 GB 30 giorni × 24 ore = 720 ore 4 0,14 USD 56,00 USD
  • Le valutazioni dei modelli di fondazione con SageMaker Clarify ti addebiteranno solo le istanze utilizzate durante l'esecuzione dei lavori di valutazione automatici. Quando si seleziona un'attività di valutazione automatica e un set di dati, SageMaker carica il set di dati prompt da Amazon S3 su un'istanza di valutazione SageMaker.

    Nell'esempio seguente, un ingegnere ML esegue una valutazione del modello Llama2 7B negli Stati Uniti orientali (Virginia settentrionale) per rilevare l'accuratezza delle attività di riepilogo. Il tipo di istanza consigliato per l'inferenza per Llama 2 7B è ml.g5.2xlarge. L'istanza minima consigliata per una valutazione è ml.m5.2xlarge. In questo esempio, il processo viene eseguito per 45 minuti (a seconda delle dimensioni del set di dati). In questo esempio, il costo sarebbe di 1,48 USD per il lavoro di valutazione e i risultati dettagliati.

    Ore del processo di elaborazione (esempio)

    Regione

    Tipo di istanza

    Istanza

    Costo orario

    Costo

    0,45

    US-east-1

    Hosting LLM

    ml.g5.2xlarge

    1,52 USD

    1,14 USD

    0,45

    US-east-1

    valutazione

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Totale

           

    1,48 USD

    Nel prossimo esempio, lo stesso tecnico in Virginia esegue un altro lavoro di valutazione per l'accuratezza delle attività di riepilogo, ma utilizza una versione personalizzata di Llama 2 7B che viene distribuita sul proprio account ed entra in funzione. In questo caso, poiché il modello è già distribuito nel suo account, l'unico costo incrementale sarebbe quello dell'istanza di valutazione.

    Ore del processo di elaborazione

    Regione

    Tipo di istanza

    Istanza

    Costo orario

    Costo

    0,45

    US-east-1

    valutazione

    ml.m5.2xlarge

    0,46 USD

    0,35 USD

    Totale

           

    0,35 USD

  • Nell'esempio seguente, un ingegnere di machine learning negli Stati Uniti orientali (Virginia settentrionale) esegue una valutazione a base umana di Llama-2-7B per rilevare la precisione delle attività di riepilogo e utilizza la propria forza lavoro privata per questa valutazione. Il tipo di istanza consigliato per Llama-2-7B è ml.g5.2xlarge. L'istanza minima consigliata per un processo di elaborazione di valutazione a base umana è ml.t3.medium. L'inferenza su Llama-2-7B viene eseguita per 45 minuti (a seconda della dimensione del set di dati). Il set di dati contiene 50 prompt e lo sviluppatore richiede 2 collaboratori per valutare ogni set di prompt e risposte (configurabile nella creazione del lavoro di valutazione come parametro «collaboratore per prompt»). Ci saranno 100 attività in questo lavoro di valutazione (1 attività per ogni coppia prompt-risposta per ogni collaboratore: 2 collaboratori x 50 set di risposta rapida = 100 attività umane). La forza lavoro umana impiega un giorno (24 ore) per completare tutte le 100 attività di valutazione umana nel lavoro di valutazione (a seconda del numero e dal livello di abilità dei collaboratori e dalla lunghezza/complessità dei prompt e delle risposte di inferenza).

    Ore di calcolo

    Attività umane

    Regione

    Tipo di istanza

    Istanza

    Costo orario

    Costo per attività umana

    Costo totale

    0,45

     

    Stati Uniti orientali (Virginia settentrionale)

    Hosting LLM

    ml.g5.2xlarge

    1,52 USD

     

    1,14 USD

    24

     

    Stati Uniti orientali (Virginia settentrionale)

    Processo di elaborazione

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Qualsiasi

         

    0,21 USD

    21,00 USD

    Totale

               

    23,34 USD

    Nel prossimo esempio, lo stesso tecnico negli Stati Uniti orientali (Virginia settentrionale) esegue lo stesso lavoro di valutazione ma utilizza Llama-2-7B già installato sul proprio account e già in funzione. In questo caso, l'unico costo incrementale sarebbe per il processo di elaborazione della valutazione e le attività umane.

    Ore di calcolo

    Attività umane

    Regione

    Tipo di istanza

    Istanza

    Costo orario

    Costo per attività umana

    Costo totale

    24

     

    Stati Uniti orientali (Virginia settentrionale)

    Processo di elaborazione

    ml.t3.medium

    0,05 USD

     

    1,20 USD

     

    100

    Qualsiasi

         

    0,21 USD

    21,00 USD

    Totale

               

    22,20 USD