Tipi di nodi di Amazon Redshift

Amazon Redshift offre diversi tipi di nodo per accogliere i tuoi carichi di lavoro e consigliamo di scegliere RA3 o DC2 a seconda delle prestazioni necessarie, delle dimensioni dei dati e della relativa crescita. Amazon Redshift Serverless effettua automaticamente il provisioning delle risorse necessarie per gestire il carico di lavoro e non dover scegliere un tipo di nodo.

I nodi RA3 con archiviazione gestita ti consentono di ottimizzare il tuo data warehouse dimensionando e pagando le capacità di calcolo e archiviazione gestita separatamente. Con RA3, basta scegliere il numero di nodi in base alle prestazioni necessarie e verrà fatturato solo l’archiviazione gestita utilizzata. È opportuno dimensionare il cluster RA3 a seconda della quantità di dati elaborata quotidianamente.

Redshift Managed Storage (RMS) utilizza SSD (solid state drive) di grandi dimensioni e ad alte prestazioni in ciascun nodo RA3 per offrire capacità veloci di archiviazione locale e Amazon Simple Storage Service (Amazon S3) per un’archiviazione a lungo termine. Se i dati in un nodo aumentano superando la dimensione delle SSD locali, RMS trasferisce automaticamente tali dati su Amazon S3. Pagherai la stessa bassa tariffa per RMS, indipendentemente dal luogo in cui i dati si trovano (SSD a elevate prestazioni o Amazon S3). Nel caso di carichi di lavoro che richiedono capacità di archiviazione in costante crescita, l’archiviazione gestita permette di scalare automaticamente la capacità del data warehouse senza aggiungere o pagare ulteriori nodi.

I nodi DC2 abilitano data warehouse intensivi per il calcolo con storage SSD locale incluso. Scegli il numero di nodi di cui hai bisogno in base alla dimensione dei dati e alle prestazioni necessarie. I nodi DC2 archiviano i dati a livello locale per garantire prestazioni elevate e, mano a mano che le dimensioni dei dati crescono, puoi aggiungere ulteriori nodi di calcolo per incrementare la capacità di archiviazione del cluster. Nel caso di set di dati inferiori a 1 TB non compressi, consigliamo i nodi DC2, così da avere prestazioni ottimali con costi minimi. Se prevedi una crescita dei dati, consigliamo i nodi RA3, così da poter dimensionare il calcolo e l’archiviazione in modo indipendente per ottenere prezzi e prestazioni ottimali.

Capacità di Redshift con prezzi in base al consumo

  • Tipi di nodo Amazon Redshift: scegli la configurazione del cluster e il tipo di nodo adatti alle tue esigenze, e puoi pagare la capacità a ore con i prezzi on demand di Amazon Redshift. Quando scegli il prezzo on demand, puoi utilizzare la funzione pausa e ripresa per sospendere la fatturazione on demand quando un cluster non viene utilizzato. Puoi anche scegliere Istanze riservate invece di istanze on demand per carichi di lavoro stazionari e ottenere sconti significativi rispetto ai prezzi on demand.
  • Prezzi di Amazon Redshift Spectrum: esegui query SQL in modo diretto su exabyte di data lake in Amazon S3; sarà addebitata una tariffa in base al numero di byte scansionati.
  • Prezzi di Dimensionamento simultaneo: ciascun cluster accumula fino a un'ora di crediti gratuiti di dimensionamento simultaneo al giorno, sufficienti per il 97% dei clienti. Ciò offre prestazioni delle query rapide e costanti anche con migliaia di utenti e query in contemporanea. Viene applicata una tariffa on demand al secondo solo per l’utilizzo che eccede i crediti gratuiti.
  • Prezzi di RMS: si pagano solo i dati archiviati nei cluster RA3, a prescindere dal numero di nodi di calcolo allocati. Pagherai semplicemente la tariffa oraria per la quantità totale di dati all’interno dell’archiviazione gestita. RMS viene utilizzato anche con Amazon Redshift Serverless.
  • Redshift ML: si utilizza SQL per creare, addestrare e implementare modelli di machine learning (ML). Dopo aver esaurito il livello gratuito per Amazon SageMaker, dovrai sostenere dei costi per la creazione del modello e dell’archiviazione. Il ML di Amazon Redshift è disponibile per l'utilizzo con Amazon Redshift serverless.

Prova gratuita di Amazon Redshift

Se non hai mai usato Amazon Redshift Serverless prima, hai diritto a un credito di 300 USD con scadenza di 90 giorni per l'utilizzo di elaborazione e archiviazione. Il tasso di consumo di questo credito dipende dall'utilizzo effettivo e dalla capacità di calcolo del tuo endpoint serverless.

Nelle regioni in cui Amazon Redshift serverless non è ancora disponibile, i clienti possono iniziare una prova gratuita per i cluster forniti. Hai diritto a una prova gratuita di due mesi del nostro nodo di grandi dimensioni DC2. La tua organizzazione otterrà 750 ore gratuite al mese, un numero sufficiente per eseguire un nodo grande DC2 con 160 GB di archiviazione SSD compressa. Una volta scaduti i due mesi di prova gratuita, oppure una volta superata la soglia di 750 ore al mese di utilizzo, puoi disattivare il tuo cluster per evitare addebiti, oppure mantenerlo attivo alla nostra tariffa on demand standard. Visita la pagina della prova gratuita di Amazon Redshift per saperne di più.

Prezzi on demand

I prezzi on demand di Amazon Redshift ti consentono di pagare per la capacità assegnata in ore senza impegni e senza costi anticipati per il tipo di nodo scelto per l'esecuzione del data warehouse. Pagherai solo una tariffa oraria basata sul tipo e sul numero di nodi nel cluster e solo finché il cluster sarà in esecuzione. Le ore di utilizzo parziale sono fatturate in incrementi di un secondo derivante da un'operazione di modifica dello stato fatturabile, quali la creazione o l'eliminazione, l'interruzione o il riavvio del cluster. La funzione di pausa e riavvio consente di sospendere la fatturazione on demand durante il periodo di interruzione del cluster. La funzione di pausa e riavvio è un'operazione manuale e pianificata sui tipi di nodo Redshift. Durante il periodo di pausa di un cluster, verranno addebitati esclusivamente i costi di archiviazione di backup. In questo modo non sarà necessario pianificare né acquistare in anticipo estensioni del data warehouse e sarà possibile gestire ambienti di sviluppo o di test a costi ridotti. Per un'implementazione multi-AZ sono previste le stesse tariffe di fatturazione, ma con una capacità di calcolo doppia rispetto a quanto pagheresti per un'implementazione su AZ singola.

Generazione attuale

*Capacità totale di archiviazione indirizzabile nell'archiviazione gestita con ciascun nodo RA3.

Generazione precedente

Calcolo del prezzo effettivo per TB all'anno con prezzi on demand

Per le istanze on demand, il prezzo effettivo per TB all'anno viene calcolato moltiplicando la tariffa oraria dell'istanza per il numero di ore di utilizzo in un anno e dividendo il risultato per il numero di TB per istanza. Per le istanze RA3, i dati archiviati nell'archiviazione gestita vengono fatturati separatamente sulla base dei dati effettivamente archiviati su questo tipo di nodo; il prezzo effettivo annuale per TB viene calcolato solo per i costi del nodo di calcolo.

Amazon Redshift serverless

Puoi iniziare a utilizzare Amazon Redshift serverless a soli 3 USD all'ora e pagare solo per la capacità di elaborazione che il tuo data warehouse consuma quando è attivo. La capacità del data warehouse viene automaticamente aumentata o ridotta in base alle necessità del carico di lavoro delle applicazioni, mentre il database viene disattivato durante i periodi di inattività per risparmiare tempo di amministrazione e costi. Amazon Redshift misura la capacità del data warehouse in RPU (Redshift Processing Units). Paghi per i carichi di lavoro che esegui in ore di RPU o per secondo (con un addebito minimo di 60 secondi), comprese le query che accedono ai dati in formati di file aperti in Amazon S3. Non ci sono costi per il tempo di attivazione del data warehouse. Le funzionalità di scalabilità automatica e sicurezza completa sono incluse. Non devi pagare per il dimensionamento simultaneo e Redshift Spectrum separatamente perché sono entrambi inclusi con Amazon Redshift Serverless.

Facoltativamente, è possibile utilizzare le impostazioni Base, Max RPU-Hours e MaxRPU (capacità massima) per controllare le prestazioni e i costi del data warehouse.

  • Base: questa impostazione ti consente di specificare la capacità di base del data warehouse che Amazon Redshift utilizza per le query. La capacità di base è specificata nelle RPU. Impostare la capacità di calcolo con base più alta può migliorare le prestazioni delle query soprattutto per l'elaborazione dei dati e i processi di estrazione, trasformazione e caricamento (ETL) che elaborano grandi quantità di dati ed eseguono trasformazioni e arricchimenti. Puoi adattare Base da 8 RPU a 512 RPU in unità di 8 (8, 16, 24, 32, 40, 48 e così via, fino a 512) dalla console di gestione di Amazon Redshift o invocando un'API Amazon Redshift.
  • Max: questa impostazione ti consente di specificare i limiti di utilizzo e definire le azioni che Amazon Redshift eseguirà automaticamente se tali limiti verranno raggiunti, così da mantenere il budget come previsto. Max è specificato in ore di RPU e viene associato con una durata giornaliera, settimanale e mensile. Impostare la capacità di calcolo con un massimo più alto può migliorare la velocità effettiva del sistema, un vantaggio in particolare per i carichi di lavoro che devono gestire grande concorrenza mantenendo al contempo un'alta qualità delle prestazioni. Puoi adattare Max da dalla console di gestione di Amazon Redshift o invocando un'API Amazon Redshift.
  • MaxRPU (capacità massima): questa impostazione stabilisce il numero massimo di RPU che Amazon Redshift serverless può supportare per scopi di scalabilità. Quando è richiesto il ridimensionamento automatico dell'elaborazione, avere un valore più alto per MaxRPU può migliorare il throughput delle query. Quando viene raggiunto il limite MaxRPU, l'elaborazione del gruppo di lavoro non aumenta ulteriormente le risorse.

La capacità di archiviazione primaria viene fatturata come Redshift Managed Storage (RMS), mentre l'archiviazione utilizzata per gli snapshot dell'utente viene fatturata alle tariffe standard del backup indicate su questa pagina. Le tariffe per l'archiviazione sono le stesse fatturate con i cluster con provisioning di Amazon Redshift. Con Amazon Redshift Serverless, puoi ripristinare il data warehouse per punti specifici nelle ultime 24 ore con una granularità di 30 minuti gratuitamente. I costi per il trasferimento dei dati e il ML si applicano separatamente, come avviene per i cluster con provisioning. La replica degli snapshot e la condivisione di dati tra regioni AWS vengono fatturate alle tariffe del trasferimento indicate su questa pagina.

Prezzi dell’archiviazione gestita di Amazon Redshift

Ti verrà addebitato il costo dei dati archiviati nell’archiviazione gestita a una tariffa mensile fissa per GB specifica per la tua regione. La capacità di archiviazione gestita è disponibile solo per i tipi di nodi RA3 e pagherai la stessa tariffa competitiva per l’archiviazione gestita di Redshift, a prescindere dalla dimensione dei dati. L’utilizzo dell’archiviazione gestita viene calcolato su base oraria sui dati complessivi presenti nell’archiviazione gestita stessa (fai riferimento all’esempio di conversione dell’utilizzo in GB/ora in GB/mese). Puoi monitorare la quantità di dati nel tuo cluster RA3 attraverso Amazon CloudWatch o la Console di gestione AWS. Non ti verrà addebitato il costo per qualsiasi trasferimento di dati tra i nodi RA3 e l’archiviazione gestita. Le tariffe per l'archiviazione gestita non includono i costi dell'archiviazione di backup dovuto a snapshot automatici e manuali (fai riferimento alla sezione Archiviazione di backup). Una volta che il cluster viene terminato, continuerai a dover pagare le tariffe per il mantenimento dei tuoi backup manuali.

Esempio di prezzi per le tariffe dell'archiviazione gestita

Supponiamo di archiviare 100 GB di dati nell'archiviazione gestita, con nodi RA3 per i primi 15 giorni di aprile e 100 TB di dati per gli ultimi 15 giorni dello stesso mese.
 
Per prima cosa, calcoliamo l'utilizzo in GB-ore. Per i primi 15 giorni del mese, si avrà il seguente utilizzo: 100 GB x 15 giorni x (24 ore/giorno) = 36.000 GB-ore. Per i primi 15 giorni del mese, si avrà il seguente utilizzo: 100 TB X 1024 GB/TB x 15 giorni x (24 ore/giorno) = 36.864.000 GB-ore.
 
Al termine del mese di aprile, tutto l’utilizzo in termini di GB-ore equivale a: 36.000 GB-ore + 36.864.000 GB-ore = 36.900.000 GB-ore
Convertiamo questo valore in GB-mesi: 36.900.000 GB-ore / 720 ore per il mese di aprile = 51.250 GB-mese.
 
Supponiamo che questi dati siano stati archiviati nella regione Stati Uniti orientali (Virginia settentrionale): il prezzo dello storage gestito ammonterebbe a 0,024 USD per GB-mese. I costi per l'archiviazione mensile per 51.250 GB-mese sarebbero: 51.250 GB-mese x 0,024 USD per GB-mese = 1.230 USD.
 
Costo totale di RMS per aprile = 1.230 USD

Prezzi di Amazon Redshift Spectrum

Amazon Redshift Spectrum consente di eseguire query SQL direttamente su exabyte di dati in Amazon S3. I costi vengono calcolati in base al numero di byte scansionati da Redshift Spectrum, approssimati al MB intero più vicino; il volume minimo di dati per ciascuna query è di 10 MB. Non è previsto alcun costo per le istruzioni DDL (Data Definition Language) quali CREATE/ALTER/DROP TABLE per la gestione delle partizioni e delle query con errori.

Le query di Amazon Redshift Serverless sui dati esterni in Amazon S3 non vengono fatturate separatamente e sono incluse nel totale di Amazon Redshift Serverless in ore di RPU.

È inoltre possibile migliorare le prestazioni delle query e ridurre i costi archiviando i dati in formati compressi, partizionati e a colonne. Se i dati vengono compressi utilizzando uno dei formati supportati da Redshift Spectrum, i costi saranno inferiori perché il volume di dati scansionati sarà inferiore. Analogamente, se i dati vengono memorizzati in un formato a colonne, ad esempio Apache Parquet e Optimized Row Columnar (ORC), i costi risulteranno ridotti, perché Redshift Spectrum scansionerà solamente le colonne interessate dalla query.

Costi aggiuntivi

Ti verrà addebitato il costo del cluster Amazon Redshift utilizzato per eseguire query sui dati con Redshift Spectrum. Redshift Spectrum esegue le query sui dati direttamente in Amazon S3. Ti verranno addebitate le tariffe standard di S3 per l’archiviazione di oggetti nei tuoi bucket S3, e per le richieste effettuate sugli stessi. Per ulteriori dettagli, consulta la pagina dei prezzi di Amazon S3

Se il catalogo dati di AWS Glue viene utilizzato con Amazon Redshift Spectrum, saranno addebitate le tariffe standard del catalogo dati di AWS Glue. Per ulteriori dettagli, consulta la pagina dei prezzi di AWS Glue.

Quando si utilizza Amazon Redshift Spectrum per eseguire query di dati crittografati AWS Key Management Service (KMS) in Amazon S3, vengono addebitate le tariffe standard di AWS KMS. Per ulteriori dettagli, consulta la pagina dei prezzi di AWS KMS.

Esempi di prezzi di Redshift Spectrum basati sui costi in vigore degli Stati Uniti orientali (Virginia settentrionale)

Supponiamo di avere una tabella con 100 colonne di pari volume memorizzata in Amazon S3 in formato non compresso, per un volume totale di 4 TB. Per eseguire una query su una singola colonna della tabella, Redshift Spectrum dovrà scansionare l'intero file, perché i formati di testo non possono essere divisi. Questa query scansionerà quindi 4 TB di dati e costerà 20 USD. (5 USD/TB x 4 TB = 20 USD)

Se comprimi il file con GZIP, il rapporto di compressione può essere di una proporzione di 4:1. In questo caso, la scansione sarebbe solo su un file di 1 TB. Redshift Spectrum dovrà scansionare l'intero file, ma siccome le dimensioni sono ridotte a un quarto, il costo sarà ugualmente inferiore: 5 USD. (5 USD/TB x 1 TB = 5 USD)

Se oltre a comprimere il file, si convertisse in un formato a colonne come Apache Parquet, si sfrutterebbe il rapporto di compressione 4:1, perciò le dimensioni del file sarebbero ridotte a 1 TB. Applicando la stessa query, Redshift Spectrum dovrebbe però scansionare solo una colonna del file Parquet. Il costo di questa query sarebbe pari a 0,05 USD. (5 USD/TB x dimensione di file di 1 TB x 1 colonna su 100 o un totale di 10 GB scansionati = 0,05 USD)

Nota: gli esempi di prezzi di cui sopra sono solo a scopo illustrativo. Il rapporto di compressione di file e colonne differenti potrebbe variare.

Prezzi di Concurrency Scaling

Amazon Redshift aggiunge automaticamente capacità transitorie per fornire prestazioni rapide e costanti, anche con migliaia di utenti o query in contemporanea. Non vi sono risorse da gestire né costi anticipati e non ti verranno addebitati i tempi di avviamento o spegnimento dei cluster transitori. Puoi accumulare un’ora di crediti per cluster Concurrency Scaling ogni 24 ore durante l’esecuzione del proprio cluster. Ti verrà addebitata solo la tariffa on demand al secondo per un cluster Concurrency Scaling che eccede i crediti gratuiti (solo quando il cluster esegue le tue query) con un addebito minimo di un minuto per ciascuna volta in cui un cluster Concurrency Scaling viene attivato. La tariffa on demand al secondo si basa sul tipo e sul numero di nodi all'interno del cluster di Amazon Redshift.

Amazon Redshift Serverless dimensiona automaticamente le risorse per rispondere alle necessità del carico di lavoro di default e non sono previsti costi a parte per il Dimensionamento simultaneo.

Crediti del dimensionamento simultaneo

I cluster di Redshift accumulano fino a un’ora di crediti gratis di Concurrency Scaling al giorno. I crediti si guadagnano su base oraria per ogni cluster attivo nell'account AWS e possono essere consumati dallo stesso cluster solo dopo l'acquisizione. Puoi accumulare fino a 30 ora di crediti del Dimensionamento della concorrenza per ciascun cluster attivo. I crediti non hanno una scadenza, a meno che non venga terminato il proprio cluster.

Esempi di prezzi del Dimensionamento della concorrenza

Un cluster Redshift con 10 nodi DC2.8XL negli Stati Uniti orientali costa 48 USD all’ora. Supponiamo uno scenario in cui due cluster transitori vengono utilizzati per cinque minuti in più rispetto ai crediti gratis di Concurrency Scaling. La tariffa on demand al secondo per Concurrency Scaling è pari a 48 USD x 1/3600 = 0,013 USD al secondo. Il costo aggiuntivo per Concurrency Scaling in questo caso è pari a 0,013 USD al secondo x 300 secondi x 2 cluster transitori = 8 USD. Quindi, in questo caso, il costo totale del cluster di Amazon Redshift e i due cluster transitori è pari a 56 USD.

Prezzi di Redshift ML

Quando inizi a utilizzare Redshift ML, potrai iniziare a usufruire del livello gratuito di Amazon SageMaker (se non lo hai utilizzato in precedenza). Questo livello include due richieste CREATE MODEL gratuite al mese per due mesi con un massimo di 100.000 celle per richiesta. Il piano gratuito si attiva il primo giorno del mese in cui crei il tuo primo modello in Redshift ML.

Costi di Amazon S3
La richiesta CREATE MODEL comporta anche piccoli addebiti per Amazon S3. I costi di S3 dovrebbero essere inferiori a 1 USD al mese in quanto la quantità di dati S3 generati da CREATE MODEL è dell’ordine di pochi GB. Quando la garbage collection (GC) è attiva, vengono rapidamente rimossi. Amazon S3 è utilizzato per prima cosa per archiviare i dati di formazione prodotti dalla query SELECT della richiesta CREATE MODEL. Quindi è utilizzato per archiviare diversi manufatti correlati al modello necessari per la previsione. La modalità di garbage collection (GC) di default rimuoverà sia i dati di formazione che gli artefatti correlati al modello alla fine della richiesta CREATE MODEL.

Opzioni di controllo dei costi
Puoi controllare il costo della formazione impostando il parametro MAX_CELLS. In caso contrario, il valore di default di MAX_CELLS è 1 milione, il che nella stragrande maggioranza dei casi manterrà il costo della formazione inferiore a 20 USD. Se il set di dati di formazione è superiore a 1 milione, il costo aumenta come segue:

Numero di celle Prezzo

Primi 10 milioni di celle

20 USD per milione di celle

Successivi 90 milioni di celle

15 USD per milione di celle

Oltre 100 milioni di celle

7 USD per milione di celle

 

Nota: il prezzo reale sarà spesso inferiore ai limiti massimi specificati sopra. 

Esempi di costo della richiesta CREATE MODEL:

  • 100.000 celle costano 20 USD (= 1 x 20)
  • 2.000.000 celle costano 40 USD (= 2 x 20)
  • 23.000.000 celle costano 395 USD (= 10 x 20 + 13 x 15)
  • 99.000.000 celle costano 1.535 USD (= 10 x 20 + 89 x 15) e 
  • 211.000.000 celle costano 2.327 USD (= 10 x 20 + 90 x 15 + 111 x 7)

Se i dati di formazione prodotti dalla query SELECT della richiesta CREATE MODEL superano il limite MAX_CELLS fornito (o il milione di default, nel caso in cui non ne avessi fornito uno), CREATE MODEL sceglierà in modo casuale approssimativamente MAX_CELLS/"numero di colonne" del registro dal set di dati di formazione e si formerà utilizzando queste tuple scelte casualmente. La scelta casuale è progettata per evitare che il set di dati di formazione ridotto abbia una polarizzazione. Pertanto, impostando MAX_CELLS potrai mantenere i costi entro i limiti.

Prezzi delle istanze riservate

Le istanze riservate sono ideali per carichi di lavoro in ambienti di produzione a stato costante, poiché i costi sono di gran lunga inferiori rispetto ai prezzi on demand dei tipi di nodi Amazon Redshift. Spesso i nostri clienti acquistano istanze riservate dopo qualche prova e proof of concept, vale a dire nel momento in cui hanno trovato una configurazione di produzione adatta a loro.

È possibile ottenere risparmi significativi rispetto alle tariffe on demand, impegnandosi a utilizzare Amazon Redshift per un termine di uno o tre anni. I prezzi delle istanze riservate sono associati al tipo di nodo acquistato e rimangono validi fino al termine della prenotazione. I prezzi includono due copie aggiuntive dei dati, una nei nodi del cluster e una in Amazon S3. Le attività di backup, durabilità, disponibilità, sicurezza, monitoraggio e gestione vengono eseguite automaticamente.

Vi sono tre opzioni di prezzo per le istanze riservate:

Nessun pagamento anticipato – Non è previsto alcun pagamento anticipato e viene addebitata la tariffa mensile per la durata di un anno.

Pagamento anticipato parziale – Viene addebitata una parte di pagamento anticipato dell'istanza riservata; la rimanente parte è distribuita per la durata del termine, ovvero uno o tre anni.

Pagamento anticipato – L'utilizzo dell'istanza riservata (per un termine di 1 o 3 anni) viene pagato interamente in anticipo.

Il concetto di "istanze riservate" è utilizzato esclusivamente a scopo di fatturazione e non per creare cluster di data warehouse. Quando si procede all’acquisto, saranno addebitati i costi correlati a pagamento anticipato e tariffa mensile, anche se in quel momento non è in esecuzione alcun cluster o se un cluster esistente è in pausa. Per acquistare istanze riservate, apri la scheda Nodi riservati nella Console Redshift.

Il programma dei prezzi per le istanze riservate può essere terminato in qualsiasi momento. Oltre a essere soggetti ai prezzi delle istanze riservate, queste istanze sono anche soggette a tutte le tariffe del trasferimento dati e ad altre tariffe previste dal Contratto con il cliente AWS o altri contratti con AWS che governano l'utilizzo dei servizi.

* Pagamento mensile medio per tutta la durata del termine dell'istanza riservata. Il pagamento mensile equivale al numero effettivo di ore del mese specifico, moltiplicato per la tariffa oraria di utilizzo o il numero di secondi in quel mese moltiplicato per la tariffa oraria di utilizzo divisa per 3600, a seconda del tipo di istanza Redshift eseguita. La tariffa oraria di utilizzo è pari alla media totale dei pagamenti mensili per il periodo dell'istanza riservata divisa per il numero totale di ore (calcolato su un anno di 365 giorni) per il periodo dell'istanza riservata.

** I prezzi orari effettivi aiutano a calcolare l'importo che un'istanza riservata farà risparmiare rispetto ai prezzi on demand. Quando si acquista un'istanza riservata, viene fatturata ogni ora per tutta la durata del periodo selezionato per l'istanza riservata, indipendentemente dal fatto che questa sia in esecuzione o meno. Il prezzo orario effettivo mostra il costo orario ammortizzato dell'istanza. Questo include il costo totale dell'Istanza riservata per l'intero periodo, incluso qualsiasi pagamento anticipato, e lo distribuisce su ogni ora del periodo dell'Istanza riservata.

*** Per le istanze riservate, invece, è necessario sommare il pagamento anticipato e la tariffa oraria moltiplicata per il numero di ore incluse nei termini, diviso il numero di anni previsti dal contratto e il numero di TB per nodo. Per RA3, i dati archiviati nell'archiviazione gestita vengono fatturati separatamente sulla base di quelli effettivamente archiviati su questo tipo di nodo; il prezzo effettivo annuale per TB viene calcolato solo per i costi del nodo di calcolo.

Costi dell'integrazione Zero-ETL

Amazon Redshift ha integrazioni Zero-ETL con database di elaborazione delle transazioni online (OLTP) e applicazioni aziendali, eliminando la necessità di creare e gestire pipeline di estrazione, trasformazione e caricamento (ETL). Tra i database supportati ci sono Amazon Aurora, Amazon DynamoDB e Amazon Relational Database Service (Amazon RDS) per MySQL. Le applicazioni aziendali supportate includono Salesforce, ServiceNow, Zendesk e altre ancora.

Queste integrazioni offrono flessibilità, permettendo di scegliere tabelle di dati specifiche in un database o un'applicazione aziendale da replicare automaticamente su Amazon Redshift. Questa flessibilità consente di eseguire analisi unificate su più applicazioni e origini dati. AWS non addebita costi aggiuntivi per l'integrazione Zero-ETL. Si paga per le risorse esistenti utilizzate per creare ed elaborare i dati di modifica creati come parte di un'integrazione Zero-ETL. Sono inclusi spazio di archiviazione aggiuntivo di Amazon Redshift per l'archiviazione dei dati replicati, risorse di calcolo per l'elaborazione della replica dei dati (o RPU su Amazon Redshift serverless) e i costi di trasferimento dati tra zone di disponibilità per lo spostamento dei dati dall'origine alla destinazione. L'elaborazione continua delle modifiche dei dati tramite l'integrazione Zero-ETL viene offerta senza costi aggiuntivi. Per ulteriori informazioni, visita le pagine dei prezzi di Aurora, Amazon RDS per MySQL, DynamoDB e AWS Glue.

Archiviazione di backup

Lo storage di backup è lo spazio di archiviazione associato agli snapshot per il data warehouse. Estendendo il tempo di conservazione del backup o effettuando ulteriori snapshot, si aumenta l’archiviazione di backup consumato dal data warehouse. Amazon Redshift addebita gli snapshot manuali eseguiti utilizzando la console, l'interfaccia di programmazione dell'applicazione (API) o l'interfaccia della riga di comando (CLI). Gli snapshot automatizzati Redshift, predefiniti e creati dalla funzionalità di pianificazione snapshot di Amazon Redshift, non vengono addebitati e possono essere mantenuti per un massimo di 35 giorni. Non vengono addebitati i punti di ripristino Amazon Redshift serverless che risalgono a meno di 24 ore. Se scegli di mantenere i punti di ripristino oltre 24 ore, verranno addebitati come parte di RMS. I dati archiviati nei cluster RA3 rientrano in RMS e vengono fatturati secondo le tariffe di RMS, ma gli snapshot manuali presi per i cluster RA3 vengono fatturati come archiviazione di backup in base alle tariffe standard di Amazon S3, come specificato in questa pagina.

Ad esempio, se il tuo cluster RA3 ha 10 TB di dati e 30 TB di snapshot manuali, ti verrebbero fatturati 10 TB di RMS e 30 TB di archiviazione di backup. Con i cluster di calcolo denso (DC, dense compute) e archiviazione densa (DS, dense storage), l’archiviazione è inclusa nel cluster e non viene fatturata a parte, ma i backup sono archiviati esternamente in Amazon S3. L’archiviazione di backup che supera le dimensioni assegnate nei cluster DC e DS è fatturata come archiviazione di backup secondo le tariffe standard di S3. Gli snapshot sono fatturati fino alla scadenza o all’eliminazione, anche quando il cluster viene messo in pausa o cancellato.

Trasferimento dati

Non sono previsti costi aggiuntivi per il trasferimento di dati tra Amazon Redshift a Amazon S3 all'interno della stessa Regione AWS per operazioni di backup, ripristino, caricamento e scaricamento. Per altri tipi di trasferimento di dati da e verso Amazon Redshift, vengono addebitate le tariffe standard di AWS per il trasferimento di dati. In particolare, se un cluster Amazon Redshift viene eseguito in Amazon Virtual Cloud (VPC), saranno addebitati i costi standard di AWS per il trasferimento di dati tramite JDBC/ODBC verso l'endpoint cluster di Amazon Redshift. Inoltre, quando è in uso la funzionalità Enhanced VPC Routing e i dati vengono scaricati in Amazon S3 in una regione differente, saranno addebitati i costi standard di AWS per il trasferimento dei dati. Per ulteriori informazioni sulle tariffe per il trasferimento dei dati di AWS, consulta la pagina dei prezzi di Elastic Cloud Compute (Amazon EC2).

Amazon Redshift addebita la condivisione di dati tra regioni e la copia degli snapshot tra regioni. I costi di condivisione dei dati vengono addebitati nella regione del cliente in cui viene effettuato l'accesso ai dati. La copia degli snapshot tra regioni viene fatturata nella regione di origine in cui si trova il cluster che ha creato lo snapshot. I costi di trasferimento dei dati si applicano a tutti gli snapshot (sia automatici che manuali) e ai punti di ripristino. Tutti i costi di trasferimento dei dati per copia di snapshot si riferiscono solo ai dati incrementali.

Condivisione di dati e trasferimento di dati IN INGRESSO da o copia snapshot e trasferimento di dati IN USCITA da

Esempi di prezzi

Esempio per RMS

Utilizzi quattro nodi ra3.xlarge e 40 TB di RMS per un mese. Durante il mese, esegui anche la scansione di 20 TB di dati utilizzando Redshift Spectrum ed esegui la scansione di 20 TB di dati. Usi prezzi on demand.

I costi vengono calcolati come segue:

  • Costo dell'istanza Redshift RA3 = 4 istanze x 3,26 USD all'ora x 730 ore in un mese = 9.519,20 USD
  • Costo RMS = 40 TB x 1.024 GB a TB x 0,024 USD = 983,04 USD
  • Costo di Redshift Spectrum = 20 TB x 5,00 USD = 100,00 USD

Costo mensile totale: 10.602,24 USD

Esempio per multi-AZ

Utilizzi un cluster multi-AZ implementato contemporaneamente in due AZ. Il tuo cluster dispone di quattro nodi ra3.4xlarge per AZ e utilizzi 40 TB di RMS per un mese. Utilizzi i prezzi on demand.

I costi vengono calcolati come segue:

  • Costo dell'istanza Redshift RA3 per AZ1 = 4 istanze x 3,26 USD all'ora x 730 ore in un mese = 9.519,20 USD
  • Costo dell'istanza Redshift RA3 per AZ2 = 4 istanze x 3,26 USD all'ora x 730 ore in un mese = 9.519,20 USD
  • Costo RMS = 40 TB x 1.024 GB a TB x 0,024 USD = 983,04 USD

Costo mensile totale: 20.021,44 USD

Esempio per Amazon Redshift serverless
Questo esempio mostra come funziona l'addebito di Amazon Redshift con la modalità di capacità on demand per l'opzione serverless.
Esempio di base

Ipotizziamo di avere un processo di elaborazione dei dati che deve essere eseguito ogni ora dalle 7 alle 19 su un data warehouse Amazon Redshift nella regione Stati Uniti orientali (Virginia settentrionale). Per semplicità, consideriamo che ogni esecuzione del processo duri lo stesso tempo, ovvero 10 minuti e 30 secondi. Ipotizziamo inoltre che Amazon Redshift utilizzi 128 RPU di capacità per eseguire il processo.

La tabella seguente riepiloga l'utilizzo totale per un giorno.

Periodo di query

Il processo viene eseguito 13 volte tra le 7 e le 19 e ogni volta dura 10 minuti e 30 secondi = 136 minuti e 30 secondi = 8190 secondi

Capacità usata

128 RPU

Costi giornalieri

109,20 USD ((8190 x 128 RPU x 0,375 USD per RPU-ora) /3600) 

Esempio con configurazione base e dimensionamento automatico

Ipotizziamo di avere un'applicazione di dashboarding su un data warehouse Amazon Redshift nella regione Stati Uniti orientali (Virginia settentrionale). L'applicazione viene utilizzata da molti utenti nell'organizzazione (come analisti, sviluppatori e data scientist) e ha dei periodi di picco e dei periodi più tranquilli durante la giornata. Nello specifico, il picco più alto di attività si verifica la mattina tra le 9 e le 11 e il pomeriggio dalle 14 alle 16, quando la maggior parte degli utenti realizza le attività di analisi e accesso ai dati dal data warehouse. Ipotizziamo che l'applicazione abbia quattro intervalli di 15 minuti dalle 11 alle 14 in cui non si registra attività da parte degli utenti. L'altro intervallo con minore attività è quello tra le 22 e le 5.

Guardiamo ora l'utilizzo delle risorse sul data warehouse di Amazon Redshift. Ipotizziamo che, per avere maggiore controllo sui prezzi, dobbiamo impostare espressamente la configurazione Base di Amazon Redshift Serverless con 64 RPU. Consideriamo anche che, durante il picco della mattina e del pomeriggio, Amazon Redshift effettui un dimensionamento automatico e utilizzi rispettivamente una capacità totale di 192 RPU e 128 RPU.

La tabella seguente riepiloga l'utilizzo totale per un giorno.

Periodo di tempo

Periodo di esecuzione delle query totale

5 – 9

64 RPU per 4 ore = 64 x 4= 256 RPU-ore

9 – 11

192 RPU per 2 ore = 384 RPU-ore

11 - 14

Escludendo i quattro intervalli di 15 minuti di inattività, il tempo totale è di 2 ore.

64 RPU per 2 ore = 64 x 2= 128 RPU-ore

14 – 15

128 RPU per 1 ora = 128 RPU-ore

15 – 22

64 RPU per 7 ore = 64 x 7= 448 RPU-ore

22 – 5

Nessuna attività

Costi giornalieri

504 USD ((256+384+128+128+448) x 0,375 USD per RPU-ora) 

Esempio di dimensionamento simultaneo per Amazon Redshift

Un cluster Redshift con 10 nodi DC2.8XL negli Stati Uniti orientali costa 48 USD all’ora. Supponiamo uno scenario in cui due cluster transitori vengono utilizzati per cinque minuti in più rispetto ai crediti gratis di Concurrency Scaling. La tariffa on demand al secondo per Concurrency Scaling è pari a 48 USD x 1/3600 = 0,013 USD al secondo. Il costo aggiuntivo per Concurrency Scaling in questo caso è pari a 0,013 USD al secondo x 300 secondi x 2 cluster transitori = 8 USD. Quindi, in questo caso, il costo totale del cluster di Redshift e i due cluster transitori è pari a 56 USD.

Esempi per Amazon Redshift Spectrum

Supponiamo di avere una tabella con 100 colonne di pari volume memorizzata in Amazon S3 in formato non compresso, per un volume totale di 4 TB. Per eseguire una query su una singola colonna della tabella, Redshift Spectrum dovrà scansionare l'intero file, perché i formati di testo non possono essere divisi. In base ai prezzi di Redshift Spectrum per gli Stati Uniti orientali (Virginia settentrionale), questa query scansionerebbe 4 TB e costerebbe 20 USD.(5,00 USD/TB x 4 TB = 20 USD)

Se comprimi il file con GZIP, il rapporto di compressione può essere di una proporzione di 4:1. In questo caso, la scansione sarebbe solo su un file di 1 TB. Redshift Spectrum dovrà scansionare l'intero file, ma siccome le dimensioni sono ridotte a un quarto, il costo sarà ugualmente inferiore: 5 USD. (5 USD/TB x 1 TB = 5 USD)

Se oltre a comprimere il file, si convertisse in un formato a colonne come Apache Parquet, si sfrutterebbe il rapporto di compressione 4:1, perciò le dimensioni del file sarebbero ridotte a 1 TB. Applicando la stessa query, Redshift Spectrum dovrebbe però scansionare solo una colonna del file Parquet. Il costo di questa query sarebbe pari a 0,05 USD. (5 USD/TB x dimensione di file di 1 TB x 1 colonna su 100 o un totale di 10 GB scansionati = 0,05 USD).

Nota: gli esempi di prezzi di cui sopra sono solo a scopo illustrativo. Il rapporto di compressione di file e colonne differenti potrebbe variare.

Risorse aggiuntive sui prezzi

Calcolatore di prezzi di AWS

Calcola facilmente le spese mensili con AWS

Ottieni assistenza sui prezzi

Contatta gli specialisti AWS per ricevere un preventivo personalizzato

Trova altre risorse per Amazon Redshift

Visita la pagina delle risorse
Ti senti pronto?
Nozioni di base su Amazon Redshift
Hai altre domande?
Contattaci