Amazon Redshift estende le query di data warehouse al tuo data lake senza caricamento. Puoi eseguire query analitiche su petabyte di dati archiviati localmente in Redshift e direttamente su exabyte di dati archiviati in Amazon S3. È facile da configurare, automatizza la maggior parte delle attività amministrative e fornisce prestazioni ottimizzate su qualsiasi scala.

Caratteristiche principali

Prestazioni più veloci

Elaborazione parallela su larga scala: Amazon Redshift fornisce una rapida elaborazione di query su gruppi di dati di qualsiasi ordine di grandezza, dai gigabyte agli exabyte. Per ridurre la quantità di I/O necessari per elaborare le query, Redshift impiega storage basato su colonne, compressione dei dati e mappature di zona. Inoltre l'architettura MPP (Massively Parallel Processing, elaborazione parallela di massa) del suo data warehouse consente di caricare in parallelo e distribuire le operazioni SQL, in modo da sfruttare al massimo tutte le risorse disponibili. L'hardware utilizzato è stato progettato per fornire prestazioni di alto livello in elaborazione dei dati: si serve di storage locali per ottimizzare il throughput tra CPU e unità e di reti mesh con elevata larghezza di banda per ottimizzare il throughput tra nodi.

Apprendimento automatico: Amazon Redshift usa l'apprendimento automatico per fornire throughput elevato in base ai carichi di lavoro. Redshift utilizza algoritmi complessi per prevedere i tempi di esecuzione delle query in arrivo e le assegna alla coda ottimale per un'elaborazione più rapida. Ad esempio, le query quali pannelli di controllo e report con requisiti di simultaneità elevati sono instradate verso una coda rapida per l’elaborazione immediata.

Memorizzazione dei risultati nella cache: Amazon Redshift memorizza nella cache i risultati per fornire tempi di risposta inferiori al secondo per le query ripetute. Gli strumenti di pannello di controllo, visualizzazione e business intelligence che eseguono query ripetute presentano un incremento notevole delle prestazioni. Quando una query è in esecuzione, Redshift effettua ricerche nella cache per verificare l'eventuale presenza del risultato memorizzato di una query precedente. Se trova un risultato nella cache e i dati non sono cambiati, tale risultato viene restituito immediatamente invece di rieseguire la query.

Facile da configurare, distribuire e gestire

Provisioning automatizzato: Amazon Redshift è facile da configurare e utilizzare. Puoi distribuire un nuovo data warehouse con pochi clic sulla Console di gestione AWS e Redshift effettua automaticamente il provisioning dell'infrastruttura al posto tuo. Molte attività amministrative sono automatizzate, come i backup e la replica, e ti consentono di concentrarti suoi tuoi dati e non sull'amministrazione. Quando vuoi avere il controllo, Redshift offre opzioni per aiutarti a effettuare modifiche ottimizzate per carichi di lavoro specifici. Le nuove funzionalità vengono rilasciate in modo trasparente, eliminando la necessità di pianificare e applicare aggiornamenti e patch.

Backup automatici: Amazon Redshift esegue il backup automatico e continuo dei nuovi dati in Amazon S3. Amazon Redshift è in grado di replicare gli snapshot in modo asincrono su Amazon S3 in una regione differente, a scopo di disaster recovery. È possibile utilizzare snapshot di sistema o creati manualmente per ripristinare un cluster mediante la Console di gestione AWS oppure le API di Redshift. Il cluster è disponibile non appena viene completato il ripristino dei metadati del sistema ed è possibile avviare query mentre ancora viene eseguito lo spool dei dati in background.

Tolleranza ai guasti: Amazon Redshift dispone di numerose funzionalità che rafforzano l'affidabilità del cluster del data warehouse. Redshift monitora inoltre senza soluzione di continuità l'integrità del cluster, replicando una seconda volta i dati provenienti da unità con errori e procedendo, quando necessario, alla sostituzione dei nodi per la tolleranza ai guasti.

Integrazione con strumenti di terza parte: potenzia le funzioni di Amazon Redshift utilizzando strumenti leader del settore ed esperti, per caricare, trasformare e visualizzare tutti i tuoi dati. I nostri numerosi partner hanno certificato le loro soluzioni per lavorare con Amazon Redshift.  

Costi contenuti

Niente anticipi, paga a consumo: Amazon Redshift è il data warehouse più conveniente e paghi solo per le risorse di cui è stato effettuato il provisioning. Si può iniziare con poco a soli 0,25 USD l'ora senza impegni, e crescere fino a 250 USD per terabyte l'anno. Redshift è il solo data warehouse nel cloud che offre prezzi on demand senza investimenti anticipati, prezzi di istanza riservata che possono farti risparmiare più del 75% con un impegno di 1 o 3 anni e un prezzo in base alle query sulla quantità di dati analizzati nel tuo data lake Amazon S3.  Per ulteriori informazioni, ti invitiamo a consultare la pagina dei prezzi di Amazon Redshift.

Scegli il tipo di nodo: puoi scegliere fra due tipi di nodi per ottimizzare Redshift per le tue necessità di data warehousing. Con i nodi Dense Compute (DC) si creano data warehouse ad alte prestazioni composti di dischi allo stato solido (SSD), CPU performanti ed elevate quantità di RAM. Se vuoi ricalibrare ulteriormente o ridurre i costi, puoi passare ai nostri nodi di tipo Dense Storage (DS) che usano unità disco più grandi per un rapporto di prezzo molto basso. Ridimensionare il cluster o passare da un tipo di nodo all'altro non richiede più di una singola chiamata API o di qualche clic nella Console AWS.

Scalabilità rapida per soddisfare le tue esigenze

Data warehousing con capacità nell'ordine dei petabyte: Amazon Redshift è semplice e ricalibra velocemente secondo le tue esigenze. Sono sufficienti pochi clic nella console o una semplice chiamata API per modificare il numero o il tipo di nodi nel data warehouse e ricalibrare secondo le tue esigenze.

Analisi del data lake con capacità nell'ordine degli exabyte: Redshift Spectrum, una funzionalità di Redshift, consente di eseguire query su exabyte di dati in Amazon S3 senza dover caricare o trasformare i dati. Puoi usare S3 come un data lake altamente disponibile, sicuro e conveniente per archiviare quantità illimitate di dati in formati di dati aperti.

Esecuzione simultanea illimitata: Redshift Spectrum fornisce esecuzione simultanea illimitata consentendo a più query di accedere simultaneamente agli stessi dati in Amazon S3. Redshift Spectrum esegue query su migliaia di nodi paralleli distribuendo risultati rapidi, indipendentemente dalla complessità della query o dalla quantità di dati.

Interroga il tuo data lake

Data lake Amazon S3: Amazon Redshift è l'unico data warehouse che porta le query al tuo data lake Amazon S3 senza caricare dati. Puoi eseguire query su formati di file aperti che usi già, quali Avro, CSV, Grok, JSON, ORC, Parquet e altri, direttamente in S3. Questo ti dà la possibilità di memorizzare dati altamente strutturati e con accessi frequenti in dischi locali di Redshift, conservare exabyte di dati strutturati e non in S3 ed eseguire facilmente query su entrambi per ottenere informazioni uniche che non potresti altrimenti ottenere eseguendo query su gruppi di dati indipendenti.

Ecosistema di analisi di AWS: Amazon Redshift è integrato nativamente con l'ecosistema di analisi AWS. AWS Glue può estrarre, trasformare e caricare dati (ETL) in Redshift. Amazon Kinesis Data Firehose è il modo più semplice per acquisire, trasformare e caricare flussi di dati in Redshift per analisi in tempo quasi reale. Puoi usare Amazon QuickSight per creare report, visualizzazioni e pannelli di controllo.  Per accelerare la migrazione ad Amazon Redshift, puoi usare AWS Database Migration Service (DMS) gratuitamente per sei mesi. Ulteriori informazioni »

Sicurezza

Crittografia completa: configurando alcune semplici impostazioni, Amazon Redshift può applicare il protocollo SSL per proteggere i dati in transito e il protocollo di crittografia AES a 256 bit per i dati su disco. Se si sceglie di abilitare la crittografia dei dati su disco, tutti i dati scritti sulle unità saranno crittografati, inclusi i backup. Come impostazione predefinita, Amazon Redshift si occupa della gestione delle chiavi.

Isolamento di rete: Amazon Redshift consente di configurare le regole del firewall in modo da controllare gli accessi al cluster del data warehouse. Amazon Redshift può essere eseguito all'interno di Amazon VPC in modo da isolare il cluster del data warehouse in una rete virtuale a sé stante e collegarlo all'infrastruttura IT esistente tramite VPN IPsec con crittografia standard di settore.

Audit e conformità: Amazon Redshift si integra con AWS CloudTrail per creare audit di tutte le chiamate API di Redshift. Inoltre registra tutte le operazioni SQL, inclusi i tentativi di connessione, le query e le modifiche ai database. Per accedere a questi log è possibile utilizzare query SQL su tabelle di sistema oppure scaricarle in un percorso sicuro su Amazon S3. Amazon Redshift è conforme ai requisiti di controllo SOC1, SOC2, SOC3 e PCI DSS Level 1. Per ulteriori informazioni, consulta Conformità di sicurezza nel cloud AWS.

Ulteriori informazioni sui prezzi di Amazon Glacier

Visita la pagina dei prezzi
Ti senti pronto?
Nozioni di base su Amazon Redshift
Hai altre domande?
Contattaci