Domande sulle nozioni di base di Amazon Redshift? Entra in contatto con un esperto AWS
Amazon Redshift accelera il tempo per ottenere informazioni dettagliate con un data warehouse nel cloud veloce, facile e sicuro su larga scala.
Caratteristiche e vantaggi
Ogni anno rilasciamo centinaia di funzionalità e migliorie per prodotti sulla base dei casi d’uso e i feedback dei nostri clienti. Scopri di più su tutte le novità.
Analizza tutti i tuoi dati
Ottieni informazioni dettagliate integrate eseguendo analisi dei dati in tempo reale e predittive su dati complessi e dimensionati attraverso i tuoi database operativi, data lake, data warehouse e migliaia di set di dati di terze parti.
Query federate: con la nuova funzionalità per query federate in Amazon Redshift, puoi raggiungere il tuo database relazionale e operativo. Esegui query sui dati in tempo reale tra uno o più database Amazon Relational Database Service (RDS), Aurora PostgreSQL, RDS MySQL e Aurora MySQL per ottenere una visibilità istantanea nelle operazioni aziendali complete senza dover spostare i dati. Puoi anche unire i dati dal tuo data warehouse Redshift, i dati nel tuo data lake e i dati nei tuoi spazi di archiviazione operativi così da poter prendere decisioni migliori. Amazon Redshift offre funzionalità di ottimizzazione per ridurre lo spostamento di dati nella rete, potenziandoli tramite le enormi capacità di elaborazione dei dati in parallelo per eseguire query a prestazioni elevate. Ulteriori informazioni.
Condivisione dei dati: la condivisione di dati in Amazon Redshift permette di ottenere maggiori prestazioni, facilità d'utilizzo e vantaggi economici di Amazon Redshift in un singolo cluster per implementazioni a cluster multipli permettendo al contempo la condivisione di dati. La condivisione di dati consente l'accesso istantaneo, granulare e rapido ai dati tra i cluster Redshift senza il bisogno di copiarli o spostarli. La condivisione di dati fornisce accesso in diretta ai dati permettendo agli utenti la visualizzazione di informazioni sempre aggiornate e coerenti grazie all'aggiornamento delle stesse nel data warehouse. È possibile condividere dati in diretta in sicurezza con i cluster Redshift negli stessi o in diversi account AWS e tra più regioni. Ulteriori informazioni.
Scambio dati AWS per Amazon Redshift: esegui query sui set di dati di Amazon Redshift dal tuo cluster Redshift senza necessità di estrazione, trasformazione e caricamento (ETL) dei dati. Puoi iscriverti ai prodotti di data warehouse del cloud Redshift in Scambio dati AWS. Non appena un provider esegue un aggiornamento, la modifica è visibile agli iscritti. Se sei un fornitore di dati, l'accesso viene concesso automaticamente all'inizio dell'iscrizione e viene revocato quando finisce, le fatture vengono generate automaticamente alla scadenza del pagamento e i pagamenti sono raccolti tramite AWS. Puoi concedere l'accesso in licenza a file flat, dati in Amazon Redshift e dati forniti tramite API, il tutto con un'unica iscrizione. Ulteriori informazioni.
Redshift ML: Redshift ML permette ad analisti di dati, data scientist, professionisti di BI e sviluppatori di database di creare, addestrare e distribuire facilmente i modelli di Amazon SageMaker utilizzando SQL. Con Redshift ML, puoi utilizzare le istruzioni SQL per creare e addestrare i modelli di Amazon SageMaker sui tuoi dati in Amazon Redshift e quindi utilizzare tali modelli per generare stime come il rilevamento del tasso di abbandono, le previsioni finanziarie, la personalizzazione e il punteggio di rischio direttamente nelle loro query e nei tuoi report. Ulteriori informazioni.
Integrazione di Amazon Redshift per Apache Spark: questa funzionalità permette di creare ed eseguire facilmente applicazioni Apache Spark sui dati Amazon Redshift, permettendo ai clienti di aprire i data warehouse a un set più ampio di soluzioni di analisi e machine learning. Con l'integrazione di Amazon Redshift per Apache Spark, gli sviluppatori che utilizzano servizi di analisi e ML di AWS come Amazon EMR, AWS Glue, Amazon Athena e Amazon SageMaker possono iniziare a lavorare in pochi secondi e creare senza sforzo applicazioni Apache Spark per lettura e scrittura di data warehouse Amazon Redshift senza compromettere le prestazioni delle applicazioni o la coerenza transazionale dei dati. L'integrazione di Amazon Redshift per Apache Spark permette anche di monitorare i problemi delle prestazioni delle applicazioni Apache Spark e risolverli più facilmente durante l'utilizzo con Amazon Redshift.
Zero-ETL di Amazon Aurora in Amazon Redshift: si tratta di un'integrazione senza codice tra Amazon Aurora e Amazon Redshift che permette ai clienti di Amazon Aurora di utilizzare Amazon Redshift per analisi e machine learning quasi in tempo reale su petabyte di dati transazionali. Pochi secondi dopo la scrittura dei dati transazionali in Amazon Aurora, Zero-ETL di Amazon Aurora in Amazon Redshift rende i dati disponibili in Amazon Redshift, evitando ai clienti di dover creare e mantenere pipeline di dati complesse che eseguono operazioni di estrazione, trasformazione e caricamento (ETL). Questa integrazione riduce il carico operativo e i costi, permettendo ai clienti di concentrarsi sul miglioramento delle applicazioni. Grazie all'accesso quasi in tempo reale ai dati transazionali, i clienti possono sfruttare le funzionalità di analisi e machine learning di Amazon Redshift per ricavare informazioni dai dati transazionali e non solo e rispondere così in modo efficace agli eventi critici e urgenti.
Importazione dei dati di streaming: i data engineer, gli analisti dei dati e gli sviluppatori di big data utilizzando i motori di streaming in tempo reale per migliorare la reattività dei clienti. Con la nuova funzionalità di importazione dei dati di streaming in Amazon Redshift, puoi utilizzare SQL (Structured Query Language) per connetterti al flusso di dati Amazon Kinesis e Amazon Managed Streaming per Apache Kafka (MSK) e acquisire direttamente i dati. L'importazione dei dati di streaming di Amazon Redshift permette anche di creare e gestire facilmente le pipeline a valle consentendo di creare viste materializzate direttamente sui flussi. Le viste materializzate possono includere anche le trasformazioni SQL come parte della pipeline ELT (Extract Load Transform). Puoi aggiornare manualmente le viste materializzate definite per eseguire query sui dati di streaming più recenti. Questo approccio contente di eseguire elaborazioni e trasformazioni a valle dei dati di streaming utilizzando strumenti familiari esistenti senza costi aggiuntivi.
Esporta ed esegui query sui dati a partire da e verso il tuo data lake: nessun altro data warehouse in cloud semplifica le operazioni di esecuzione di query e di scrittura dei dati sul data lake in formati aperti. Puoi eseguire query per formati di file aperti quali Parquet, ORC, JSON, Avro, CSV e molti altri direttamente in Amazon S3 utilizzando il popolare protocollo ANSI SQL. Per esportare i dati sul tuo data lake, è sufficiente utilizzare semplicemente il comando UNLOAD di Amazon Redshift nel tuo codice SQL e specificare Parquet come formato di file: Amazon Redshift si occuperà automaticamente della formattazione e del trasferimento dei dati su S3. Ciò ti offre la flessibilità di archiviare dati altamente strutturati e a cui accedi frequentemente e dati semi-strutturati in un data warehouse di Amazon Redshift, mantenendo al contempo fino a exabyte di dati strutturati, semi-strutturati e non strutturati su Amazon S3. Esportare i dati da Amazon Redshift nel tuo data lake ti permette di analizzarli ulteriormente tramite altri servizi AWS quali Amazon Athena, Amazon EMR e Amazon SageMaker.
Integrazione con i servizi AWS: l'integrazione nativa con i servizi AWS, il database e i servizi di machine learning permette di gestire più facilmente flussi di lavoro di analisi completi senza intoppi. Ad esempio, AWS Lake Formation è un servizio che semplifica la creazione di un data lake sicuro in pochi giorni. AWS Glue può estrarre, trasformare e caricare dati (ETL) in Amazon Redshift. Amazon Kinesis Data Firehose è il modo più semplice per acquisire, trasformare e caricare flussi di dati in Amazon Redshift per analisi in tempo quasi reale. Puoi utilizzare Amazon EMR per elaborare i dati utilizzando Hadoop/Spark e caricare i risultati su Amazon Redshift per operazioni di business intelligence e analisi. Amazon QuickSight è il primo servizio di business intelligence con tariffe basate sulle sessioni di utilizzo, così che tu possa creare report, visualizzazioni e dashboard in merito ai dati archiviati in Redshift. Puoi utilizzare Amazon Redshift per preparare i tuoi dati per eseguire carichi di lavoro di machine learning (ML) con Amazon SageMaker. Per accelerare la migrazione ad Amazon Redshift, puoi usare l'AWS Schema Conversion Tool e AWS Database Migration Service (DMS). Amazon Redshift, inoltre, è altamente integrato con Amazon Key Management Service (KMS) e Amazon CloudWatch per permettere operazioni di sicurezza, monitoraggio e conformità. Puoi anche utilizzare le funzioni definite dall'utente (UDF) Lambda per invocare una funzione Lambda dalle query SQL come se stessi invocando un'UDF in Amazon Redshift. Puoi scrivere funzioni definite dall'utente Lambda per l'integrazione con i servizi dei partner AWS e per accedere ad altri servizi AWS diffusi come Amazon DynamoDB e Amazon SageMaker.
Integrazione della console partner: puoi accelerare l'onboarding dei dati e creare preziose informazioni aziendali dettagliate in pochi minuti attraverso l'integrazione con soluzioni di partner selezionati nella console Amazon Redshift. Con queste soluzioni puoi portare i dati di applicazioni come Salesforce, Google Analytics, Facebook Ads, Slack, Jira, Splunk e Marketo nel tuo data warehouse Redshift in modo semplice ed efficiente. Consente inoltre di unire questi diversi set di dati e di analizzarli insieme per produrre informazioni approfondite utili.
Copia automatica da Amazon S3: Amazon Redshift supporta la copia automatica per semplificare e automatizzare il caricamento dei dati da Amazon S3 riducendo tempo e sforzi per la creazione di soluzioni personalizzate o la gestione di servizi di terze parti. Con questa funzionalità, Amazon Redshift elimina la necessità di eseguire manualmente e ripetutamente le procedure di copia, automatizzando l'acquisizione dei file e gestendo le fasi di caricamento continuo dei dati dietro le quinte. Il supporto per la copia automatica permette agli utenti line-of-business e agli analisti dei dati senza conoscenze di ingegneria dei dati di creare facilmente regole di acquisizione e configurare la posizione dei dati che vogliono caricare da Amazon S3. Quando i nuovi dati arrivano nelle cartelle di Amazon S3 specificate, il processo di acquisizione si attiva automaticamente in base alla configurazione definita dall'utente. Tutti i formati dei file sono supportati dal comando Copy di Redshift, compresi CSV, JSON, Parquet e Avro.
Supporto nativo per analisi avanzata: Amazon Redshift supporta tipi di dati scalari standard come NUMBER, VARCHAR e DATETIME e fornisce supporto nativo per le seguenti elaborazioni analitiche avanzate:
- Elaborazione dei dati spaziali: Amazon Redshift fornisce un tipo di dati polimorfico, GEOMETRY, che supporta più forme geometriche quali punto, linea e poligono. Amazon Redshift fornisce inoltre funzioni spaziali SQL per creare forme geometriche, importare, esportare, accedere ed elaborare i dati spaziali. Puoi aggiungere le colonne GEOMETRY alle tabelle Redshift e scrivere query SQL che comprendono dati spaziali e non spaziali. Questa funzionalità ti consente di archiviare, recuperare ed elaborare i dati spaziali per poter potenziare in modo impeccabile gli insight aziendali integrando i dati spaziali nelle query analitiche. Con la capacità di Amazon Redshift di eseguire query in modo trasparente sui data lake, puoi anche estendere facilmente l'elaborazione spaziale ai data lake integrando le tabelle esterne nelle query spaziali. Consulta la documentazione per ulteriori dettagli.
- Schizzi HyperLogLog: HyperLogLog è un nuovo algoritmo che stima in modo efficiente il numero approssimativo di valori distinti in un set di dati. Uno schizzo HLL è un costrutto che incapsula le informazioni sui valori distinti nel set di dati. Puoi utilizzare gli schizzi HLL per ottenere vantaggi prestazionali significativi per le query che calcolano la cardinalità approssimativa su grandi set di dati, con un errore relativo medio compreso tra lo 0,01 e lo 0,6%. Amazon Redshift fornisce un tipo di dati HLLSKETCH superiore e le funzioni SQL associate per generare, mantenere e combinare gli schizzi HyperLogLog. La funzionalità HyperLogLog di Amazon Redshift utilizza tecniche di correzione del bias e fornisce un'elevata precisione con una capacità di memoria ridotta. Consulta la documentazione per ulteriori dettagli.
- Tipi di dati DATE e TIME: Amazon Redshift fornisce diversi tipi di dati DATE, TIME, TIMETZ, TIMESTAMP e TIMESTAMPTZ per archiviare ed elaborare in modo nativo i dati su data e ora. I tipi TIME e TIMESTAMP archiviano i dati sull'ora senza informazioni sul fuso orario, mentre i tipi TIMETZ e TIMESTAMPTZ archiviano i dati sull'ora comprendendo anche le informazioni sul fuso orario. Puoi utilizzare diverse funzioni SQL per data/ora per elaborare i valori di data e ora nelle query Redshift. Consulta la documentazione per ulteriori dettagli.
- Elaborazione di dati semi-strutturati: il tipo di dati SUPER di Amazon Redshift archivia in modo nativo i dati JSON o semi-strutturati nelle tabelle Redshift e utilizza il linguaggio di query PartiQL per elaborare perfettamente i dati semi-strutturati. Il tipo di dati SUPER è senza schema e consente l'archiviazione di valori nidificati che possono contenere valori scalari Redshift, array nidificati e strutture nidificate. PartiQL è un'estensione di SQL e fornisce potenti capacità di query come la navigazione di oggetti e array, la denidificazione di array, la digitazione dinamica e la semantica senza schema. Ciò consente di ottenere un'analisi avanzata che combina i classici dati SQL strutturati con i dati SUPER semi-strutturati con prestazioni, flessibilità e facilità d'uso superiori. Consulta la documentazione per ulteriori dettagli.
- Integrazione con strumenti di terze parti: vi sono molte opzioni per potenziare le funzioni di Amazon Redshift utilizzando strumenti leader del settore ed esperti per caricare, trasformare e visualizzare i dati. I nostri numerosi partner hanno certificato le loro soluzioni per lavorare con Amazon Redshift.
- Carica e trasforma i tuoi dati con i partner di integrazione dei dati.
- Analizza i dati e condividi le analisi in tutta l'azienda con i partner di business intelligence.
- Progetta e implementa una piattaforma di analisi dei dati con i partner di consulenza e di integrazione di sistemi.
- Inoltra query, esplora e crea modelli per i dati utilizzando utilità e strumenti dei partner di query e modellizzazione dei dati.
Prezzo/prestazioni su qualsiasi scala
Ottieni un rapporto prezzo/prestazioni fino a 5 volte migliore rispetto ad altri data warehouse su cloud con ottimizzazioni automatizzate per migliorare la velocità delle query.
Istanze RA3: le istanze RA3 offrono un rapporto prezzo/prestazioni 5 volte migliore rispetto a qualsiasi altro servizio di data warehouse su cloud. Tali istanze di Amazon Redshift massimizzano la velocità per carichi di lavoro ad elevate prestazioni che richiedono grandi quantità di capacità di calcolo, pur offrendo la flessibilità di pagare separatamente per le risorse di calcolo e le risorse di archiviazione specificando il numero di istanze necessarie. Ulteriori informazioni.
Elaborazione di query a elevate prestazioni e archiviazione efficiente: Amazon Redshift fornisce una rapida elaborazione di query su set di dati di qualsiasi ordine di grandezza, dai gigabyte ai petabyte. Per ridurre la quantità di I/O necessari per elaborare le query, Amazon Redshift impiega archiviazione basata su colonne, compressione dei dati e mappature di zona. Oltre alle codifiche standard del settore quali LZO e Zstandard, Amazon Redshift offre la codifica di compressione dedicata, AZ64, per tipi numerici e data/ora per permettere di risparmiare sull'archiviazione e di ottimizzare le prestazioni delle query.
Concorrenza illimitata: Amazon Redshift offre prestazioni veloci e costanti anche con migliaia di query in contemporanea, sia se si eseguono sui dati nel data warehouse di Redshift sia se si eseguono direttamente nel data lake di Amazon S3. Gestione carichi di lavoro concomitanti di Amazon Redshift supporta utenti simultanei virtualmente illimitati e query simultanee con livelli di servizio coerenti aggiungendo capacità transitoria in pochi secondi all'aumentare della concorrenza. Ulteriori informazioni.
Viste materializzate: le viste materializzate di Amazon Redshift permettono di ottenere prestazioni di query notevolmente più veloci per carichi di lavoro analitici iterativi o prevedibili come dashboarding e query da strumenti di business intelligence (BI) e processi di elaborazione di dati ELT (Extract, Load, Transform). È possibile utilizzare le viste materializzate per archiviare e gestire facilmente i risultati precalcolati di un'istruzione SELECT che fa riferimento a una o più tabelle, anche esterne. Le query successive che fanno riferimento alle viste materializzate possono essere eseguite più rapidamente riutilizzando i risultati pre-calcolati. Amazon Redshift può mantenere efficientemente le viste materializzate in modo incrementale, così da continuare a fornire prestazioni a bassa latenza. Ulteriori informazioni.
Viste materializzate automatiche: le organizzazioni stanno creando applicazioni, pannelli di controllo, report e query ad hoc maggiormente dipendenti dai dati. Ogni applicazione deve essere ottimizzata e questa operazione richiede tempo, risorse e denaro. Le viste materializzate sono degli strumenti efficaci per migliorare le prestazioni delle query e puoi configurarle se hai compreso ampiamente i carichi di lavoro. Tuttavia, potresti aver aumentato e modificato i carichi di lavoro in cui gli schemi delle query non sono prevedibili. Le viste materializzate automatiche migliorano la velocità di trasmissione effettiva delle query, diminuiscono la loro latenza, riducono il tempo di esecuzione tramite gli aggiornamenti automatici e incrementali, la riscrittura delle query e il monitoraggio costante i cluster di Amazon Redshift. Amazon Redshift bilancia la creazione e la gestione delle viste materializzate automatiche con un utilizzo minimo delle risorse. Ulteriori informazioni.
Machine learning per massimizzare la velocità di trasmissione effettiva e le prestazioni: le capacità di ML avanzate di Amazon Redshift offrono prestazioni e velocità di trasmissione effettiva elevate, anche con carichi di lavoro variabili o attività di utenti in parallelo. Amazon Redshift impiega algoritmi sofisticati per prevedere e classificare le query in entrata sulla base dei rispettivi tempi di esecuzione e requisiti di risorse per gestire in modo dinamico le prestazioni e la concorrenza, il tutto permettendo di dare priorità ai carichi di lavoro aziendali business critical. L’accelerazione di query brevi (SQA) invia query brevi dalle applicazioni quali pannelli di controllo per una coda rapida, così da permetterti di queste query immediatamente piuttosto che attendere che le query di maggiori dimensioni vengano completate. La gestione automatica dei carichi di lavoro (WLM) utilizza il ML per gestire in modo dinamico la memoria e la concorrenza, permettendoti di massimizzare la velocità effettiva delle query. Inoltre, puoi impostare in modo semplice la priorità delle tue query più importanti, anche quando vengono inviate centinaia di query. Amazon Redshift è anche un sistema di auto-apprendimento che osserva il carico di lavoro dell'utente in modo da determinare le opportunità per migliorare le prestazioni quando l'utilizzo aumenta, applicare ottimizzazioni in modo rapido e offrire suggerimenti attraverso Redshift Advisor quando è necessaria un'azione manuale da parte dell'utente per accelerare ulteriormente le prestazioni del servizio.
Memorizzazione dei risultati nella cache: Amazon Redshift memorizza nella cache i risultati per fornire tempi di risposta inferiori al secondo per le query ripetute. Gli strumenti di pannello di controllo, visualizzazione e business intelligence che eseguono query ripetute presentano un incremento notevole delle prestazioni. Quando una query è in esecuzione, Amazon Redshift effettua ricerche nella cache per verificare l'eventuale presenza del risultato memorizzato di una query precedente. Se trova un risultato nella cache e i dati non sono cambiati, tale risultato viene restituito immediatamente invece di rieseguire la query.
Data warehouse con scalabilità a livello di petabyte: sono sufficienti pochi clic nella console o una semplice chiamata API per modificare il numero o il tipo di nodi nel data warehouse e ricalibrare secondo le esigenze. Con l'archiviazione gestita, le capacità vengono aggiunte automaticamente per supportare carichi di lavoro fino a 8 PB di dati compressi. Puoi anche eseguire query su petabyte di dati in Amazon S3 senza dover caricare o trasformare alcun dato con la caratteristica Amazon Redshift Spectrum. Puoi usare S3 come un data lake altamente disponibile, sicuro e conveniente per archiviare quantità illimitate di dati in formati di dati aperti. Redshift Spectrum esegue query su migliaia di nodi paralleli distribuendo risultati rapidi, indipendentemente dalla complessità della query o dalla quantità di dati.
Opzioni di tariffazione flessibili: Amazon Redshift è il data warehouse più conveniente e permette di ottimizzare le modalità di pagamento. Si può iniziare con poco a soli 0,25 USD l'ora senza impegno e salire fino a 1.000 USD per terabyte l'anno. Amazon Redshift è il solo data warehouse nel cloud che offre prezzi on demand senza investimenti anticipati, prezzi di istanza riservata che possono farti risparmiare più del 75% con un impegno di uno o tre anni e un prezzo in base alle query sulla quantità di dati analizzati nel tuo data lake Amazon S3. I prezzi di Amazon Redshift includono funzionalità integrate di sicurezza, compressione, archiviazione di backup e trasferimento dei dati. Con l'aumento del volume dei dati, potrai utilizzare l'archiviazione gestita all'interno delle istanze RA3 per archiviare i dati in modo economico a 0,024 USD per GB al mese.
Costi prevedibili anche per carichi di lavoro imprevedibili: Amazon Redshift consente di dimensionare con un impatto minimo sui costi, in quanto ogni cluster guadagna fino a un'ora di crediti di gestione dei carichi di lavoro concomitanti gratuiti al giorno. Questi crediti gratuiti soddisfano le esigenze di concorrenza per il 97% dei clienti. Questo consente di prevedere i costi mensili anche durante i periodi di domanda analitica fluttuante.
Scegli il tipo di nodo migliore per ottenere il miglior rapporto qualità-prezzo per i carichi di lavoro: puoi selezionare tre tipi di istanze per ottimizzare Amazon Redshift in base alle tue esigenze in termini di data warehousing, ovvero nodi RA3, nodi Dense Compute e nodi Dense Storage.
I nodi RA3 ti permettono di dimensionare le capacità di archiviazione in modo indipendente rispetto a quelle di calcolo. Con RA3 potrai ottenere un data warehouse a elevate prestazioni che archivia dati in un livello di archiviazione separato. Tutto ciò che dovrai fare sarà dimensionare il data warehouse per le prestazioni che necessiti per le tue query.
Con i nodi Dense Compute (DC) si creano data warehouse ad alte prestazioni composti di dischi allo stato solido (SSD), CPU performanti ed elevate quantità di RAM, e sono la scelta migliore per elaborare meno di 500 GB di dati.
I nodi Dense Storage (DS2) ti permettono di creare data warehouse di grandi dimensioni utilizzando hard disk drive (HDD) a un prezzo ridotto quando acquisti istanze riservate per un ciclo di tre anni. La maggior parte dei clienti che ha in esecuzione cluster DS2 può migrare i propri carichi di lavoro sui cluster RA3 e raddoppiare le proprie prestazioni e le proprie capacità di archiviazione per lo stesso prezzo delle istanze DS2.
Dimensionare il cluster o passare da un tipo di nodo all'altro non richiede più di una singola chiamata API o di qualche clic nella Console di gestione AWS. Per maggiori informazioni, consulta la pagina Prezzi.
Facile, sicuro e affidabile
Concentrati sul passaggio dai dati alle informazioni dettagliate in pochi secondi e sul raggiungimento dei tuoi risultati aziendali, senza preoccuparti di gestire il data warehouse.
Amazon Redshift Serverless: Amazon Redshift Serverless è un'opzione serverless di Amazon Redshift che facilita l'esecuzione e il dimensionamento dell'analisi in pochi secondi senza la necessità di impostare e gestire l'infrastruttura del data warehouse. Con Amazon Redshift Serverless, qualsiasi utente, compresi gli analisti di dati, gli sviluppatori, i professionisti aziendali e i data scientist, può ottenere informazioni dettagliate dai dati semplicemente caricando e interrogando i dati nel data warehouse. Ulteriori informazioni.
Query Editor v2: utilizza SQL per rendere i tuoi dati Amazon Redshift e il tuo data lake più accessibili agli analisti di dati, ai data engineer e ad altri utenti SQL con un workbench di analisi basato sul Web per l'esplorazione e l'analisi dei dati. Query Editor v2 consente di visualizzare i risultati delle query con un solo clic, creare schemi e tabelle, caricare i dati visivamente e sfogliare gli oggetti del database. Offre anche un editor intuitivo per creare e condividere query SQL, analisi, visualizzazioni e annotazioni, e condividerle in modo sicuro con il tuo team.
Progettazione automatica di tabelle: Amazon Redshift monitora i carichi di lavoro degli utenti e utilizza sofisticati algoritmi per trovare il modo di migliorare il layout fisico dei dati per ottimizzare le velocità di query. L'ottimizzazione automatica di tabelle seleziona le migliori chiavi di ordinamento e distribuzione per ottimizzare le prestazioni per il carico di lavoro del cluster. Se Amazon Redshift stabilisce che l'applicazione di una chiave migliorerà le prestazioni del cluster, le tabelle verranno automaticamente modificate senza richiedere l'intervento dell'amministratore. Le caratteristiche aggiuntive Eliminazione Vacuum Automatica, Ordinamento Automatico delle tabelle e Analisi Automatica eliminano la necessità di manutenzione manuale e di messa a punto dei cluster Redshift per ottenere le migliori prestazioni per i nuovi cluster e i carichi di lavoro di produzione.
Esegui query usando i tuoi strumenti: Amazon Redshift ti offre la flessibilità di eseguire query all'interno della console o di collegare strumenti client SQL, librerie o strumenti di data science tra cui Amazon QuickSight, Tableau, PowerBI, QueryBook e notebook Jupyter.
API semplici per l'interazione con Amazon Redshift: Amazon Redshift consente di accedere senza problemi a tutti i tipi di applicazioni tradizionali, native per il cloud e containerizzate basate su servizi Web serverless e alle applicazioni basate sugli eventi. L'API di dati di Amazon Redshift semplifica l'accesso ai dati, la loro acquisizione e l'uscita dai linguaggi di programmazione e dalle piattaforme supportate da AWS SDK come Python, Go, Java, Node.js, PHP, Ruby e C++. L'API di dati permette di non dover configurare i driver e gestire le connessioni del database. Invece, è possibile eseguire comandi SQL su un cluster Amazon Redshift in modo semplice richiamando un endpoint API sicuro fornito dall'API di dati. L'API di dati si occupa della gestione delle connessioni al database e del caricamento dei dati. L'API di dati è asincrona, così puoi recuperare i risultati in un secondo momento. I risultati delle query vengono archiviati per 24 ore.
Tolleranza ai guasti: vi sono numerose caratteristiche che rafforzano l'affidabilità del cluster del data warehouse. Ad esempio, Amazon Redshift monitora costantemente anche l'integrità del cluster, replicando automaticamente una seconda volta i dati provenienti da unità con errori e procedendo, quando necessario, alla sostituzione dei nodi per la tolleranza ai guasti. I cluster possono anche essere trasferiti in zone di disponibilità (AZ) alternative senza alcuna perdita di dati o modifiche di applicazione.
AWS offre capacità di sicurezza complete per soddisfare i requisiti più complessi e Amazon Redshift fornisce funzionalità per la sicurezza dei dati pronte per l'utilizzo senza costi aggiuntivi.
Controlli granulari degli accessi: i controlli granulari di sicurezza a livello di righe e colonne permettono agli utenti di visualizzare solo i dati per cui dispongono i permessi di accesso. Amazon Redshift è integrato con AWS Lake Formation, così da assicurare che i controlli agli accessi a livello di colonna di Lake Formation vengano applicati anche alle query di Redshift sui dati all'interno del data lake.
La condivisione dei dati di Amazon Redshift supporta il controllo degli accessi centralizzato con AWS Lake Formation per semplificare la governance dei dati condivisi da Amazon Redshift. AWS Lake Formation (LF) è un servizio che facilita l'impostazione di data lake sicuri per gestire centralmente l'accesso granulare ai dati per tutti i servizi a consumo e per applicare i controlli livello di righe e colonne.
Dynamic Data Masking: con Dynamic Data Masking, i clienti possono proteggere facilmente i loro dati sensibili limitando la visibilità dei dati identificabili per gli utenti. Inoltre, consente di definire più livelli di autorizzazione di questi campi, in modo che diversi utenti e gruppi possano avere livelli variabili di accesso ai dati senza dover creare più copie di dati, il tutto tramite la nota interfaccia SQL di Redshift.
Multi AZ: la nuova configurazione Multi-AZ di Redshift espande ulteriormente le funzionalità di ripristino, riducendo le tempistiche dell'operazione e garantendo la possibilità di ripristino automatico senza perdite di dati. Un data warehouse Multi-AZ di Redshift ottimizza le prestazioni e il valore offrendo alta disponibilità senza dover utilizzare le risorse in standby.
Crittografia completa: configurando alcune semplici impostazioni, Amazon Redshift può applicare il protocollo SSL per proteggere i dati in transito e il protocollo di crittografia AES a 256 bit per i dati a riposo. Se scegli di abilitare la crittografia dei dati a riposo, tutti i dati scritti sulle unità saranno crittografati, inclusi i backup. Amazon Redshift si occupa della gestione delle chiavi come impostazione predefinita.
Isolamento di rete: Amazon Redshift consente di configurare le regole del firewall in modo da controllare gli accessi al cluster del data warehouse. Amazon Redshift può essere eseguito all'interno del cloud privato virtuale (VPC) in modo da isolare il cluster del data warehouse in una rete virtuale a sé stante e collegarlo all'infrastruttura IT esistente tramite VPN IPsec con una crittografia standard di settore.
Audit e conformità: Amazon Redshift si integra con AWS CloudTrail per creare audit di tutte le chiamate API di Redshift. Inoltre, registra tutte le operazioni SQL inclusi i tentativi di connessione, le query e le modifiche al data warehouse. Per accedere a questi log è possibile utilizzare query SQL su tabelle di sistema oppure salvare i log in un percorso sicuro su Amazon S3. Amazon Redshift è conforme ai requisiti di controllo SOC1, SOC2, SOC3 e PCI DSS Level 1. Per ulteriori informazioni, consulta Conformità del cloud AWS.
Tokenizzazione: le funzioni definite dall'utente (UDF) di Amazon Lambda consentono di utilizzare una funzione AWS Lambda come funzione definita dall'utente in Amazon Redshift e di invocarla dalle query SQL Redshift. Questa funzionalità consente di scrivere estensioni personalizzate per la query SQL per ottenere una più stretta integrazione con altri servizi o prodotti di terze parti. Puoi scrivere funzioni definite dall'utente Lambda per abilitare la tokenizzazione esterna, il mascheramento dei dati, l'identificazione o la de-identificazione dei dati mediante l'integrazione con fornitori come Protegrity e per proteggere o non proteggere i dati sensibili sulla base dei permessi e dei gruppi di un utente, in fase di query.
Scopri di più su tutte le novità.
Consulta la Documentazione di Amazon Redshift per informazioni dettagliate sul prodotto.
Ulteriori informazioni sui prezzi di Amazon Redshift