Funzionalità di Amazon Redshift
Offri prezzi e prestazioni senza pari su larga scala con SQL per il tuo data lakehouse
- Ottieni prestazioni, scalabilità e sicurezza a prezzi eccezionali
12
- Ricevi infomazioni approfondite con SQL sui dati unificati nel lakehouse
4
- Accelera il processo decisionale con analisi quasi in tempo reale
4
- Ottieni semplici analisi SQL senza gestire l’infrastruttura
4
- Contestualizza le applicazioni e aumenta la produttività degli utenti con l’IA generativa
3
Ottieni prestazioni, scalabilità e sicurezza a prezzi eccezionali
Apri tuttoLe istanze RA3 massimizzano la velocità per carichi di lavoro ad elevate prestazioni che richiedono una notevole capacità di calcolo, offrendo allo stesso tempo la flessibilità necessaria per pagare separatamente per le risorse di calcolo e le risorse di archiviazione indicando il numero di istanze necessarie.
Per ridurre la quantità di I/O necessari per elaborare le query, Amazon Redshift impiega soluzioni di archiviazione basate su colonne, compressione dei dati e mappature di zona. Oltre alle codifiche standard del settore quali LZO e Zstandard, Amazon Redshift offre la codifica di compressione dedicata, AZ64, per tipi numerici e data/ora per permettere di risparmiare sull’archiviazione e di ottimizzare le prestazioni delle query.
Supporta un numero praticamente illimitato di utenti simultanei e query simultanee con livelli di servizio uniformi, aggiungendo capacità transitoria in pochi secondi all’aumentare delle richieste ricevute contemporaneamente. Dimensionamento con un impatto minimo sui costi, poiché ogni cluster guadagna fino a un’ora di crediti di dimensionamento simultaneo gratuiti ogni giorno. Questi crediti gratuiti soddisfano le esigenze di attività simultanee per il 97% dei clienti.
Inizia a scrivere nei database Redshift da altri data warehouse Redshift in pochi clic, abilitando ulteriormente la collaborazione sui dati, la scalabilità flessibile dell’elaborazione per i carichi di lavoro di elaborazione ETL/dati aggiungendo warehouse di diversi tipi e dimensioni in base alle esigenze in termini di rapporto qualità-prezzo. Ottieni una maggiore trasparenza nell’utilizzo dell’elaborazione, perché ogni warehouse viene fatturato in base alle proprie risorse di calcolo, riducendo i costi.
Le viste materializzate di Amazon Redshift consentono di ottenere prestazioni di query notevolmente più veloci per carichi di lavoro analitici iterativi o prevedibili come pannelli di controllo e query da strumenti di business intelligence (BI) e processi di elaborazione di dati di estrazione, trasformazione e caricamento (ETL). È possibile utilizzare le viste materializzate per archiviare e gestire i risultati precalcolati di un’istruzione SELECT che fa riferimento a una o più tabelle, tra cui data lake, Zero-ETL e tabelle di condivisione dei dati. Con l’aggiornamento incrementale, Amazon Redshift identifica le modifiche nella tabella o nelle tabelle di base avvenute dopo l’aggiornamento precedente e aggiorna solo i record corrispondenti nella vista materializzata. L’aggiornamento incrementale viene eseguito più rapidamente di un aggiornamento completo e migliora le prestazioni del carico di lavoro.
Fornisci tempi di risposta inferiori al secondo per le query ripetute. Gli strumenti di pannello di controllo, visualizzazione e BI che eseguono query ripetute presentano un incremento notevole delle prestazioni. Quando una query è in esecuzione, Amazon Redshift effettua ricerche nella cache per verificare l’eventuale presenza del risultato memorizzato di una query precedente. Se trova un risultato nella cache e i dati non sono cambiati, questo risultato viene restituito immediatamente invece di eseguire nuovamente la query.
Un nuovo potente meccanismo di ordinamento delle tabelle che migliora le prestazioni delle query ripetitive, ordinando automaticamente i dati in base ai filtri delle query in entrata (ad esempio, le vendite in una regione specifica). Questo metodo accelera notevolmente le prestazioni delle scansioni delle tabelle rispetto ai metodi tradizionali.
Espandi le funzionalità di ripristino riducendo i tempi e garantendo la capacità di ripristino automatico senza perdita di dati. Un data warehouse Multi-AZ di Amazon Redshift ottimizza le prestazioni e il valore offrendo un’elevata disponibilità senza la necessità di utilizzare le risorse in standby, portando la disponibilità al 99,99% dell’SLA.
Amazon Redshift ti consente di configurare le regole del firewall in modo da controllare gli accessi al cluster del data warehouse. Amazon Redshift può essere eseguito all’interno di Amazon Virtual Private Cloud (Amazon VPC) in modo da isolare il cluster del data warehouse in una rete virtuale a sé stante e collegarlo all’infrastruttura IT esistente tramite VPN IPsec con crittografia standard di settore.
Impostando alcuni semplici parametri, potrai configurare Amazon Redshift in modo da applicare il protocollo TLS per proteggere i dati in transito e il protocollo di crittografia AES-256 con accelerazione hardware per i dati a riposo. Se scegli di abilitare la crittografia dei dati a riposo, tutti i dati scritti su disco saranno crittografati, inclusi i backup. Amazon Redshift si occupa della gestione delle chiavi come impostazione predefinita.
L’integrazione con il Centro Identità IAM consente alle organizzazioni di supportare una propagazione affidabile delle identità tra Amazon Redshift, Amazon QuickSight e AWS Lake Formation. Puoi utilizzare l’identità della tua organizzazione per accedere ad Amazon Redshift con un singolo accesso, utilizzando gestori dell’identità digitale (IdP) di terze parti come Microsoft Entra ID, Okta, Ping o OneLogin da QuickSight e da Amazon Redshift Query Editor e strumenti di BI di terze parti ed editor SQL. Gli amministratori possono utilizzare utenti e gruppi IdP di terze parti per gestire l’accesso granulare ai dati attraverso i servizi e analizzare l’accesso a livello di utente in AWS CloudTrail. Con una propagazione affidabile dell’identità, l’identità di un utente viene trasmessa senza problemi tra QuickSight, Amazon Redshift e Lake Formation, riducendo i tempi di acquisizione delle informazioni e consentendo un’esperienza di analisi senza intoppi.
I controlli granulari di sicurezza a livello di righe e colonne garantiscono che gli utenti possano visualizzare solamente i dati per i quali hanno i permessi di accesso. Amazon Redshift è integrato con Lake Formation, assicurando così che i controlli agli accessi a livello delle colonne in Lake Formation vengano applicati anche alle query di Amazon Redshift sui dati all’interno del data lake. La condivisione dei dati di Amazon Redshift supporta il controllo degli accessi centralizzato con Lake Formation per semplificare la governance dei dati condivisi da Amazon Redshift. Lake Formation è un servizio che facilita la configurazione di data lake sicuri per gestire a livello centrale l’accesso granulare ai dati per tutti i servizi a consumo e per applicare i controlli a livello di righe e colonne. Con il mascheramento dei dati dinamico, potrai proteggere i tuoi dati sensibili limitando la quantità di dati identificabili visibili agli utenti. Definisci più livelli di autorizzazioni per questi campi in modo da offrire diversi livelli di accesso ai dati a utenti e gruppi diversi senza dover creare più copie dei dati, il tutto tramite la familiare interfaccia SQL di Amazon Redshift.
Ricevi infomazioni approfondite con SQL sui dati unificati nel lakehouse
Apri tutto
Analizza tutti i tuoi dati unificati utilizzando SQL con l’integrazione di Amazon Redshift con Amazon SageMaker Lakehouse. Interroga i dati di Amazon Simple Storage Service (Amazon S3) in formati aperti, eliminando lo spostamento dei dati tra lake e warehouse. Apri i tuoi dati Amazon Redshift in Amazon SageMaker Lakehouse per consentire l’accesso agli strumenti di analisi AWS e Apache Iceberg, supportando l’analisi completa dei dati e le attività di machine learning (ML).
Amazon Redshift supporta le query di sola lettura utilizzando ANSI SQL sui formati di tabella Apache Iceberg, Apache Hudi e Delta Lake, nonché le query sui formati di file aperti, tra cui Apache Parquet, ORC, Avro, JSON e CSV, direttamente in Amazon S3. Apache Iceberg è un esempio di formato di tabella open source che assicura coerenza nelle transazioni e una migliore organizzazione dei data lake attraverso la sua struttura a tabelle. Amazon Redshift Spectrum consente di leggere tabelle e dati in formati aperti come Parquet nel tuo data lake, conservando exabyte di dati strutturati, semistrutturati e non strutturati in Amazon S3. Potrai anche esportare i dati nel tuo data lake utilizzando il comando UNLOAD di Amazon Redshift, inclusa l’opzione per l’esportazione in Parquet. Esportare i dati da Amazon Redshift nel tuo data lake ti permette di analizzarli ulteriormente tramite altri servizi AWS quali Amazon Athena, Amazon EMR e SageMaker.
Utilizza SQL per rendere i tuoi dati Amazon Redshift e il tuo data lake più accessibili agli analisti di dati, ai data engineer e ad altri utenti SQL con un workbench di analisi basato sul web per l’esplorazione e l’analisi dei dati. Query Editor consente di visualizzare i risultati delle query in un solo passaggio, creare schemi e tabelle, caricare i dati visivamente e sfogliare gli oggetti del database. Offre anche un editor intuitivo per creare e condividere query SQL, analisi, visualizzazioni e annotazioni, e condividerle in modo sicuro con il tuo team.
Usa l’editor SQL integrato basato su Amazon Redshift in SageMaker Unified Studio, un unico ambiente di sviluppo di dati e intelligenza artificiale, per interrogare i dati archiviati in data lake, data warehouse, database e applicazioni.
Accelera il processo decisionale con analisi quasi in tempo reale
Apri tutto
L’integrazione senza codice tra Aurora, Amazon Relational Database Service (Amazon RDS), Amazon DynamoDB, applicazioni aziendali e Amazon Redshift consente di effettuare analisi immediate e ML su petabyte di dati tra database e applicazioni. Ad esempio, per i dati scritti su sorgenti di applicazioni operative, transazionali o aziendali, le integrazioni Zero-ETL di Aurora con Amazon Redshift rendono i dati disponibili in Amazon Redshift, riducendo al minimo la necessità di creare e mantenere complesse pipeline di dati ETL.
Semplifica e automatizza l’acquisizione dei dati da Amazon S3 riducendo i tempi e gli sforzi necessari per creare soluzioni personalizzate o gestire servizi di terze parti. Con questa funzionalità, Amazon Redshift elimina la necessità di eseguire manualmente e ripetutamente le procedure di copia, automatizzando l’importazione dei file e gestendo le fasi di caricamento continuo dei dati dietro le quinte. Il supporto per la copia automatica permette agli utenti line-of-business e agli analisti dei dati senza conoscenze di ingegneria dei dati di creare regole di importazione e configurare la posizione dei dati che vogliono caricare da Amazon S3.
Utilizza SQL per connetterti e acquisire direttamente dati dai flussi di dati Amazon Kinesis e da Streaming gestito da Amazon per Apache Kafka (Amazon MSK). Amazon Redshift Streaming Ingestion permette anche di creare e gestire facilmente le pipeline a valle consentendo di creare viste materializzate direttamente sui flussi. Le viste materializzate possono includere anche le trasformazioni SQL nell’ambito della pipeline ELT. Puoi aggiornare manualmente le viste materializzate definite per eseguire query sui dati di streaming più recenti.
Esegui query relative ai dati in tempo reale su una o più istanze Amazon RDS, compresi i database Amazon Aurora PostgreSQL-Compatible Edition, Amazon Relational Database (Amazon RDS) for MySQL e Amazon Aurora MySQL-Compatible Edition, per ottenere una visibilità immediata su tutte le operazioni aziendali senza dover spostare i dati.
Ottieni semplici analisi SQL senza gestire l’infrastruttura
Apri tutto
Esegui analisi in pochi secondi e dimensiona senza la necessità di configurare e gestire l’infrastruttura di data warehouse. La nuova tecnologia di dimensionamento e ottimizzazione basata sull’IA consente ad Amazon Redshift Serverless di fornire e dimensionare automaticamente e proattivamente la capacità del data warehouse, offrendo prestazioni rapide anche per i carichi di lavoro più impegnativi. Il sistema utilizza tecniche di IA per apprendere i modelli di carico di lavoro dei clienti in dimensioni principali, come query simultanee, complessità delle query, afflusso di volumi di dati e modelli ETL. Inoltre, adatta continuamente le risorse durante il giorno e applica ottimizzazioni delle prestazioni su misura. Puoi impostare l’obiettivo desiderato, e il data warehouse si dimensiona automaticamente in modo da assicurare prestazioni uniformi.
Algoritmi sofisticati prevedono e classificano le query in entrata in base ai tempi di esecuzione e ai requisiti di risorse per gestire dinamicamente le prestazioni e le attività simultanee, permettendo di dare priorità ai carichi di lavoro critici per l’azienda. L’accelerazione di query brevi (SQA) invia query brevi da applicazioni come i pannelli di controllo per smaltire rapidamente le code, in modo da elaborare le query immediatamente invece di attendere che vengano completate le query più grandi. La gestione automatica dei carichi di lavoro (WLM) utilizza il ML per gestire in modo dinamico memoria e attività simultanee, consentendo di massimizzare il throughput delle query. Inoltre, ora puoi impostare la priorità delle query più importanti, anche quando ne vengono inviate centinaia. Amazon Redshift Advisor formula raccomandazioni quando è necessaria un’azione esplicita dell’utente per migliorare ulteriormente le prestazioni di Amazon Redshift. Per i carichi di lavoro dinamici, dove i modelli di query non sono prevedibili, le viste materializzate automatiche migliorano il throughput delle query, diminuiscono la loro latenza, riducono il tempo di esecuzione tramite gli aggiornamenti automatici, la riscrittura automatica delle query, l’aggiornamento incrementale e il monitoraggio continuo dei cluster di Amazon Redshift. L’ottimizzazione automatica delle tabelle seleziona le chiavi di ordinamento e distribuzione per ottimizzare le prestazioni per il carico di lavoro del cluster. Se Amazon Redshift stabilisce che l’applicazione di una chiave migliorerà le prestazioni del cluster, le tabelle vengono modificate automaticamente senza richiedere l’intervento dell’amministratore. Le funzionalità aggiuntive di eliminazione automatica delle operazioni vacuum, ordinamento automatico delle tabelle e analisi automatica eliminano la necessità di interventi di manutenzione manuali e di messa a punto dei cluster Amazon Redshift per ottenere le migliori prestazioni per i nuovi cluster e i carichi di lavoro di produzione.
Utilizza un’API semplice per l’interazione con Amazon Redshift: questo servizio consente di accedere senza problemi a tutti i tipi di applicazioni tradizionali, native del cloud e containerizzate basate su servizi web serverless e ad applicazioni basate sugli eventi. L’API di dati di Amazon Redshift semplifica l’accesso ai dati, la loro acquisizione e l’uscita dai linguaggi di programmazione e dalle piattaforme supportate da AWS SDK come Python, Go, Java, Node.js, PHP, Ruby e C++. L’API di dati permette di evitare la configurazione dei driver e la gestione delle connessioni del database. In alternativa, sarà possibile eseguire comandi SQL su un cluster Amazon Redshift richiamando un endpoint API sicuro fornito dall’API di dati. L’API di dati si occupa della gestione delle connessioni al database e del caricamento dei dati. L'API di dati è asincrona, così puoi recuperare i risultati in un secondo momento. I risultati delle query vengono archiviati per 24 ore.
Esegui query all’interno della console o connetti strumenti client SQL, librerie o strumenti di data science tra cui QuickSight, Tableau, Microsoft Power BI, Alteryx, Querybook, notebook Jupyter, Informatica, dbt, MicroStrategy e Looker.
Contestualizza le applicazioni e aumenta la produttività degli utenti con l’IA generativa
Apri tuttoUsa un linguaggio semplice per scrivere query in Amazon Redshift Query Editor e generare in modo sicuro raccomandazioni precise per il codice SQL da utilizzare nell’ambito delle autorizzazioni di accesso ai dati.
Amazon Redshift si integra perfettamente con Amazon Bedrock, abilitando funzionalità di IA generativa diretta tramite comandi SQL standard. Questa integrazione consente ai team di dati di utilizzare modelli di fondazione come Anthropic Claude e Amazon Titan per attività come l’analisi del testo, la traduzione e il rilevamento delle emozioni senza aggiungere complessità all’infrastruttura. Gli utenti possono invocare senza problemi i modelli di intelligenza artificiale all’interno dei flussi di lavoro di analisi dei dati esistenti, trasformando il modo in cui le informazioni vengono estratte dai dati aziendali.
Amazon Redshift ML consente ad analisti di dati, data scientist, professionisti di BI e sviluppatori di database di creare, addestrare e implementare più facilmente modelli di SageMaker utilizzando SQL. Con Amazon Redshift ML, puoi utilizzare le istruzioni SQL per creare e addestrare i modelli di SageMaker sui tuoi dati in Amazon Redshift e quindi utilizzare questi modelli per generare stime come il rilevamento del tasso di abbandono, le previsioni finanziarie, la personalizzazione e il punteggio di rischio direttamente nelle loro query e nei tuoi report. Inserisci modelli linguistici di grandi dimensioni in Amazon Redshift per attività avanzate di elaborazione del linguaggio naturale come la sintesi testuale, l’estrazione delle entità e l’analisi delle emozioni, per ottenere informazioni più approfondite dai tuoi dati utilizzando SQL.