Architettura lake house di Amazon Redshift

Esegui query su tutti i tuoi dati in formati di file aperti, senza necessità di caricare i dati.

La quantità di dati digitali generati da IoT, dispositivi intelligenti, applicazioni cloud e social network sta subendo una crescita esponenziale. Ciò che serve è un modo per analizzare tutti questi dati in modo rapido ed economico con accesso alle informazioni in tempo quasi reale, indipendentemente dal formato o dalla posizione in cui sono memorizzati.

Amazon Redshift supporta l'architettura lake house, che ti consente di eseguire query sui dati presenti in tutti i tuoi database operativi, data warehouse e data lake per ottenere informazioni dettagliate e una rapidità che non sarebbero possibili in altri ambienti. L'architettura lake house permette di memorizzare i dati in formati di file aperti nel data lake Amazon S3. In questo modo i dati sono facilmente disponibili per altre analisi dei dati e altri strumenti di machine learning anziché essere bloccati in un unico silo.

Ecco cosa puoi fare con un'architettura lake house di Amazon Redshift:

  • Eseguire facilmente query sui dati e scrivere nuovamente dati nel tuo data lake in formati aperti.
  • Utilizzare istruzioni SQL comuni per combinare ed elaborare i dati in tutti i tuoi archivi dati.
  • Eseguire query sui dati in diretta nei tuoi database operazionali senza alcuna necessità di caricare dati e senza richiedere pipeline ETL.

Intervento per re:Invent 2019 sull'architettura lake house di Amazon Redshift (1:23)

Caratteristiche

L'architettura lake house di Amazon Redshift si basa sulle seguenti funzionalità:

Amazon Redshift Spectrum

Esegui query sui dati in formato aperto direttamente nel data lake Amazon S3, senza dover caricare dati o duplicare la tua infrastruttura. Utilizzando la funzionalità Amazon Redshift Spectrum, puoi eseguire query su formati di file aperti come Apache Parquet, ORC, JSON, Avro e CSV. Segui questo tutorial dettagliato per iniziare.

Esportazione nel data lake

Salva i risultati di una query Amazon Redshift direttamente nel tuo data lake S3 in un formato di file aperto (Apache Parquet) utilizzando l'esportazione nel data lake. Potrai quindi analizzare questi dati utilizzando la funzionalità Amazon Redshift Spectrum e altri servizi AWS, come Sagemaker per il machine learning ed EMR per le operazioni ETL. Guarda questo video di 5 minuti per iniziare.

Query federata

La funzionalità

query federata consente ad Amazon Redshift di eseguire query sui dati direttamente negli archivi di Amazon RDS e Aurora PostgreSQL. Permette inoltre di incorporare i dati in tempo reale come parte delle applicazioni di business intelligence e reporting senza alcuna operazione ETL. Guarda questo video di 5 minuti o leggi questo tutorial per iniziare.

Warner Bros
"Utilizziamo molti strumenti di analisi dei dati AWS e di terze parti e per noi rappresenta un enorme vantaggio il fatto che Amazon Redshift continui a servirsi degli stessi modelli di trasformazione dei dati che utilizziamo per la nostra soluzione. Dal 2017 usufruiamo dell'opportunità offerta da Amazon Redshift di eseguire query su formati di dati aperti nel nostro data lake con Redshift Spectrum e ora la nuova funzionalità di esportazione nel data lake ci offre l'ulteriore vantaggio di poter scrivere nuovamente i dati nel data lake. Tutto questo mantenendo prestazioni sempre ottimali, anche con carichi di query estremamente elevati. Non vediamo l'ora di sperimentare la sinergia di uno stack di big data per realizzare una maggiore condivisione dei dati tra i cluster Amazon Redshift e ottenere maggiore valore a costi più contenuti per tutti i nostri giochi".

Kurt Larson, Direttore tecnico, Operazioni di marketing e analisi - Warner Bros. Analisi dei dati

Risorse

Blog

ETL and ELT design patterns for lake house architecture using Amazon Redshift: Part 1

Crea modelli di progettazione ETL ed ELT scalabili per l'architettura lake house con Amazon Redshift: parte 1.

Leggi il blog »
Tutorial

Getting started with Amazon Redshift Spectrum

Tutorial dettagliato per iniziare a utilizzare Amazon Redshift Spectrum.

Avvia tutorial »
Testimonianza del cliente

How to scale data analytics with Amazon Redshift

Scopri come la società di intrattenimento Warner Bros usa Amazon Redshift per dimensionare i carichi di lavoro dell'analisi dei dati.

Guarda il video »
Registrati per creare un account AWS
Registrati per creare un account AWS

Registrati per creare un account AWS e ottenere l'accesso immediato al piano gratuito di AWS.

Crea un account 
Piano gratuito di AWS
Piano gratuito di AWS

Ottieni un'esperienza diretta e gratuita con piattaforma, prodotti e servizi AWS.

Ulteriori informazioni 
Migra i tuoi database
Migra i tuoi database

Migra i tuoi database in modo rapido e sicuro con AWS Database Migration Service.

Scopri di più