Inserito il: Dec 3, 2019
È ora possibile caricare i risultati di una query di Amazon Redshift sul proprio data lake in Amazon S3 come Apache Parquet, un formato di storage aperto a colonne per l'analisi. Il formato Parquet è 2 volte più veloce a scaricare e consuma fino a 6 volte meno storage in Amazon S3 rispetto agli altri formati di testo. Questo ti permette di salvare la trasformazione e l'arricchimento dei dati portati a termine in Amazon Redshift nel tuo data lake di Amazon S3 in un formato aperto. Puoi analizzare i tuoi dati con Redshift Spectrum e altri servizi AWS come Amazon Athena, Amazon EMR e Amazon SageMaker.
Puoi specificare una o più colonne di partizione per fare in modo che i dati scaricati vengano automaticamente ripartiti in cartelle nel tuo bucket di Amazon S3. Ad esempio, puoi scegliere di scaricare i tuoi dati di marketing e suddividerli per anno, mese e giorno in colonne. Questo permette alle tue query di trarre vantaggio dalla ripartizione ed evitare di analizzare parti irrilevanti, migliorando la prestazione delle query e minimizzando i costi.
Per ulteriori informazioni, consulta la documentazione di Amazon Redshift.
L'esportazione dei data lake di Amazon Redshift è supportata con la versione 1.0.10480 o successive di Redshift. Consulta la tabella delle regioni AWS, per verificare la disponibilità di Amazon Redshift.