Veröffentlicht am: Dec 3, 2019
Das Ergebnis einer Amazon Redshift-Abfrage kann jetzt in Ihren Amazon S3-Data Lake als Apache Parquet exportiert werden, das ein effizientes offenes Spaltenspeicherformat für Analysen darstellt. Das Parquet-Format ist bis zu 2x schneller zu exportieren und verbraucht in Amazon S3 bis zu 6x weniger Speicherplatz als Textformate. Auf diese Weise können Datenkonvertierungen und Datenergänzungen die in Amazon Redshift durchgeführt wurden, in Ihrem Amazon S3 Data Lake in einem offenen Format gespeichert werden. Sie können Ihre Daten dann mit Redshift Spectrum und anderen AWS-Service wie Amazon Athena, Amazon EMR und Amazon SageMaker analysieren.
Sie können eine oder mehrere Partitionsspalten angeben, so dass die exportierten Daten automatisch in Ordner in Ihrem Amazon S3-Bucket partitioniert werden. Beispielsweise können Sie Ihre Marketingdaten exportieren und die Daten in Spalten nach Jahr, Monat und Tag partitionieren. Auf diese Weise können Ihre Abfragen die Vorteile der Partitionsbereinigung nutzen und das Scannen nicht relevanter Partitionen überspringen, wodurch die Abfrageleistung verbessert und die Kosten minimiert werden.
Weitere Informationen finden Sie in der Amazon Redshift-Dokumentation.
Amazon Redshift Data Lake Export wird mit Redshift Release Version 1.0.10480 oder höher unterstützt. Weitere Informationen zur Verfügbarkeit von Amazon Redshift finden Sie in der AWS-Regionentabelle.