張貼日期: Dec 3, 2019
您現在可以將 Amazon Redshift 查詢結果以 Apache Parquet (這是用於分析的高效率開放單欄式儲存格式) 的形式卸載至 Amazon S3 資料湖。相較於文字格式,Parquet 格式的卸載速度提升達 2 倍,並且在 Amazon S3 中消耗的儲存減少達 6 倍。如此即可以開放的格式,將在 Amazon Redshift 中完成的資料轉換和擴充儲存至 Amazon S3 資料湖中。然後可以使用 Redshift Spectrum 和其他 AWS 服務 (如 Amazon Athena、Amazon EMR 和 Amazon SageMaker) 來分析數據。
您可以指定一個或多個分區欄,以便將卸載的資料自動分區至 Amazon S3 儲存貯體的資料夾中。例如,您可以選擇卸載行銷資料,並按年、月和日欄對其進行分區。這讓您的查詢可以充分利用分區剪除功能,並略過掃描不相關分區,從而提高查詢效能並將成本降至最低。
如需更多資訊,請參閱 Amazon Redshift 文件。
Redshift 1.0.10480 版或更新版本提供 Amazon Redshift 資料湖匯出支援。如需了解 Amazon Redshift 可用性,請參閱 AWS 區域表。