張貼日期: Jun 8, 2020
您現在可將 Amazon Redshift 查詢結果,以文字或 Apache Parquet 格式寫入 Amazon S3 中的外部資料表。外部資料表中繼資料會自動更新,並且可儲存在 AWS Glue,AWS Lake Formation 或您的 Hive Metastore 資料型錄中。如此您便能輕鬆地在資料湖中共用資料,並立即使用 Amazon Redshift Spectrum 和其他 AWS 服務進行分析,例如 Amazon Athena、Amazon EMR 和 Amazon SageMaker。Amazon Redshift Spectrum 讓您能夠支援 Lake House 架構,以便直接查詢和聯接整個資料倉儲和資料湖中的資料。
若要開始寫入外部資料表,只需執行 CREATE EXTERNAL TABLE AS SELECT 即可寫入新的外部資料表,或執行 INSERT INTO 即可將資料插入現有的外部資料表。如此一來,您便能夠使用熟悉的 SQL 以及與現有 ETL 和 BI 工具無縫整合,來簡化和加速資料處理管道。您可以使用 PARTITIONED BY 選項,自動對資料進行分區,並充分利用分區剪除來提高查詢效能及最小化成本。例如,您可以將市場行銷資料寫入外部資料表,然後選擇按年、月和日列對其進行分區。如需詳細資訊,請參閱 Amazon Redshift 的 CREATE EXTERNAL TABLE 和 INSERT 文件。
Redshift 發行版本 1.0.15582 或更高版本支援 Amazon Redshift 寫入外部資料表功能。如需了解 Amazon Redshift 可用性,請參閱 AWS 區域表。