投稿日: Jun 8, 2020
Amazon Redshift クエリの結果を、テキスト形式または Apache Parquet 形式で Amazon S3 の外部テーブルに書き込むことができるようになりました。外部テーブルのメタデータは自動的に更新され、AWS Glue、AWS Lake Formation、または Hive Metastore データカタログに保存できます。これにより、データレイク内のデータを簡単に共有し、Amazon Redshift Spectrum や、Amazon Athena、Amazon EMR、Amazon SageMaker などの他の AWS のサービスでの分析にすぐに利用できるようになります。Amazon Redshift Spectrum を使用すると、レイクハウスアーキテクチャを強化して、データウェアハウスとデータレイクにまたがってデータを直接クエリして結合できます。
外部テーブルへの書き込みを開始するには、CREATE EXTERNAL TABLE AS SELECT を実行して新しい外部テーブルに書き込むか、INSERT INTO を実行して既存の外部テーブルにデータを挿入します。これにより、使い慣れた SQL と、既存の ETL および BI ツールとのシームレスな統合を使用して、データ処理パイプラインを簡素化および高速化できます。PARTITIONED BY オプションを使用してデータを自動的にパーティション化し、パーティションプルーニングを利用してクエリのパフォーマンスを向上させ、コストを最小限に抑えることができます。例えば、マーケティングデータを外部テーブルに書き込み、年、月、日の列でパーティショニングすることを選択できます。詳細については、CREATE EXTERNAL TABLE および INSERT に関する Amazon Redshift のドキュメントを参照してください。
Amazon Redshift の外部テーブルへの書き込み機能は、Redshift のリリースバージョン 1.0.15582 以降でサポートされています。Amazon Redshift を利用できるリージョンについては、AWS リージョン表をご覧ください。