投稿日: Nov 29, 2023

本日、Amazon Redshift で Apache Iceberg テーブルのサポートの一般提供を開始したことを発表します。これにより、データレイク上の Apache Iceberg テーブルに簡単にアクセスして、データウェアハウス内のデータと結合できます。この機能により、自動マウントされた AWS Glue カタログと外部スキーマのどちらを使用してデータレイクテーブルにアクセスする場合でもパフォーマンスが向上します。 

Amazon Redshift では、お客様は Apache Hudi や Delta Lake などのさまざまなオープンテーブル形式に対するサポートを活用して、データウェアハウスやデータレイクで幅広いワークロードを実行できます。Iceberg テーブルを使用すると、Amazon EMR、Amazon Athena、AWS Glue などの ACID 準拠サービスを使用したデータの同時書き込み中に、トランザクションに一貫性のあるデータレイククエリを実行できるようになりました。今回のリリースでは、Parquet データファイルと Apache Iceberg テーブルでの Zstandard 圧縮のサポートも導入されており、圧縮率が高くなり、圧縮/解凍のパフォーマンスが向上します。最近導入された自動マウントデータカタログでの Iceberg サポートにより、追加の作業なしで Redshift を使用して AWS Glue データカタログ内の既存の Iceberg テーブルにアクセスできます。 

Amazon Redshift での Apache Iceberg のサポートは、中国 (北京) と中国 (寧夏) を除くすべての AWS リージョンで使用できます。使用を開始するには、Amazon Redshift の管理ガイドをご覧ください。