Amazon Redshift が Apache Iceberg テーブルのジャストインタイム (JIT) ANALYZE のサポートを開始
Amazon Redshift は本日、Apache Iceberg テーブル用のジャストインタイム (JIT) ANALYZE 機能の一般提供を発表しました。これにより、ユーザーは Redshift データレイク内の Apache Iceberg テーブルに対して高性能の読み取りおよび書き込み分析クエリを実行できます。Apache Iceberg のオープンテーブル形式は、データレイクに保存されている、急速に拡大と変化を遂げるテーブルのデータ処理を簡素化するために、多くのお客様に使用されています。
従来のデータウェアハウスとは異なり、データレイクには基になるデータに関するテーブルレベルおよび列レベルの包括的な統計がないことが多く、テーブルと列の統計を把握せずにクエリエンジンが最適なクエリ実行プランを選択することは困難です。クエリ実行プランが最適でないと、パフォーマンスが低速かつ予測困難になることがあります。
"JIT ANALYZE" は Amazon Redshift の新機能で、クエリ実行中に Iceberg テーブルの統計情報を自動的に収集して利用します。これにより、手動による統計収集が不要になり、最適なクエリ実行プランを生成するために必要な情報をクエリエンジンに提供できます。このシステムは、統計の恩恵を受けるクエリをインテリジェントなヒューリスティックを使用して特定し、軽量なスケッチデータ構造を維持し、テーブルレベルおよび列レベルの高品質の統計を作成します。JIT ANALYZE は、事前に統計を計算したクエリと同等のパフォーマンスをすぐに発揮し、それと同時に他の多くのパフォーマンス最適化の基盤を提供します。
Apache Iceberg テーブル用の Amazon Redshift JIT ANALYZE 機能は、Amazon Redshift が利用できるすべての AWS リージョンで利用できるようになりました。この新しいデータレイククエリ最適化を利用するために、ユーザーは変更を加えたり、設定を有効にしたりする必要はありません。使用を開始するには、Amazon Redshift の管理ガイドのドキュメントページを参照してください。