投稿日: Apr 13, 2023

本日、Amazon Redshift は、LZO や ZSTD などの代替の圧縮エンコーディングと比較して、文字列ベースのデータ処理を 5 倍から 63 倍高速化する追加のパフォーマンス強化を導入しました。Amazon Redshift は CPU 効率の高い軽量な辞書でエンコードされた文字列をベクトル化スキャンすることでこれを実現しており、データベースエンジンは直接、圧縮データ上で動作します。これらの手法は、カーディナリティが低い文字列 (CHAR または VARCHAR) に最適です。カーディナリティの低い文字列は、最大で数百の一意の文字列値を持つ列です。

Amazon Redshift データウェアハウスで自動テーブル最適化 (ATO) を有効にすることで、この新しい高性能文字列拡張機能を自動的に活用できます。テーブルで ATO が有効になっていない場合は、Amazon Redshift コンソールAmazon Redshift Advisor から、文字列の BYTEDICT エンコーディングへの適合性に関する推奨事項を受け取ることができます。BYTEDICT エンコーディングを使用して、カーディナリティの低い文字列を持つ新しいテーブルを定義することもできます。Amazon Redshift の文字列拡張は、Amazon Redshift が利用可能なすべての Amazon Web Services (AWS) リージョンで利用できるようになりました。