投稿日: Oct 2, 2020
Amazon Redshift で HyperLogLog (HLL) スケッチのネイティブな保存と処理のサポートが開始されました。HyperLogLog は、データセット内にある個別の値の概数を効率的に推定する新しいアルゴリズムです。HLL スケッチは、データセット内の個別の値に関する情報をカプセル化するコンストラクトです。HLL スケッチは、大規模なデータセットの近似カーディナリティを計算するクエリに対して大幅なパフォーマンスメリットを実現するために使用することができ、平均的な相対エラーは 0.01~0.6% です。
Redshift は、HyperLogLog スケッチを生成、永続化、および組み合わせるために、第一級データ型の HLLSKETCH と関連する SQL 関数を提供します。Amazon Redshift の HyperLogLog 機能はバイアス補正手法を使用し、少ないメモリフットプリントで優れた正確性を提供します。Amazon Redshift の HLLSKETCH データ型は、テーブル内での HLL スケッチ値の保存に使用できます。さらに、Amazon Redshift は、aggregate および scalar 関数を使用して HLLSKETCH 値に適用できるオペレーションもサポートします。これらの関数は、HLL スケッチを作成する、HLL スケッチのカーディナリティを抽出する、または複数のスケッチ値を組み合わせるために使用できます。
Redshift における HLL スケッチのサポートは、リリースバージョンが 1.0.19097 以降の Redshift に含まれています。この機能は、新規および既存のお客様に無料でご利用いただけます。使用開始方法、および詳細については、AWS のドキュメントを参照してください。Amazon Redshift を利用できるリージョンについては、AWS リージョン表をご覧ください。