Amazon Redshift が Top-K クエリ向けの主要なパフォーマンス最適化を導入

投稿日: 2026年4月13日

Amazon Redshift は、top-k クエリ (ORDER BY 句と LIMIT 句を含むクエリ) の処理がさらに最適化され、無関係なデータブロックをインテリジェントにスキップすることで結果をより高速に返し、処理データ量を大幅に削減できるようになりました。この最適化では、読み取るデータブロックを ORDER BY 列の最小値/最大値に基づいて並べ替え、効率的に調整して、条件を最も満たす上位 K 行のみをメモリ内に保持します。ORDER BY 列がソート済み、または部分的にソート済みの場合、Amazon Redshift はテーブル全体をスキャンするのではなく、必要最小限のデータブロックのみを処理するようになるため、不要な I/O やコンピューティングオーバーヘッドを排除できます。

この機能強化は、データが大規模なテーブルに降順で永続的に格納されている (ORDER BY ...DESC LIMIT K) top-k クエリの場合に特に効果を発揮します。このようなテーブルでは、条件を満たす行はデータストレージの末尾に追加されていきます。一般的な例として、次のようなケースが挙げられます。

  • 数百万件または数十億件の取引から、最新の k 件の注文を検索する
  • 数十万点の在庫管理単位 (SKU) を含む販売カタログと、その販売カタログ内のすべての製品 SKU に関連付けられた数百万または数十億件の販売取引から、最も売れ行きの良い top-k 点の製品、または最も売れ行きの悪い k 点の製品 (降順での top-k) を取得する
  • 数十億個のプロンプトから、基礎となる大規模言語モデル (LLM) によって推論された、最新の top-k 個のプロンプト、または最も古い top-k 個のプロンプト (降順での 上位 k 個) を検索する

この新しい最適化により、top-k クエリのパフォーマンスが大幅に向上します。top-k クエリ向けのこの最適化は、パッチリリース P199 以降、Amazon Redshift が利用可能なすべての AWS リージョンで追加料金なしで利用できます。この最適化は対象となるクエリに対して自動的に適用されるため、クエリの書き換えや設定変更の必要はありません。