Amazon Redshift 推出適用於 Top-K 查詢的效能最佳化
張貼日期:
2026年4月13日
Amazon Redshift 透過以智慧方式跳過不相關的資料區塊來更快地傳回結果,進而大幅減少處理的資料量,將 Top-K 查詢 (具有 ORDER BY 和 LIMIT 子句的查詢) 的處理進一步最佳化。此最佳化會根據 ORDER BY 欄的最小值/最大值,將資料區塊的讀取重新排序並有效調整,以僅在記憶體中保留前 K 個最符合條件的列。對 ORDER BY 欄進行排序或部分排序時,Amazon Redshift 現在只會處理所需的最小資料區塊,而不是掃描整個表格,從而消除不必要的 I/O 和運算負擔。
當資料是以遞減順序 (ORDER BY ...DESC LIMIT K) 永久儲存於大型表格上時,其中符合條件的列會附加在資料儲存的結尾時,此增強功能對 Top-K 查詢特別有助益。常見的範例包括:
- 從數百萬或數十億筆交易中尋找前 K 筆最近的訂單
- 從包含數十萬個庫存單位 (SKU) 和與您銷售目錄中所有產品 SKU 相關聯的數百萬或數十億筆銷售交易的銷售目錄中,擷取 Top-K 績效最佳產品或 Top-K 績效最差產品 (以遞減順序呈現 Top-K)
- 從數十億筆提示中,找到由基礎大型語言模型 (LLM) 推斷的 Top-K 最新或 Top-K 最舊 (以遞減順序呈現 Top-K) 提示。
透過這項新的最佳化,Top-K 查詢效能顯著提高。從修補程式 P199 版開始,這項適用於 Top-K 查詢的最佳化現已在 Amazon Redshift 中提供,無需額外費用,並於提供 Amazon Redshift 的所有 AWS 區域提供使用。這項最佳化會自動套用至符合條件的查詢,而不需要任何查詢重寫或組態變更。