Amazon Redshift, 최상위 쿼리 처리를 위한 주요 성능 최적화 방식 도입

게시된 날짜: 2026년 4월 13일

Amazon Redshift는 관련 없는 데이터 블록을 지능적으로 건너뛰어 결과를 더 빠르게 반환하고 처리되는 데이터의 양을 획기적으로 줄임으로써 최상위 쿼리(ORDER BY 및 LIMIT 절이 있는 쿼리) 처리 방식을 더욱 최적화했습니다. 이러한 최적화 방식은 ORDER BY 열의 최소/최대값을 기반으로 읽을 데이터 블록을 재정렬하고 효율적으로 조정하여 메모리에서 상위 k개의 행만 유지합니다. ORDER BY 열이 정렬되거나 부분적으로 정렬되는 경우 Amazon Redshift는 이제 전체 테이블을 스캔하지 않고 필요한 최소한의 데이터 블록만 처리함으로써 불필요한 I/O와 컴퓨팅 오버헤드를 제거합니다.

이번 개선 사항은 특히 데이터 스토리지의 끝에 적합한 행이 추가되는 대규모 테이블에서 데이터가 내림차순으로 영구 저장되는 경우 유용합니다(ORDER BY ... DESC LIMIT K). 다음을 일반적인 예로 들 수 있습니다.

  • 수백만 또는 수십억 개의 트랜잭션에서 상위 k개의 최근 주문을 찾는 경우
  • 판매 카탈로그에 있는 모든 제품 SKU와 관련된 수십만 개의 재고 관리 단위(SKU) 및 수백만 또는 수십억 개의 판매 트랜잭션이 포함된 판매 카탈로그에서 실적이 가장 좋은 k개 제품 또는 실적이 가장 낮은 k개 제품(내림차순으로 상위 k개)을 검색하는 경우
  • 수십억 개의 프롬프트 중 기초 대규모 언어 모델(LLM)에서 추론한 최근 상위 k개 또는 가장 오래된 상위 k개(내림차순으로 상위 k개) 프롬프트를 찾는 경우

이번 새로운 최적화 방식을 통해 최상위 쿼리 처리 성능이 크게 향상됩니다. 최상위 쿼리에 대한 이번 최적화 방식은 이제 패치 릴리스 P199 버전부터 추가 비용 없이 Amazon Redshift를 사용할 수 있는 모든 AWS 리전의 Amazon Redshift에서 제공됩니다. 이 최적화 방식은 쿼리를 다시 작성하거나 구성을 변경할 필요 없이 적격 쿼리에 자동으로 적용됩니다.