Amazon Redshift, Apache Iceberg 테이블용 Amazon Redshift Just-In-Time (JIT) ANALYZE 지원
Amazon Redshift는 오늘 Apache Iceberg 테이블에 대한 JIT(Just-In-Time) ANALYZE 기능을 정식 출시한다고 발표했습니다. 이제 사용자는 Redshift 데이터 레이크 내의 Apache Iceberg 테이블에서 고성능 읽기 및 쓰기 분석 쿼리를 실행할 수 있습니다. Apache Iceberg 오픈 테이블 형식은 데이터 레이크에 저장된 빠르게 확장되고 진화하는 테이블의 데이터 처리를 단순화하기 위해 많은 고객들이 사용하고 있습니다.
기존 데이터 웨어하우스와 달리 데이터 레이크에는 기본 데이터에 대한 포괄적인 테이블 수준 및 열 수준 통계가 없는 경우가 많기 때문에 테이블 및 열 통계에 대한 가시성이 없으면 쿼리 엔진이 가장 최적의 쿼리 실행 계획을 선택하기가 어렵습니다. 쿼리 실행 계획이 최적이 아닌 경우 성능이 느려지고 예측하기 어려울 수 있습니다.
'JIT ANALYZE'는 쿼리 실행 중에 Iceberg 테이블의 통계를 자동으로 수집하고 활용하는 새로운 Amazon Redshift 기능으로, 수동 통계 수집을 없애고 쿼리 엔진에 최적의 쿼리 실행 계획을 생성하는 데 필요한 정보를 제공합니다. 이 시스템은 지능형 휴리스틱을 사용하여 통계의 이점을 활용할 쿼리를 식별하고, 간단한 스케치 데이터 구조를 유지하며, 고품질의 테이블 수준 및 열 수준 통계를 작성합니다. JIT ANALYZE는 미리 계산된 통계가 있는 쿼리와 동등한 수준의 성능을 즉시 제공하는 동시에 많은 다른 성능 최적화를 위한 기반을 제공합니다.
Apache Iceberg 테이블용 Amazon Redshift JIT ANALYZE 기능은 현재 Amazon Redshift가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 사용자는 이 새로운 데이터 레이크 쿼리 최적화를 활용하기 위해 설정을 변경하거나 활성화할 필요가 없습니다. 시작하려면 Amazon Redshift 관리 안내서의 설명서 페이지를 참조하세요.