게시된 날짜: Apr 13, 2023
오늘 Amazon Redshift는 LZO 또는 ZSTD 같은 대체 압축 인코딩과 비교하여 문자열 기반 데이터 처리 속도를 5배에서 63배까지 높이는 성능 향상 기능을 추가로 도입했습니다. Amazon Redshift는 경량의 CPU 효율이 높은 딕셔너리로 인코딩된 문자열 열에 대한 벡터화된 스캔을 통해 이를 달성함으로써 데이터베이스 엔진이 압축된 데이터에 대해 직접 운영할 수 있습니다. 이러한 기술은 카디널리티가 낮은 문자열 열(CHAR 또는 VARCHAR)에 최적입니다. 카디널리티가 낮은 문자열 열은 최대 수백 개의 고유 문자열 값이 있는 열입니다.
Amazon Redshift 데이터 웨어하우스에서 자동 테이블 최적화(ATO)를 활성화하여 향상된 새로운 고성능 문자열 기능의 이점을 자동으로 활용할 수 있습니다. 테이블에서 ATO를 활성화하지 않은 경우, Amazon Redshift 콘솔의 Amazon Redshift Advisor로부터 문자열 열의 BYTEDICT 인코딩 적합성에 대한 권장 사항을 받을 수 있습니다. 또한 BYTEDICT 인코딩을 사용하여 카디널리티가 낮은 문자열 열이 있는 새 테이블을 정의할 수 있습니다. Amazon Redshift의 향상된 문자열 기능은 이제 Amazon Redshift가 제공되는 모든 Amazon Web Service(AWS) 리전에서 사용할 수 있습니다.