게시된 날짜: Nov 20, 2023
Amazon Redshift는 이제 AWS Glue 데이터 카탈로그에 저장된 열 수준 통계를 활용해 최적화된 쿼리 계획을 생성하여 데이터 레이크 쿼리 성능을 개선할 수 있습니다.
AWS Glue가 AWS Glue 데이터 카탈로그에서 열 수준 통계를 지원함에 따라 고객은 최소값 및 최대값, 각 열의 구별되는 값 수와 같은 통계 정보를 저장할 수 있습니다. 이제 Amazon Redshift는 AWS Glue에서 이 정보를 자동으로 검색한 다음 통계를 사용하여 쿼리 계획을 최적화하고 데이터 레이크 쿼리의 성능을 개선합니다. 최근에 도입된 열 수준 통계를 생성하는 AWS Glue 기능을 통해 이 정보를 수동으로 채우는 대신 데이터 레이크 테이블에서 통계 정보를 자동으로 수집하고 열 수준 통계를 업데이트할 수 있습니다.
시작하려면 AWS Glue 콘솔 또는 AWS Glue API를 사용하여 데이터 레이크 테이블에 대한 열 통계를 생성한 다음 자동 탑재된 Glue 카탈로그 또는 외부 스키마를 사용하여 Redshift에서 이러한 테이블에 대해 쿼리를 실행할 수 있습니다.
AWS Glue 열 수준 통계를 사용하는 Amazon Redshift 데이터 레이크 쿼리 계획 최적화 기능은 Amazon Redshift Spectrum 또는 Amazon Redshift Serverless가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 자세히 알아보려면 Amazon Redshift 데이터베이스 개발자 안내서 및 AWS Glue 설명서를 참조하세요.