게시된 날짜: Jun 26, 2020
Amazon Athena에 고도로 분할된 테이블의 쿼리 처리 속도를 빠르게 해주고 파티션 관리를 자동화하는 데 쓸 수 있는 새로운 기능인 Partition Projection 지원이 추가되었습니다.
Athena는 쿼리를 처리할 때 AWS Glue 데이터 카탈로그나 Hive Metastore와 같은 메타데이터 스토어에서 메타데이터 정보를 검색한 뒤 파티션 잘라내기를 수행합니다. 테이블에 대량의 파티션이 포함된 경우, 메타데이터를 검색하는 데 시간이 오래 걸릴 수 있습니다. Partition Projection을 사용하면 이런 상황을 피할 수 있습니다. Partition Projection을 사용하면 파티션을 형성하는 데 공통적으로 사용된 패턴(예를 들어 YYYY/MM/DD)과 같은 구성 정보를 지정할 수 있습니다. 이를 통해 Athena에 메타데이터 스토어에서 메타데이터 정보를 검색하지 않고도 파티션을 구축하기 위해 필요한 정보를 제공합니다. Athena는 AWS Glue 데이터 카탈로그와 같은 리포지토리에서가 아닌 구성에서 파티션 값과 위치를 읽습니다. Partition Projection은 메모리 내 작업이 원격 작업보다 빨리 처리될 때가 많기 때문에 고도로 분할된 테이블에 대한 쿼리 런타임을 단축합니다.
자세한 내용과 사용 예제는 설명서를 참조하세요.