게시된 날짜: Oct 11, 2018

Amazon Athena는 표준 SQL을 사용해 Amazon S3에 저장된 데이터를 간편하게 분석할 수 있는 대화식 쿼리 서비스입니다. Athena는 서버리스 서비스이므로 관리할 인프라가 없으며 실행한 쿼리에 대해서만 비용을 지불하면 됩니다. 오늘부터 Select 쿼리 결과를 사용한 테이블 생성 지원하거나 기능, 즉 CTAS(Create Table As Select) 문 지원을 시작합니다. 분석가는 데이터의 하위 집합 또는 열의 하위 집합에서 CTAS 문을 사용하여 기존 테이블에서 새 테이블을 생성할 수 있습니다. 또한 데이터를 열 형식(예: Apache Parquet 및 Apache ORC)으로 변환한 후 이를 분할할 수도 있습니다. Athena는 결과 테이블 및 파티션을 Glue 데이터 카탈로그에 자동으로 추가하기 때문에 향후 쿼리에서 이를 바로 사용할 수 있습니다. 기본적으로, Athena의 CTAS 문은 Parquet 형식으로 데이터를 씁니다. 지원되는 다른 형식에는 Apache ORC, AVRO, JSON 및 텍스트가 있으며 압축 형식으로 Gzip 또는 Snappy를 사용할 수도 있습니다. 또한 열 단위로 데이터를 버킷 처리하거나 암호화할 수도 있습니다.

CTAS 문을 사용하면 사용자가 큰 테이블을 기반으로 만든 작은 테이블에서 쿼리를 실행할 수 있도록 함으로써 비용을 줄이고 성능을 향상시킬 수 있습니다. 예를 들어, CTAS 문을 사용하여 JSON 형식의 데이터가 있는 서로 다른 두 테이블에서 특정 열을 선택하여 결과를 Parquet과 같은 열 형식으로 변환한 후 테이블을 Glue 데이터 카탈로그에 단일 문으로 추가하여 향후 쿼리를 더 쉽고, 빠르고, 저렴하게 할 수 있는 테이블을 생성할 수 있습니다. CTAS 문을 사용하면 분석가가 더 이상 데이터 엔지니어링 팀에 의존하여 분석가의 특정 워크로드에 맞는 셀프 서비스 환경을 활성화하는 테이블을 생성할 필요가 없습니다. CTAS 문에 대한 추가 예시를 보려면 여기를 클릭합니다. CTAS 문은 Athena에서 Select 쿼리에 비용을 청구하는 방법과 유사하게 Select 문구에서 스캔한 바이트를 기반으로 비용이 청구됩니다.