Amazon Athena는 표준 SQL을 사용해 Amazon S3에 있는 데이터를 직접 간편하게 분석할 수 있는 대화형 쿼리 서비스입니다. 고객은 AWS Management Console에서 클릭 몇 번으로 Athena가 S3에 저장된 데이터를 가리키도록 하고 표준 SQL을 사용하여 임시 쿼리를 실행한 후 몇 초 만에 결과를 얻을 수 있습니다. Athena는 서버리스 서비스이므로 설정하거나 관리할 인프라를 없으며 고객은 실행한 쿼리에 대해서만 비용을 지불하면 됩니다. Athena를 사용하여 로그를 처리하고 임시 분석을 수행하며 대화형 쿼리를 실행할 수 있습니다. Athena는 자동으로 확장되어 쿼리를 병렬로 실행하므로 데이터 세트가 크고 쿼리가 복잡해도 결과를 빠르게 얻을 수 있습니다. 

Amazon Athena는 현재 상용 버전으로 사용할 수 있음

지금 Athena 사용해 보기

시작하는 방법은 간단합니다. 데이터 세트를 Amazon S3에 업로드하고, Amazon Athena를 시작한 후 쿼리를 실행하면 됩니다.

AWS 프리 티어 세부 정보 보기 »

100x100_benefit_cloud

Amazon Athena는 서버리스 서비스이므로 관리할 인프라가 없습니다. 사용자 수와 데이터 세트의 증가에 따른 인프라 구성, 소프트웨어 업데이트, 장애 또는 확장에 대해 걱정할 필요가 없습니다. Athena에서 이 모든 작업을 자동으로 처리하므로 사용자는 인프라가 아니라 데이터에 집중할 수 있습니다.  

100x100_benefit_easy-setup

시작하려면 Athena 콘솔에 로그인하고, 콘솔 마법사를 사용하거나 DDL 문을 입력하여 스키마를 정의하고, 기본 쿼리 편집기를 사용하여 즉시 쿼리를 시작하면 됩니다. AWS Glue를 사용해 데이터 원본을 자동으로 크롤링하여 데이터를 검색하고 데이터 카탈로그를 신규 및 수정된 테이블 정의와 파티션 정의로 채울 수 있습니다. 몇 초 이내에 콘솔에 결과가 표시되며 선택한 S3 위치에 자동으로 작성됩니다. 또한 결과를 데스크톱으로 다운로드할 수도 있습니다. Athena에서는 데이터 분석을 준비하기 위한 복잡한 ETL 작업이 필요 없습니다. 따라서 SQL을 다룰 수 있는 사람은 누구나 신속하게 대규모 데이터 세트를 분석할 수 있습니다.  

100x100_benefit_check

Amazon Athena는 지연 시간이 짧은 데이터 임시 분석에 최적화된 오픈 소스 분산 SQL 쿼리 엔진인 Presto를 사용합니다. 즉, ANSI SQL을 사용하여 Amazon S3의 대규모 데이터 세트를 대상으로 쿼리를 실행할 수 있으며, 대규모 조인, 창 함수 및 어레이가 모두 지원됩니다. Athena는 CSV, JSON, ORC, Avro 또는 Parquet와 같은 다양한 종류의 데이터 형식을 지원합니다. 또한 Athena의 JDBC 드라이버를 사용하여 다양한 BI 도구에서 Athena에 연결할 수 있습니다.

100x100_benefit_pay-as-you-go

Amazon Athena에서는 실행한 쿼리에 대한 비용만 지불합니다. 각 쿼리에서 스캔한 데이터 양에 따라 요금이 부과됩니다. 데이터를 압축 또는 파티셔닝하거나 컬럼 형식으로 변환하면 Athena가 쿼리를 실행하기 위해 스캔해야 하는 데이터 양이 감소하므로 비용을 대폭 절감하고 성능을 높일 수 있습니다.

100x100_benefit_performance

Amazon Athena에서는 빠른 성능을 얻기 위해 클러스터를 관리하거나 튜닝하는 데 신경을 쓸 필요가 없습니다. Athena는 Amazon S3에서 빠른 성능을 내도록 최적화되어 있습니다. Athena는 자동으로 쿼리를 병렬로 실행하므로 대규모 데이터 세트에서도 몇 초 만에 쿼리 결과를 얻을 수 있습니다.

100x100_benefit_available

Amazon Athena는 가용성이 뛰어난 데다 여러 시설에서 컴퓨팅 리소스를 사용하여 쿼리를 실행하며, 특정 시설에 도달할 수 없는 경우에는 쿼리를 자동으로 라우팅합니다. Athena는 Amazon S3를 기본 데이터 스토어로 사용하여 데이터 가용성과 내구성을 높입니다. Amazon S3는 중요한 데이터를 저장할 수 있고 99.999999999%의 객체 내구성을 보장하도록 설계된 내구성이 뛰어난 인프라를 제공합니다. 데이터가 여러 시설과 각 시설의 여러 디바이스에 중복 저장됩니다.

100x100_benefit_secure

Amazon Athena를 사용하면 AWS Identity and Access Management(IAM) 정책, 액세스 통제 목록(ACL) 및 Amazon S3 버킷 정책을 사용하여 데이터에 대한 액세스를 제어할 수 있습니다. IAM 정책을 사용해 IAM 사용자에게 S3 버킷에 대한 세분화된 제어 권한을 부여할 수 있습니다. S3에서 데이터에 대한 액세스를 제어하면 사용자들이 Athena를 사용하여 데이터를 쿼리하지 못하도록 제한할 수 있습니다. Athena를 사용하면 Amazon S3에 저장된 암호화된 데이터를 빠르게 쿼리하고 S3 버킷에 암호화된 결과를 다시 쓸 수 있습니다. 서버 측 암호화 및 클라이언트 측 암호화가 모두 지원됩니다.

100x100_benefit_ingergration

Amazon Athena는 즉시 AWS Glue와 통합됩니다. AWS Glue 데이터 카탈로그를 사용하면, 다양한 서비스에 걸쳐 통합된 메타데이터 리포지토리를 생성하고, 데이터 원본을 크롤링하여 스키마를 검색하고 카탈로그를 신규 및 수정된 테이블 정의와 파티션 정의로 채우고, 스키마 버전을 관리할 수 있습니다. 또한, Glue의 완전관리형 ETL 기능을 사용하면 데이터를 변환하거나 데이터를 컬럼 형식으로 변환하여 쿼리 성능을 최적화하고 비용을 절감할 수 있습니다. AWS Glue에 대해 자세히 알아보십시오.