게시된 날짜: Nov 26, 2019
이제 Amazon Athena를 사용하면 관계형, 비관계형, 객체 및 사용자 지정 데이터 원본에 저장된 데이터에 대해 SQL 쿼리를 실행할 수 있습니다. 연합 쿼리를 통해 고객은 온프레미스에서 실행되거나 클라우드에 호스팅된 여러 원본의 데이터를 스캔하는 단일 SQL 쿼리를 제출할 수 있습니다.
여러 애플리케이션에 걸쳐 분산된 데이터에 대한 분석을 실행하는 작업은 복잡하고 시간이 많이 소요될 수 있습니다. 분석에 필요한 데이터는 관계형, 키-값, 문서, 인 메모리, 검색, 그래프, 객체, 시계열 및 원장 데이터스토어에 분산되어 있는 경우가 많습니다. 이러한 원본에 분산되어 있는 데이터를 분석하기 위해 분석가들은 데이터를 쿼리할 수 있도록 추출 및 변환하고 데이터 웨어하우스로 로드하는 복잡한 파이프라인을 구축합니다. 여러 원본의 데이터에 액세스하려면 새로운 프로그래밍 언어와 데이터 액세스 구문을 학습해야 합니다. Athena의 연합 SQL 쿼리를 사용하면 데이터가 있는 위치에서 인 플레이스 쿼리를 실행할 수 있기 때문에 이러한 복잡성을 없앨 수 있습니다. 분석가는 익숙한 SQL 구문을 사용하여 여러 데이터 원본의 데이터를 결합하여 빠른 분석을 수행하고, 후속 사용을 위해 Amazon S3에 결과를 저장할 수 있습니다.
Athena는 AWS Lambda에서 실행되는 Athena 데이터 원본 커넥터를 사용하여 연합 쿼리를 실행합니다. AWS에는 Apache 2.0 라이선스 하에서 Amazon DynamoDB, Apache HBase, Amazon Document DB, Amazon Redshift, AWS CloudWatch, AWS CloudWatch Metrics 및 JDBC 호환 관계형 데이터베이스(예: MySQL 및 PostgreSQL)를 위한 오픈 소스 데이터 원본 커넥터가 있습니다. 고객은 이러한 커넥터를 사용하여 Athena에서 이러한 데이터 원본을 대상으로 연합 SQL 쿼리를 실행할 수 있습니다. 또한 개발자는 Athena Query Federation SDK를 사용하여 원하는 데이터 원본에 대한 커넥터를 구축함으로써 해당 데이터 원본에 대해 Athena로 SQL 쿼리를 실행할 수 있습니다. Athena Query Federation Connector는 AWS에서 제공하는 커넥터보다 훨씬 뛰어난 연합 쿼리 기능을 제공합니다. 커넥터가 AWS Lambda에서 실행되므로 고객은 인프라를 관리하거나 피크 요구 사항에 맞게 확장 계획을 세우지 않아도 됩니다.