投稿日: Nov 26, 2019
Amazon Athena により、ユーザーはリレーショナル、非リレーショナル、オブジェクト、およびカスタムデータソースに保存されているデータについて SQL クエリを実行することができます。フェデレーティッドクエリで、ユーザーは単一の SQL クエリを送信して、オンプレミスで実行されている、もしくはクラウドでホストされている複数のソースのデータをスキャンすることができます。
数々のアプリケーションに散らばったデータを分析する作業は、複雑で時間がかかる可能性があります。分析に必要なデータはしばしば、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳データストアに散らばっています。これらのソースのデータを分析するには、複雑なパイプラインを構築して抽出、変換、およびデータウェアハウスへのロードを行ってデータのクエリが行えるようにします。さまざまなソースからデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。Athena におけるフェデレーティッド SQL クエリでは、存在するあらゆる場所からデータインプレースのクエリを行えるようにすることでこのような複雑性を排除しています。複数のデータソース全体で馴染みの SQL コンストラクトを使用してデータを結合して解析を迅速に行える上、その後の使用のために結果を Amazon S3 に保存することができます。
Athena は、AWS Lambda 上で動作する Athena Data Source コネクタを使用して、フェデレーティッドクエリを実行します。AWS は、Amazon DynamoDB、Apache HBase、Amazon Document DB、Amazon Redshift、AWS CloudWatch、AWS CloudWatch Metrics、および Apache 2.0 ライセンス下の MySQL や PostgreSQL など、JDBC 準拠のリレーショナルデータベースに向けたオープンソースデータソースコネクタを持っています。お客様はこれらのコネクタを使用して、これらのデータソースにおいて Athena でフェデレーティッド SQL クエリを実行することができます。さらに、Athena Query Federation SDK を使用することで、開発者はデータソースへのコネクタを構築して Athena を有効化し、そのデータソースに対して SQL クエリを実行することができます。Athena Query Federation Connector は、AWS が提供したコネクタ以上にフェデレーティッドクエリの利点を拡大します。コネクタは AWS Lambda 上で動作するため、インフラストラクチャを管理したり、需要ピークに向けた拡大を計画する必要がありません。