投稿日: Nov 26, 2019

Amazon Athena により、ユーザーはリレーショナル、非リレーショナル、オブジェクト、およびカスタムデータソースに保存されているデータについて SQL クエリを実行することができます。フェデレーティッドクエリで、ユーザーは単一の SQL クエリを送信して、オンプレミスで実行されている、もしくはクラウドでホストされている複数のソースのデータをスキャンすることができます。

数々のアプリケーションに散らばったデータを分析する作業は、複雑で時間がかかる可能性があります。分析に必要なデータはしばしば、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳データストアに散らばっています。これらのソースのデータを分析するには、複雑なパイプラインを構築して抽出、変換、およびデータウェアハウスへのロードを行ってデータのクエリが行えるようにします。さまざまなソースからデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。Athena におけるフェデレーティッド SQL クエリでは、存在するあらゆる場所からデータインプレースのクエリを行えるようにすることでこのような複雑性を排除しています。複数のデータソース全体で馴染みの SQL コンストラクトを使用してデータを結合して解析を迅速に行える上、その後の使用のために結果を Amazon S3 に保存することができます。

Athena は、AWS Lambda 上で動作する Athena Data Source コネクタを使用して、フェデレーティッドクエリを実行します。AWS は、Amazon DynamoDBApache HBaseAmazon Document DBAmazon RedshiftAWS CloudWatchAWS CloudWatch Metrics、および Apache 2.0 ライセンス下の MySQLPostgreSQL など、JDBC 準拠のリレーショナルデータベースに向けたオープンソースデータソースコネクタを持っています。お客様はこれらのコネクタを使用して、これらのデータソースにおいて Athena でフェデレーティッド SQL クエリを実行することができます。さらに、Athena Query Federation SDK を使用することで、開発者はデータソースへのコネクタを構築して Athena を有効化し、そのデータソースに対して SQL クエリを実行することができます。Athena Query Federation Connector は、AWS が提供したコネクタ以上にフェデレーティッドクエリの利点を拡大します。コネクタは AWS Lambda 上で動作するため、インフラストラクチャを管理したり、需要ピークに向けた拡大を計画する必要がありません。

Athena フェデレーティッドクエリは、us-east-1 (バージニア北部) リージョンのプレビューで利用することができます。これらのステップに従って、プレビューを開始することができます。
この機能の詳細については、こちらのドキュメントを参照してください。
既存のコネクタの使用を開始するには、このガイドに従ってください。
Athena Query Federation SDK を使用してご自分のデータソースコネクタを構築する方法については、このリンク先を開いてください。