Amazon Athena はインタラクティブなクエリサービスで、Amazon S3 内のデータを標準 SQL を使用して簡単に分析できます。Athena はサーバーレスなので、インフラストラクチャの管理は不要です。実行したクエリに対してのみ料金が発生します。
Athena は簡単に使えます。操作は簡単で、Amazon S3 にあるデータを指定し、スキーマを定義し、標準的な SQL を使用してクエリの実行を開始するだけです。多くの場合、数秒で結果が出てきます。Athena を使用すると、分析用データを準備するための複雑な ETL ジョブは不要になります。これによって、誰でも SQL のスキルを使って、大型データセットをすばやく、簡単に分析できるようになります。
Athena は初期状態で AWS Glueデータカタログと統合されており、さまざまなサービスにわたるメタデータの統合リポジトリを作成できます。データソースのクロールとスキーマの解析、新規および修正したテーブル定義とパーティション定義のカタログへの入力、スキーマのバージョニング保持が可能です。
利点
今すぐクエリを開始する
サーバーレス、ETLなし
Athena はサーバーレスです。すぐにデータのクエリを実行できるため、サーバーやデータウェアハウスの設定や管理は不要です。Amazon S3 にあるデータを指定して、スキーマを定義し、組み込まれているクエリエディタを使ってクエリを開始できます。Amazon Athena を使用すると、S3 にあるユーザーのすべてのデータを利用できるため、データの抽出、変換、ロード (ETL) といった複雑なプロセスは必要ありません。
クエリごとの料金
スキャンしたデータに対してのみ支払い
Amazon Athena では、実行するクエリに対してのみ料金が発生します。クエリごとにスキャンされたデータの分量に基づいて料金が請求され、1 テラバイトごとに 5 USD が請求されます。データの圧縮、分割、列形式への変換を行うことにより、クエリに対するコストを 30%~90% 削減し、パフォーマンスを向上させることができます。Athena では、Amazon S3 にあるデータのクエリが直接実行されます。S3 以外の追加のストレージ料金は発生しません。
オープン、高性能、標準
Presto ビルド、標準 SQL 実行
Amazon Athena には ANSI SQL に準拠した Presto が使われており、CSV、JSON、ORC、Parquet などのさまざまな標準データフォーマットに対応し、機能します。Athena は迅速で、アドホックなクエリ問い合わせ方法として理想的です。とはいえ、大きな結合、ウィンドウ関数、配列などの複雑な分析も対応できます。Amazon Athena は可用性が高く、多くの施設や各施設にある多くのデバイスから、コンピューティングリソースを使ってクエリを実行できます。Amazon Athena は、基盤となるデータストアとして Amazon S3 を使用しており、データの可用性や耐久性に優れています。
高速、超高速
大きなデータセットに対してもインタラクティブなパフォーマンス
Amazon Athena を使えば、高速で、インタラクティブなクエリパフォーマンスが得るために十分なコンピューティングリソースがあるかどうかを心配する必要はありません。Amazon Athena では、クエリが自動的に並列で実行されます。そのため、たいていは数秒で結果が出ます。