Amazon Athena は、標準 SQL を使用して Amazon S3 内のデータを直接、簡単に分析するインタラクティブなクエリサービスです。AWS マネジメントコンソールで数回クリックするだけで、お客様は Athena から S3 に格納されたデータにアクセスし、標準 SQL を使用してアドホッククエリを実行できます。結果は数秒で表示されます。Athena はサーバーレスなので、セットアップや管理が必要なインフラストラクチャはありません。料金は、実行するクエリに対してのみ発生します。Athena を使用すると、ログを処理し、アドホック分析やインタラクティブなクエリを実行できます。Athena は自動的にスケールされ、並列して複数のクエリが実行されるため、データセットの容量が大きく、クエリが複雑でも、短時間で結果が表示されます。 

Amazon Athena が一般公開されました

Athena を今すぐ試す

使用を開始するのは簡単です。データセットを Amazon S3 にアップロードし、Amazon Athena を起動して、クエリを開始するだけです。

AWS 無料利用枠の詳細はこちら »

100x100_benefit_cloud

Amazon Athena はサーバーレスであるため、インフラストラクチャを管理する必要がありません。設定、ソフトウェアの更新、障害、またはデータセットやユーザー数の拡大によるインフラストラクチャのスケーリングについて心配する必要はありません。Athena ではこのようなタスクすべてが自動で管理されるため、インフラストラクチャではなくデータに集中できます。 

100x100_benefit_easy-setup

利用を開始するには、Athena コンソールにログインして、コンソールウィザードを使用するか DDL ステートメントを入力してスキーマを定義します。その後、組み込みのクエリエディタを使用して、すぐにクエリを開始できます。また、AWS Glue を利用すると、自動的にデータソースをクロールしてデータを解析し、データカタログに新規および修正したテーブル定義とパーティション定義を入力できます。結果は数秒以内にコンソールに表示され、S3 内の選択した場所に自動的に書き込まれます。結果をデスクトップにダウンロードすることもできます。Athena では、分析用のデータを準備するための複雑な ETL ジョブは必要ありません。このため、誰でも、SQL のスキルを使って、大規模なデータセットを簡単に分析できます。

100x100_benefit_check

Amazon Athena では Presto が使用されます。Presto は、データを低レイテンシーでアドホック分析するために最適化された、オープンソースの分散 SQL クエリエンジンです。つまり、大規模な結合、ウィンドウ関数、配列を完全にサポートしている ANSI SQL を使用して、Amazon S3 内の大規模なデータセットに対してクエリを実行できることになります。Athena では、CSV、JSON、ORC、Avro、Parquet といったさまざまなデータ形式がサポートされています。Athena の JDBC ドライバーを使用して、さまざまな BI ツールから Athena に接続することもできます。

100x100_benefit_pay-as-you-go

Amazon Athena では、実行するクエリに対してのみ料金が発生します。各クエリでスキャンされるデータ量に基づいて課金されます。データの圧縮、分割、列形式への変換を行うと、大幅なコスト削減とパフォーマンス向上を実現できます。このようなオペレーションにより、Athena でクエリを実行するためにスキャンする必要のあるデータ量が減少するためです。

100x100_benefit_performance

Amazon Athena では、パフォーマンスを高速化するためのクラスターの管理やチューニングについて心配する必要はありません。Athena は、Amazon S3 で迅速なパフォーマンスを発揮できるように最適化されています。Athena ではクエリが自動的に並列で実行されるため、大規模なデータセットであってもクエリ結果が数秒で表示されます。

100x100_benefit_available

Amazon Athena は可用性が高く、複数の施設にまたがるコンピューティングリソースを使用してクエリが実行されます。また、特定の施設にアクセスできない場合は、クエリが自動で適切にルーティングされます。Athena では Amazon S3 を基盤データストアとして使用しているため、データの高い可用性と耐久性が実現できます。Amazon S3 は重要なデータを保存するための耐久性のあるインフラストラクチャを提供し、オブジェクトの 99.999999999% の耐久性を実現するように設計されています。データは冗長化されて複数の施設に保存され、各施設では複数のデバイスに保存されます。

100x100_benefit_secure

Amazon Athena では、AWS Identity and Access Management (IAM) ポリシー、アクセスコントロールリスト (ACL)、および Amazon S3 バケットポリシーを使用して、データへのアクセスを制御できます。IAM ポリシーを使うと、IAM ユーザーに対して S3 バケットへのアクセスをきめ細かく制御できます。S3 内のデータへのアクセスを制御することで、Athena を使用してクエリを実行するユーザーを制限できます。Athena を使用することにより、Amazon S3 に保存された暗号化データをクエリし、S3 バケットに暗号化の結果を書き込むことが簡単になります。サーバー側の暗号化とクライアント側の暗号化の両方がサポートされています。

100x100_benefit_ingergration

Amazon Athena は初期状態で AWS Glue と統合されています。Glue データカタログでは、さまざまなサービスにわたるメタデータの統合リポジトリを作成できます。データソースのクロールとスキーマの解析、新規および修正したテーブル定義とパーティション定義のデータカタログへの入力、スキーマのバージョニング保持が可能です。また、Glue の完全マネージド型 ETL 機能を使用すると、データ変換や列指向の形式への変更を実行でき、クエリパフォーマンスを改善してコストを削減できます。詳細については、AWS Glue をご覧ください。