Amazon Athena for Apache Spark

Apache Spark で 1 秒以内にインタラクティブ分析を実行する

Apache Spark の Athena を選ぶ理由は?

Amazon Athena for Apache Spark を使用してインタラクティブな分析を 1 秒未満で開始し、ペタバイト規模のデータを分析しましょう。インタラクティブな Spark アプリケーションは、最適化された Spark ランタイムで即座に起動し、より高速に実行されるため、結果を待つことなく、インサイトにより多くの時間を費やすことができます。Athena コンソールまたは Athena API を通じて、簡素化されたノートブックエクスペリエンスで Python の表現力を利用し Spark アプリケーションを構築します。Athena サーバーレスのフルマネージドモデルでは、管理、プロビジョニング、および設定するリソースはなく、最低料金や設定コストもありません。実行したクエリについての料金のみをお支払いいただきます。

利点

結果を待つのではなく、インサイトにより多くの時間を費やしましょう。インタラクティブな Spark アプリケーションは、最適化された Spark ランタイムにより 1 秒未満で起動し、高速に実行されます。
人気のあるオープンソースの Spark フレームワークで Python の表現力を使用して、データからより複雑なインサイトを入手しましょう。ノートブックを使用して、データのクエリを実行し、計算をチェ―ニングし、結果を視覚化します。
リソースのプロビジョニングや管理を行うことなく、Spark アプリケーションを費用対効果の高い方法で実行しましょう。Spark の設定やバージョンのアップグレードを気にすることなく、Spark アプリケーションを構築できます。
データを移動することなく、オープンデータ形式で、ビジネスアプリケーションを使用して、さまざまなデータレイク内のデータを操作できます。AWS Glue によって検出および分類されたデータを使用して、Spark のインサイトを構築しましょう。

ユースケース

Athena と AWS Glue を使用して、データセットを探索し、データを操作します。 

さまざまなデータセットやデータ形式をまとめて表示して、インサイトを生成します。

Athena for Apache Spark を使用してインタラクティブにデータを操作する SaaS アプリケーションを構築します。

データストアを探索して、サンプルデータセットを生成し、インタラクティブな特徴の生成を行います。