投稿日: Nov 30, 2022

Amazon Athena は、あらゆるサイズのデータに対する高速な分析ワークロード向けに最適化された、人気の高いオープンソースの分散処理システムである Apache Spark をサポートするようになりました。Athena は、データレイク、データベース、その他のデータストアなど、ペタバイトクラスのデータが格納されているストレージへのクエリを支援するインタラクティブなクエリサービスです。Amazon Athena for Apache Spark では、SQL に加えて、Spark を用いた Athena の効率的でインタラクティブなサーバーレス環境を実現できます。

Athena コンソールや Athena API の簡素化されたノートブック環境により、インタラクティブな Apache PySpark アプリケーションを構築できます。Athena では、最適化された Spark ランタイムを使ってインタラクティブな Spark アプリケーションが 1 秒未満で起動し、高速に実行され、即座に結果を出力するため、より多くの時間をインサイトの獲得に費やすことができます。また、Athena がインフラストラクチャの管理と Spark の設定を行うため、お客様はビジネスアプリケーションに専念できます。

Athena for Apache Spark は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (東京)、欧州 (アイルランド) の 5 つの AWS リージョンで利用可能です。また、今後数か月のうちに新たなリージョンでも利用可能になる予定です。

詳細と開始方法については、Amazon Athena for Apache Spark のウェブページをご覧ください。