投稿日: Jan 11, 2022

Amazon EMR Studio は、R、Python、Scala、PySpark で記述されたビッグデータおよび分析アプリケーションを、データサイエンティストやデータエンジニアが簡単に開発、視覚化、デバッグできるようにした統合開発環境 (IDE) です。本日、EMR Studio Workspace の機能として、SQL Explorer をご紹介します。この機能により、EMR Studio からデータカタログを参照し、EMR クラスターに対して SQL クエリを実行することができます。本リリースの SQL Explorer in EMR Studio は、Prestoバージョン 0.254.1 以降を実行している EC2 クラスター上の Amazon EMR における SQL クエリの実行をサポートしています。 

Presto は、複数のソースからの大規模なデータセットに対するインタラクティブな分析クエリ用に設計された高速 SQL クエリエンジンです。SQL Explorer では、Presto をインストールした EC2 クラスター上の Amazon EMR に接続し、データカタログを表示および閲覧することが可能です。サポートしているデータカタログには、AWS Glue Data Catalog およびセルフホスト型の Hive Metastore バージョン 3.1.2 以上が含まれます。SQL Explorer では、SQL クエリの実行、クエリ結果のテーブル表示、クエリ結果の csv 形式でのダウンロードを行う Editor も利用できます。また、異なる Editor タブを使用して、複数の SQL ステートメントを実行する機能も備えています。SQL Explorer は、Amazon EMR のバージョン 6.4.0 以上でサポートされています。

EMR Studio は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、カナダ (中部)、欧州 (アイルランド)、欧州 (フランクフルト)、欧州 (ロンドン)、欧州 (ストックホルム)、欧州 (パリ)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京) および南米 (サンパウロ) の各リージョンでご利用いただけます。

SQL Explorer in EMR Studio の詳細については、こちらのドキュメントを参照してください。機能の動作を確認するには、こちらのデモ動画をご覧ください。