投稿日: Nov 19, 2018

本日付で、Jupyter Notebook に基づくマネージド環境である、EMR ノートブックの一般提供開始を発表いたします。EMR ノートブックでは、データサイエンティスト、アナリスト、および開発者が EMR クラスターを使用してデータを準備して可視化し、同業者と共同作業を行い、アプリケーションを構築して、インタラクティブな分析を実行できるようにします。

EMR ノートブックは、Spark 向けに事前設定されています。Spark のマジックカーネルをサポートしているため、PySpark、Spark SQL、Spark R、Scala などの言語で記述された Spark ジョブを EMR クラスターでインタラクティブに実行できます。このノートブックは、Conda にあるオープンソースライブラリと共にパッケージ化されているため、ユーザーはこれらのライブラリをインポートして使用し、データを操作したり、計算結果をリッチなグラフィカルプロットで可視化したりできます。さらに、各ノートブックには Spark モニタリング機能が統合されています。これにより、ジョブの進捗状況をモニタリングして、ノートブックからコードを直接デバッグできます。

複数のノートブックをコンソールから直接作成できます。管理が必要なソフトウェアやインスタンスはありません。また、ノートブックは即座にスピンアップするため、ノートブックを既存のクラスターにアタッチすることも、新しいクラスターをコンソールから直接プロビジョングすることもできます。複数のノートブックを単一のクラスターにアタッチすることや、ノートブックをデタッチして新しいクラスターに再度アタッチすることができます。

EMR ノートブックでは、ノートブックファイルをお使いの Amazon S3 バケットに定期的に保存します。保存されたノートブックは、EMR コンソールから取得することも、S3 バケットからダウンロードすることもできます。

詳細については、EMR ノートブックのページをご覧ください。

EMR ノートブックの使用に関して追加コストが発生することはありません。料金は、ノートブックにアタッチされた EMR クラスターについてのみです。お使いのクラスターの料金設定に関する詳細については、Amazon EMR の料金をご覧ください。

EMR ノートブックは、米国東部 (バージニア北部、オハイオ)、米国西部 (北カリフォルニア、オレゴン)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー、東京) の各リージョンで利用できます。