投稿日: Jun 14, 2018

Amazon EMR のリリース 5.14.0 で JupyterHub が使用できるようになりました。 JupyterHub は各ユーザーに独自の Jupyter ノートブックインターフェイスを提供するマルチユーザー Jupyter ノートブックサーバーです。複数ユーザーが Jupyter ノートブックを同時に使用し、コードを作成および実行し、探索的なデータ分析を実行することができます。EMR 上の JupyterHub は Spark フレームワークと統合され、Scala、PySpark、Spark R、Spark SQL カーネルを使用した EMR クラスター上で対話型 Spark クエリを実行することが可能です。Python ジョブをローカルで実行し、ノートブックに予めインストールされている多くの一般的なデータサイエンスライブラリを利用することもできます。現在、EMR リリース 5.14.0 では、S3 用の Amazon EMR コネクターである EMRFS が、EMRFS を介して S3 のデータにアクセスしたクエリを実行したユーザーの監査をサポートしています。この機能はデフォルトで有効であり、ユーザーやグループ情報を CloudTrail のような監査ログに渡し、包括的な要求追跡を提供します。監査の他にも、EMRFS は 一貫性のあるビューS3 サーバー側およびクライアント側での暗号化S3 に対する詳細な権限許可などの機能を提供します。

クラスターを設定して起動するときにインストールするアプリケーションの一覧から「JupyterHub」を選択すると、JupyterHub を起動できます。EMR リリース 5.14.0JupyterHubEMRFS の詳細については『Amazon EMR ドキュメント』をご覧ください。

Amazon EMR リリース 5.14.0 は、Amazon EMR がサポートされているすべてのリージョンで利用できます。