投稿日: Aug 20, 2019

EMR Notebooks を使用して、ランタイム時に EMR クラスターに外部の Python ライブラリをインストールできるようになりました。これまでは、EMR クラスターを起動する前にブートストラップアクションまたはカスタム AMI を使用し、AMI でパッケージ化されていないライブラリを追加でインストールする必要がありました。本機能によって、ご希望のライブラリをインポートして、ご自分の Spark アプリケーションの構築、データ分析、ノートブックからの結果の可視化ができます。EMR ノートブックを使用してインストールした Python は、ノートブックセッションとは隔離されており、EMR クラスター上の既存のライブラリに干渉することはありません。外部ライブラリは、パブリックまたはプライベートの PyPI リポジトリのどちらからでもインポート可能です。本機能の詳細については、Using Notebook-scoped Libraries をご覧ください。

本機能は EMR リリース 5.26.0 から利用可能です。

EMR ノートブックは、米国東部 (バージニア北部、オハイオ)、米国西部 (北カリフォルニア、オレゴン)、カナダ (中部)、欧州 (フランクフルト、アイルランド、ロンドン)、アジアパシフィック (ムンバイ、ソウル、シンガポール、シドニー、東京) の各リージョンで利用できます。