投稿日: Aug 31, 2020
EMR Notebooks は、フルマネージドの Jupyter ベースのノートブックを、アドホックジョブを作成して実験するデータサイエンティストおよびエンジニアに提供するサービスです。EMR Notebooks を非インタラクティブに調整して、特に本番環境で ETL ワークロードを実行できるようになりました。この機能が登場するまでは、ノートブックを実行するには、AWS マネジメントコンソールを介した Jupyter User Interface アクセスが必要でした。
EMR Notebooks API により、AWS CLI および SDK によるノートブックへのアクセスが可能になるため、ノートブックを使用して自動化された方法で ETL ワークロードを実行できます。AWS Step Functions や Apache Airflow などの調整サービスを活用して、回復性の高いワークフローを構築し、cron スクリプトを使用して非インタラクティブな方法でスケジュールどおりにノートブックを実行できます。入力パラメータをノートブックに渡し、各実行の履歴出力にアクセスすることにより、ノートブックのすべての実行をデバッグすることもできます。この機能を使用する前に、入力値の新しい組み合わせごとに、ノートブックの新しいコピーを作成して変更する必要があります。
EMR Notebooks の開始方法については、EMR Notebooks のページをご覧ください。
この機能は、EMR Notebooks が利用可能なリージョンにおいて、5.18.0 以降の EMR リリースバージョンで利用できます。