Veröffentlicht am: Jun 14, 2018
Ab sofort können Sie JupyterHub auf Amazon EMR mit EMR Release 5.14.0 verwenden. JupyterHub ist ein Server für mehrere Benutzer von Jupyter Notebook; er stellt für jeden einzelnen Benutzer eine eigene Jupyter Notebook-Schnittstelle bereit. Mehrere Benutzer können damit gleichzeitig Jupyter Notebooks verwenden, Code erstellen und ausführen sowie zur Explorationsforschung Daten analysieren. JupyterHub auf EMR ist mit dem Spark-Framework integriert. Das heißt, Sie können auf EMR-Clustern mit Scala, PySpark, Spark R und Spark SQL-Kernels interaktive Spark-Abfragen ausführen. Es ist auch möglich, lokal Python-Jobs auszuführen und die vielen Data-Science-Bibliotheken zu nutzen, die auf Ihrem Notebook vorinstalliert sind. Mit EMR Release 5.14.0 unterstützt EMRFS, der Amazon EMR-Konnektor für S3, jetzt Audits von Benutzern, die Abfragen mit Datenaufrufen in S3 über EMRFS ausgeführt haben. Diese Funktion ist standardmäßig aktiviert und gibt Benutzer- und Gruppeninformationen an Auditprotokolle wie CloudTrail weiter. Sie können damit Anforderungen umfassend nachverfolgen. Neben Auditing bietet EMRFS Funktionen wie eine konsistente Ansicht, Verschlüsselung auf S3-Serverseite und -Clientseite sowie eine fein abgestimmte Autorisierung für S3.
Sie können JupyterHub starten, indem Sie beim Konfigurieren und Starten Ihres Clusters „JupyterHub“ aus der Liste der zu installierenden Anwendungen auswählen. Bitte konsultieren Sie die Amazon EMR-Dokumentation für weitere Informationen über EMR Release 5.14.0, JupyterHub und EMRFS.
Amazon EMR-Version 5.14.0 ist in allen unterstützten Regionen für Amazon EMR verfügbar.