張貼日期: Jun 14, 2018

您現在可以透過 EMR 5.14.0 版在 Amazon EMR 上使用 JupyterHub。JupyterHub 是一個多使用者 Jupyter 筆記本伺服器,可為每位使用者提供個別的 Jupyter 筆記本介面。本伺服器可讓多位使用者同時使用他們的 Jupyter 筆記本、建立並執行程式碼,以及執行探索型資料分析。EMR 上的 JupyterHub 與 Spark 架構整合,可讓您在 EMR 叢集上利用 Scala、PySpark、Spark R 和 Spark SQL 內核執行互動式 Spark 查詢。您也可以於本機執行 Python 工作,並善用預先安裝在筆記本中的多個熱門資料科學程式庫。EMR 5.14.0 版發行後,EMRFS (Amazon EMR 連接 S3 的管道) 可支援使用者稽核,其對象為執行透過 EMRFS 存取 S3 中資料之查詢的使用者。本功能為預設功能,將提供使用者和群組資訊,以便稽核 CloudTrail 這類的記錄,讓您可全面追蹤請求。除了稽核以外,EMRFS 也提供多項功能,例如一致性檢視S3 伺服器端與用戶端加密以及對 S3 的詳細授權

設定和啟動叢集時,您可以從待安裝的應用程式清單中選擇「JupyterHub」以啟動 JupyterHub。如需有關 EMR 5.14.0 版JupyterHubEMRFS 的詳細資訊,請參閱 Amazon EMR 文件。

Amazon EMR 5.14.0 版已在所有支援 Amazon EMR 的區域提供。