張貼日期: Jun 14, 2018
您現在可以透過 EMR 5.14.0 版在 Amazon EMR 上使用 JupyterHub。JupyterHub 是一個多使用者 Jupyter 筆記本伺服器,可為每位使用者提供個別的 Jupyter 筆記本介面。本伺服器可讓多位使用者同時使用他們的 Jupyter 筆記本、建立並執行程式碼,以及執行探索型資料分析。EMR 上的 JupyterHub 與 Spark 架構整合,可讓您在 EMR 叢集上利用 Scala、PySpark、Spark R 和 Spark SQL 內核執行互動式 Spark 查詢。您也可以於本機執行 Python 工作,並善用預先安裝在筆記本中的多個熱門資料科學程式庫。EMR 5.14.0 版發行後,EMRFS (Amazon EMR 連接 S3 的管道) 可支援使用者稽核,其對象為執行透過 EMRFS 存取 S3 中資料之查詢的使用者。本功能為預設功能,將提供使用者和群組資訊,以便稽核 CloudTrail 這類的記錄,讓您可全面追蹤請求。除了稽核以外,EMRFS 也提供多項功能,例如一致性檢視、S3 伺服器端與用戶端加密以及對 S3 的詳細授權。
設定和啟動叢集時,您可以從待安裝的應用程式清單中選擇「JupyterHub」以啟動 JupyterHub。如需有關 EMR 5.14.0 版、JupyterHub 和 EMRFS 的詳細資訊,請參閱 Amazon EMR 文件。
Amazon EMR 5.14.0 版已在所有支援 Amazon EMR 的區域提供。