Inserito il: Jun 14, 2018
Puoi finalmente utilizzare JupyterHub su Amazon EMR con la versione di EMR 5.14.0. JupyterHub è un server notebook Jupyter multiutente che fornisce a ciascun utente la propria interfaccia notebook Jupyter. Consente a più utenti di utilizzare simultaneamente i loro notebook Jupyter, di creare ed eseguire codice e di eseguire analisi di dati esplorative. JupyterHub su EMR è integrato nel framework Spark e ti consente di eseguire query Spark interattive sui cluster EMR utilizzando i kernel Scala, PySpark, Spark R e Spark SQL. Puoi anche eseguire processi Python locali e sfruttare le molte diffuse librerie di scienza dei dati preinstallate sul tuo notebook. Ora, con la versione 5.14.0 di EMR, EMRFS, il connettore di Amazon EMR per S3, supporta la verifica degli utenti che eseguono query che hanno avuto accessi ai dati in S3 tramite EMRFS. Questa caratteristica è attivata per impostazione predefinita e trasmette le informazioni su utenti e gruppi ai log di verifica come CloudTrail, fornendoti un rilevamento completo delle richieste. Oltre alle verifiche, EMRFS offre caratteristiche come visualizzazione uniforme, crittografia S3 lato server e lato client e autorizzazione dettagliata a S3
Puoi avviare JupyterHub selezionando "JupyterHub" dall'elenco di applicazioni da installare quando configuri e avvii il tuo cluster. Visita la documentazione di Amazon EMR per ulteriori informazioni su EMR versione 5.14.0, JupyterHub e EMRFS.
Amazon EMR release 5.14.0 è disponibile in tutte le regioni supportate per Amazon EMR.