Publicado en: Jun 14, 2018
Ahora puede usar JupyterHub con la versión 5.14.0 de Amazon EMR. JupyterHub es un servidor multiusuario de cuadernos de notas de Jupyter que brinda a cada usuario su propia interfaz de los cuadernos de Jupyter. Permite a múltiples usuarios usar simultáneamente sus cuadernos de Jupyter, crear y ejecutar código y realizar análisis exploratorios de los datos. JupyterHub en EMR está integrado con el marco de trabajo Spark, lo que le permite realizar consultas interactivas con Spark en clústeres de EMR usando los núcleos Scala, PySpark, Spark R y Spark SQL. También puede ejecutar trabajos con Python de forma local y aprovechar la variedad de bibliotecas populares de ciencia de datos que vienen preinstaladas en su cuaderno de notas. Ahora, con la versión 5.14.0 de EMR, el conector para S3 de Amazon EMR, EMRFS, admite la auditoría de los usuarios que ejecutaron consultas para acceder a datos en S3 a través de EMRFS. Esta característica está activada por defecto y transmitirá información del usuario y del grupo a registros de auditoría como los de CloudTrail, lo que le proporciona un rastreo integral de las solicitudes. Además de admitir las auditorías, EMRFS ofrece características como la vista consistente, el cifrado del lado del servidor y del lado del cliente en S3 y autorizaciones detalladas para S3.
Puede implementar JupyterHub seleccionando “JupyterHub” en la lista de aplicaciones que se van a instalar cuando configura y lanza su clúster. Consulte la documentación sobre Amazon EMR para obtener más información sobre EMR versión 5.14.0, JupyterHub y EMRFS.
La versión 5.14.0 de Amazon EMR está disponible en todas las regiones admitidas con Amazon EMR.