Publicado: Jun 14, 2018
Agora, você pode usar o JupyterHub no Amazon EMR com a versão 5.14.0 do EMR. O JupyterHub é um servidor de notebook Jupyter multiusuário que oferece a cada usuário sua própria interface de notebook Jupyter. Ele permite que vários usuários usem simultaneamente seus notebooks Jupyter, criem e executem código, e realizem análises de dados exploratórias. O JupyterHub no EMR é integrado à estrutura Spark, permitindo que você execute consultas Spark interativas nos clusters do EMR usando kernels Scala, PySpark, Spark R e Spark SQL. Você também pode executar tarefas Python localmente e aproveitar as populares bibliotecas de ciências de dados que estão pré-instaladas em seu notebook. Agora, com o EMR versão 5.14.0, o EMRFS, o conector do Amazon EMR para S3, oferece suporte à auditoria de usuários que executam consultas que acessaram dados no S3 pelo EMRFS. Este recurso é ativado por padrão e passará informações de usuários e grupos para os logs de auditoria, como CloudTrail, oferecendo a você um rastreamento completo da solicitação. Além da auditoria, o EMRFS oferece recursos como exibição consistente, criptografia do lado do cliente e do lado do servidor S3 e autorização minuciosa para o S3.
Você pode iniciar o JupyterHub selecionando “JupyterHub” na lista de aplicativos a serem instalados quando você configura e inicia seu cluster. Acesse a documentação do Amazon EMR para obter mais informações sobre o EMR versão 5.14.0, o JupyterHub e o EMRFS.
O Amazon EMR versão 5.14.0 está disponível em todas as regiões com suporte para o Amazon EMR.