Publicado: Dec 21, 2018
Agora, você pode usar o Apache Spark 2.4.0 e o Hue 4.3.0 no Amazon EMR versão 5.20.0. O Spark 2.4.0 adiciona vários novos recursos e atualizações, incluindo suporte para um novo modelo de programação denominado modo de execução de barreira, que oferece melhor integração com cargas de trabalho de aprendizado profundo, várias novas funções SQL incorporadas para facilitar o processamento de tipos de dados complexos como matrizes e mapas, e suporte nativo para leitura e gravação de formatos de dados Avro. O Hue 4.3.0 inclui aprimoramentos na exploração do SQL, melhorias na programação e monitoramento de tarefas, painéis com melhor layout e várias correções de erros.
Além disso, com esta versão, você pode usar as versões atualizadas Apache Hive 2.3.4, Apache Flink 1.6.2, Apache HBase 1.4.8, Apache MXNet 1.3.1, Apache Tez 0.9.1, TensorFlow 1.12.0 e Presto 0.214.
Para criar um cluster do Amazon EMR com a versão 5.20.0, escolha o rótulo de versão “emr-5.20.0” no Console de Gerenciamento da AWS, na ILC da AWS ou no SDK. Você pode escolher entre Spark, Hue, Hive, Flink, HBase, MXNet, Tez, TensorFlow e Presto para instalar esses aplicativos ao iniciar um cluster do EMR. Consulte a documentação do Amazon EMR para obter mais informações sobre as versões EMR 5.20.0, Spark 2.4.0, Hue 4.3.0, Hive 2.3.4, Flink 1.6.2, HBase 1.4.8, MXNet 1.3.1, Tez 0.9.1 e Presto 0.214.
O Amazon EMR versão 5.20.0 já está disponível em todas as regiões com suporte para Amazon EMR.
Para receber atualizações sobre as versões do EMR, assine o feed de RSS sobre notas de release do EMR. Use o ícone de RSS na parte superior do Guia de versões do EMR para vincular o URL do feed diretamente ao leitor de feed favorito.