Publicado: Apr 10, 2018
Você já pode usar Apache Spark 2.3.0, Apache HBase 1.4.2 e Presto 0.194 no Amazon EMR versão 5.13.0. O Spark 2.3.0 acrescenta vários novos recursos e atualizações, inclusive modo de processamento contínuo no Structured Streaming para uma menor latência ponto a ponto, um aprimoramento do leitor para arquivos no formato ORC que oferece suporte a leituras vetorizadas e aprimora a produtividade das operações de varredura, aprimoramentos na interoperabilidade entre PySpark e Pandas. As versões do HBase 1.4.2 e do Presto 0.194 incluem diversas correções de bug e melhorias. Além disso, agora o AWS SDK incluído em seus clusters Amazon EMR foi atualizado para a versão 1.11.297.
Você pode criar um cluster do Amazon EMR com a versão 5.13.0 escolhendo o rótulo de versão “emr-5.13.0” no Console de Gerenciamento da AWS, AWS CLI ou SDK. Você pode selecionar Spark, HBase e Presto para instalar esses aplicativos ao executar seu cluster EMR. Acesse a documentação do Amazon EMR para mais informações sobre o EMR versão 5.13.0, HBase 1.4.2 e Presto 0.194.
Agora o Amazon EMR versão 5.13.0 está disponível em todas as regiões que oferecem suporte para o Amazon EMR.