Publicado en: Apr 10, 2018
Ahora puede usar Apache Spark 2.3.0, Apache HBase 1.4.2 y Presto 0.194 en Amazon EMR versión 5.13.0. Spark 2.3.0 añade varias nuevas características y actualizaciones, entre las que se incluyen el modo de procesamiento continuo en streaming estructurado para una menor latencia de extremo a extremo y un lector mejorado para formatos de archivo ORC que admite lecturas vectorizadas y mejora el rendimiento del escaneado, así como mejoras de interoperabilidad entre PySpark y Pandas. HBase 1.4.2 y Presto 0.194 incluyen diversas mejoras y correcciones de errores. Además, el AWS SDK incluido en sus clústeres de Amazon EMR está actualizado ahora a 1.11.297.
Puede crear un clúster de Amazon EMR con la versión 5.13.0, para lo cual deberá elegir la etiqueta de versión “emr-5.13.0” desde la consola de administración de AWS, el AWS SDK o la interfaz de línea de comandos (CLI) de AWS. Puede seleccionar Spark, HBase y Presto, para instalar estas aplicaciones cuando ejecute su clúster de EMR. Consulte la documentación sobre Amazon EMR para obtener más información sobre EMR versión 5.13.0, HBase 1.4.2 y Presto 0.194.
Amazon EMR versión 5.13.0 está disponible ahora en todas las regiones admitidas para Amazon EMR.