Publié le: Apr 10, 2018
Vous pouvez désormais utiliser Apache Spark 2.3.0, Apache HBase 1.4.2 et Presto 0.194 sur Amazon EMR version 5.13.0. Spark 2.3.0 ajoute plusieurs nouvelles fonctionnalités et mises à jour, dont le mode de traitement continu en flux structuré pour une latence de bout en bout réduite, ainsi qu'un lecteur de format de fichier ORC amélioré qui prend en charge les lectures vectorisées et améliore le débit de numérisation et les performances d'interopérabilité entre PySpark et Pandas. HBase 1.4.2 et Presto 0.194 incluent diverses améliorations et corrections de bogues. En outre, le kit AWS SDK inclus dans vos clusters Amazon EMR est désormais mis à jour vers la version 1.11.297.
Vous pouvez créer un cluster Amazon EMR avec la version 5.13.0 en choisissant l'étiquette de version « emr-5.13.0 » dans AWS Management Console, l'interface de ligne de commande AWS ou le SDK. Vous pouvez sélectionner Spark, HBase et Presto afin d'installer ces applications au lancement de votre cluster EMR. Veuillez consulter la documentation Amazon EMR pour plus d'informations sur les versions EMR 5.13.0, HBase 1.4.2 et Presto 0.194.
Amazon EMR 5.13.0 est désormais disponible dans toutes les régions prises en charge par Amazon EMR.