Publié le: Dec 21, 2018
Vous pouvez désormais utiliser Spark 2.4.0 et Hue 4.3.0 sur Amazon EMR version 5.20.0. Spark 2.4.0 ajoute plusieurs nouvelles fonctionnalités et mises à jour, y compris la prise en charge d’un nouveau modèle de planification appelé mode d’exécution des barrières, qui fournit une intégration optimale avec les charges de travail de Deep Learning. Elle ajoute également plusieurs nouvelles fonctions SQL intégrées facilitant la gestion des types de données complexes comme les tableaux et les cartes, et un support natif pour la lecture et l’écriture des formats de données Avro. Hue 4.3.0 inclut des améliorations pour l’exploration de SQL et pour la planification et la surveillance des tâches, ainsi que des mises en page optimisées de tableaux de bord et plusieurs correctifs de bugs.
Par ailleurs, avec cette nouvelle version, vous pouvez utiliser celles mises à niveau de Apache Hive 2.3.4, Apache Flink 1.6.2, Apache HBase 1.4.8, Apache MXNet 1.3.1, Apache Tez 0.9.1, TensorFlow 1.12.0 et Presto 0.214.
Vous pouvez créer un cluster Amazon EMR avec la version 5.20.0 en choisissant l'étiquette de version « emr-5.20.0 » dans AWS Management Console, l'interface de ligne de commande AWS ou le kit SDK. Vous pouvez sélectionner Spark, Hue, Hive, Flink, HBase, MXNet, Tez, TensorFlow et Presto afin d'installer ces applications au lancement de votre cluster EMR. Pour en savoir plus sur EMR 5.20.0, Spark 2.4.0, Hue 4.3.0, Hive 2.3.4, Flink 1.6.2, HBase 1.4.8, MXNet 1.3.1, Tez 0.9.1 et Presto 0.214, consultez notre documentation Amazon EMR.
Amazon EMR 5.20.0 est désormais disponible dans toutes les régions prenant en charge Amazon EMR.
Vous pouvez rester à jour sur les versions EMR en vous abonnant au flux RSS des notes de version EMR. Utilisez l'icône RSS en haut du Guide de lancement EMR pour lier l'URL du flux directement à votre lecteur de flux préféré.