Veröffentlicht am: Dec 21, 2018
Sie können jetzt Apache Spark 2.4.0 und Hue 4.3.0 auf Amazon EMR Version 5.20.0 verwenden. Spark 2.4.0 fügt mehrere neue Funktionen und Aktualisierungen hinzu, darunter die Unterstützung eines neuen Scheduling-Modells namens Barrier Execution Mode, der eine bessere Integration mit Deep-Learning-Workloads bietet. Ebenfalls kommen mehrere neue integrierte SQL-Funktionen zur einfacheren Handhabung komplexer Datentypen wie Arrays und Maps hinzu sowie native Unterstützung für das Lesen und Schreiben von Avro-Datenformaten. Hue 4.3.0 umfasst Verbesserungen für die SQL-Exploration, Verbesserungen für die Aufgabenplanung und -überwachung, bessere Dashboard-Layouts und mehrere Fehlerbehebungen.
Zusätzlich können Sie mit dieser Version die aktuellen Versionen von Apache Hive 2.3.4, Apache Flink 1.6.2, Apache HBase 1.4.8, Apache MXNet 1.3.1, Apache Tez 0.9.1, TensorFlow 1.12.0 und Presto 0.214 verwenden.
Sie können einen Amazon EMR-Cluster mit der Version 5.20.0 erstellen, indem Sie in der AWS-Management-Konsole, AWS CLI oder SDK die Versionsbezeichnung „emr-5.20.0“ auswählen. Sie können die Installation von Spark, Hue, Hive, Flink, HBase, MXNet, Tez, TensorFlow, und Presto beim Starten Ihres EMR-Clusters wählen. Besuchen Sie die Amazon EMR-Dokumentation für weitere Informationen zu EMR-Version 5.20.0, Spark 2.4.0, Hue 4.3.0, Hive 2.3.4, Flink 1.6.2, HBase 1.4.8, MXNet 1.3.1, Tez 0.9.1 und Presto 0.214.
Die Amazon EMR-Version 5.20.0 ist jetzt in allen unterstützten Regionen für Amazon EMR verfügbar.
Bleiben Sie bezüglich der neuesten EMR-Versionen auf dem neuesten Stand, indem Sie den RSS-Feed für EMR-Versionshinweise abonnieren. Nutzen Sie das RSS-Symbol oben im EMR Release Guide, um die Feed-URL direkt mit Ihrem bevorzugten Feed-Reader zu verknüpfen.