Veröffentlicht am: May 25, 2023

Wir freuen uns, die Einführung von AWS Glue 4.0 für die Region AWS GovCloud (USA-West) ankündigen zu können. AWS Glue 4.0 ist eine neue Version von AWS Glue, die Datenintegrations-Workloads in AWS beschleunigt. AWS Glue 4.0 aktualisiert die Spark-Engines auf Apache Spark 3.3.0 und Python 3.10. Mit Glue 4.0 erhalten Kunden die neuesten Spark- und Python-Versionen, damit sie ihre Datenintegrations-Workloads entwickeln, ausführen und skalieren können und schneller Erkenntnisse erhalten.

AWS Glue ist ein serverloser, skalierbarer Datenintegrationsservice, der es einfach macht, Daten aus verschiedenen Quellen zu erkennen, vorzubereiten, zu verschieben und zu integrieren. AWS Glue 4.0 bietet Unterstützung für integrierte Pandas-APIs sowie Unterstützung für Data Lake-Frameworks – Apache Hudi, Apache Iceberg und Delta Lake – und bietet Ihnen mehr Optionen für die Analyse und Speicherung Ihrer Daten. Außerdem wurden die Konnektoren für native AWS Glue-Datenbankquellen wie RDS, MySQL und SQLServer aktualisiert, was die Verbindungen zu gängigen Datenbankquellen vereinfacht. AWS Glue 4.0 bietet außerdem native Unterstützung für das neue Cloud Shuffle Storage Plugin für Apache Spark, mit dem Kunden ihre Festplattennutzung während der Laufzeit skalieren können. Es ermöglicht die adaptive Abfrageausführung, die Ihre Abfragen während der Ausführung dynamisch optimiert. Schließlich verbessert AWS Glue 4.0 die Erfahrung für Entwickler, indem es Fehlermeldungen mehr Kontext hinzufügt. Wie bei AWS Glue 3.0 zahlen Kunden nur für die Ressourcen, die sie nutzen.

Weitere Informationen finden Sie in unserer Dokumentation.