Veröffentlicht am: Nov 17, 2023
AWS Glue für Apache Spark kündigt die Einführung von sechs neuen Datenbank-Konnektoren an: Teradata, SAP HANA, Azure SQL, Azure Cosmos DB, Vertica und MongoDB. Diese nativen Konnektoren ermöglichen Benutzern das effiziente Lesen und Schreiben von Daten aus diesen Systemen, ohne dass Konnektorbibliotheken installiert oder verwaltet werden müssen. Benutzer können diese Datenbanken jetzt als Quelle oder Ziel in der grafischen Benutzeroberfläche von AWS Glue Studio ohne Code per Drag-and-Drop hinzufügen oder den Connector direkt in einem ETL-Script-Auftrag von AWS Glue verwenden.
Für Teradata, SAP HANA, Azure SQL und Vertica können Benutzer eine einzelne Tabelle angeben oder eine benutzerdefinierte Abfrage eingeben, um ihre Daten auszuwählen. Für MongoDB können sie die Dokumentensammlung angeben. Für Azure Cosmos DB können sie den Container angeben und optional eine benutzerdefinierte Abfrage bereitstellen. Bei der Erstellung visueller ETL-Aufträge können sie eine Vorschau ihres Quelldatensatzes anzeigen, um die richtigen Daten schneller zu finden. Benutzer können diese Datenbanken auch als Ziele in ihren ETL-Pipelines verwenden, um die Ausgabe der Transformationsschritte zu schreiben.
Mit diesen Funktionen können ETL-Entwickler mit AWS Glue und unterstützten Datenbanken in einer Vielzahl von Datenkonstellationen innerhalb einer einzigen Schnittstelle arbeiten. Erstellen Sie zunächst eine neue Verbindung in AWS Glue zu Ihrer gewünschten Datenbank und fügen Sie sie als Quelle oder Ziel zu Ihrem Glue-ETL-Aufttrag hinzu.
Dieses Feature ist in allen kommerziellen AWS-Regionen verfügbar, in denen AWS Glue angeboten wird.
Weitere Informationen finden Sie in der Dokumentation zu AWS Glue.