Veröffentlicht am: May 12, 2023
AWS Glue Crawler unterstützt jetzt die Möglichkeit für Kunden, ihre eigenen benutzerdefinierten JDBC-Treiber zu verwenden, um Datenschemas aus Datenquellen zu extrahieren und den AWS Glue-Datenkatalog zu füllen. Glue Crawler unterstützen bereits JDBC Glue-Verbindungen zu unterstützten Datenquellen auf AWS. Jetzt können Sie Ihre eigenen JDBC-Treiberversionen mitbringen, um eine Verbindung zu Datenquellen in Glue Crawlers herzustellen. Zu diesen Datenquellen gehören Postgres, MySQL, Oracle, SQL Server und Amazon Redshift.
Um Ihren eigenen JDBC-Treiber zu verwenden, fügen Sie die Treiberdatei zu Ihrem Amazon S3-Bucket hinzu. Konfigurieren Sie dann die Glue Connection mit dem S3-Pfad und dem Klassennamen des JDBC-Treibers. Bei jeder Ausführung des Glue Crawlers wird ein Glue-Job gestartet, wobei der mitgelieferte JDBC-Treiber verwendet wird, um das Schema zu überprüfen. Der Glue Crawler katalogisiert dann die Schemainformationen, z. B. neue Tabellen, Löschungen und Aktualisierungen von Schemas im AWS Glue-Datenkatalog. Mit AWS Glue können Sie jetzt AWS Glue Data Catalog als Quelle verwenden, um Daten aus diesen Datenquellen abzurufen und ein Amazon S3-Ziel zu füllen.
Die Unterstützung von AWS Glue Crawlers für benutzerdefinierte JDBC-Treiber ist in allen kommerziellen Regionen verfügbar, in denen AWS Glue verfügbar ist. Weitere Informationen finden Sie in der AWS-Regionentabelle. Weitere Informationen finden Sie in der Dokumentation zu AWS Glue Crawler.