Amazon EMR unterstützt jetzt Apache Spark SQL, um Daten in Glue Data Catalog Tabellen einzufügen und zu aktualisieren, wenn die Lake Formation Integration aktiviert ist

Veröffentlicht am: Jan 20, 2022

Wir kündigen die Unterstützung der Verwendung von Apache Spark SQL zur Aktualisierung von Glue Data Catalog-Tabellen bei Verwendung der Amazon EMR-Integration mit AWS Lake Formation an.

Die Amazon EMR-Integration mit AWS Lake Formation ermöglicht Ihnen die Definition und Durchsetzung von Berechtigungen auf Datenbank-, Tabellen- und Spaltenebene, wenn Apache Spark-Benutzer über den Glue Data Catalog auf Daten in Amazon S3 zugreifen. Bisher konnten Sie bei aktivierter AWS Lake Formation-Integration Daten nur mit Spark SQL-Anweisungen wie SHOW DATABASES und DESCRIBE TABLE lesen. Mit diesen Anweisungen können Sie nun auch Daten in die Glue Data Catalog-Tabellen einfügen oder diese aktualisieren: INSERT INTO, INSERT OVERWRITE, und ALTER TABLE.

Diese Funktion ist bei Amazon EMR 5.34 in den folgenden AWS-Regionen aktiviert: USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Nordkalifornien), USA West (Oregon), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Paris), Europa (Stockholm), Kanada (Zentral), Asien-Pazifik (Mumbai), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Tokio), Asien-Pazifik (Sydney) und Südamerika (São Paulo).

Die ersten Schritte finden Sie unter Amazon EMR-Integration mit AWS Lake Formation.

Amazon EMR unterstützt jetzt Apache Spark SQL, um Daten in Glue Data Catalog Tabellen einzufügen und zu aktualisieren, wenn die Lake Formation Integration aktiviert ist

Ende des Supports für Internet Explorer