Veröffentlicht am: Jan 20, 2022
Wir kündigen die Unterstützung der Verwendung von Apache Spark SQL zur Aktualisierung von Glue Data Catalog-Tabellen bei Verwendung der Amazon EMR-Integration mit AWS Lake Formation an.
Die Amazon EMR-Integration mit AWS Lake Formation ermöglicht Ihnen die Definition und Durchsetzung von Berechtigungen auf Datenbank-, Tabellen- und Spaltenebene, wenn Apache Spark-Benutzer über den Glue Data Catalog auf Daten in Amazon S3 zugreifen. Bisher konnten Sie bei aktivierter AWS Lake Formation-Integration Daten nur mit Spark SQL-Anweisungen wie SHOW DATABASES und DESCRIBE TABLE lesen. Mit diesen Anweisungen können Sie nun auch Daten in die Glue Data Catalog-Tabellen einfügen oder diese aktualisieren: INSERT INTO, INSERT OVERWRITE, und ALTER TABLE.
Diese Funktion ist bei Amazon EMR 5.34 in den folgenden AWS-Regionen aktiviert: USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Nordkalifornien), USA West (Oregon), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Paris), Europa (Stockholm), Kanada (Zentral), Asien-Pazifik (Mumbai), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Tokio), Asien-Pazifik (Sydney) und Südamerika (São Paulo).
Die ersten Schritte finden Sie unter Amazon EMR-Integration mit AWS Lake Formation.