Veröffentlicht am: Nov 17, 2023

Wir freuen uns, die allgemeine Verfügbarkeit von detaillierten Zugriffskontrollen (FGAC) für AWS Lake Formation für Open Table Formats (OTFs) mit Amazon EMR auf EC2-Clustern bekannt zu geben. Mit der heutigen Einführung vereinfacht Amazon EMR die Sicherheit und Steuerung von transaktionalen Data Lakes, indem es Zugriffskontrollen auf Tabellen-, Spalten- und Zeilenebene bereitstellt, während Apache Spark-Jobs auf Apache Iceberg-, Apache Hudi- und Delta-Tabellen zugreifen.

Kunden verwenden OTF-Tabellen, um sich ständig weiterentwickelnde Datensätze zu verwalten und gleichzeitig die Abfrageleistung aufrechtzuerhalten. Sie benötigen eine Möglichkeit, differenzierte Zugriffsberechtigungen für diese OTF-Tabellen für verschiedene Benutzer, Geschäftsbereiche und Organisationen in großem Umfang zu verwalten. Mit dieser Einführung können Kunden in Lake Formation differenzierte Berechtigungen für OTF-Tabellen definieren und sie anwenden, wenn Datenverarbeitungsaufträge über Spark auf Amazon-EMR-Clustern ausgeführt werden. Sie erhalten außerdem Lese- und Schreibzugriff (Einfügungen) auf OTF-Tabellen und können Funktionen wie das Ausführen von Snapshot-Abfragen verwenden, um den neuesten Snapshot der Tabelle zu einem bestimmten Commit- oder Komprimierungszeitpunkt, inkrementell, als Time-Travel- und DML-Abfragen zu erhalten. 

Dieses Feature ist mit Amazon EMR Version 6.15 für Amazon EMR auf EC2-Clustern in allen Regionen verfügbar, in denen Amazon EMR verfügbar ist. Weitere Informationen finden Sie in der Dokumentation im Abschnitt „Integrieren von Amazon EMR mit AWS Lake Formation“.