AWS Lake Formation erweitert Tabellenberechtigungen auf den Zugriff auf zugrunde liegende Daten in Amazon S3
Mit AWS Lake Formation können Sie jetzt die zugrunde liegenden Datendateien in Amazon S3 für Tabellen lesen und schreiben, die im AWS-Glue-Datenkatalog registriert sind. Dadurch erhalten Sie einen einzigen Berechtigungssatz sowohl für SQL-Abfragen als auch für den direkten Dateizugriff unter Verwendung Ihrer vorhandenen Lake-Formation-Tabellenberechtigungen.
Mit diesem Launch stellt Lake Formation temporäre, bereichsbezogene Anmeldeinformationen für registrierte S3-Standorte auf Grundlage Ihrer Tabellenberechtigungen bereit. SELECT-Berechtigungen gewähren Lesezugriff, SUPER-Berechtigungen gewähren Lese- und Schreibzugriff auf die Daten an diesem Standort. Diese Funktion ist in Amazon EMR 7.13 oder höher integriert. Somit können Sie für Aufgaben, die Zugriff auf Dateiebene erfordern, z. B. Modelltraining, Feature Engineering oder Debuggen von Datenqualitätsproblemen, direkt von Ihren Spark-Jobs aus auf Datendateien zugreifen.
Sie können Ihre Apache-Spark- oder Trino-Anwendungen auch mithilfe von APIs oder über ein von AWS bereitgestelltes Open-Source-Plug-in integrieren. Darüber hinaus werden alle Zugriffe in AWS CloudTrail protokolliert, um einen einheitlichen Audit Trail für SQL- und dateibasierte Operationen in Ihren Tabellen bereitzustellen.
Dieses Feature steht ohne zusätzliche Kosten in allen AWS-Regionen zur Verfügung, in denen AWS Amazon Lake Formation verfügbar ist. Weitere Informationen finden Sie in der Lake-Formation-Dokumentation, der EMR-Dokumentation, der API-Referenz und im Open-Source-Plug-in.