Veröffentlicht am: Jul 21, 2022

Wir freuen uns, zwei neue Funktionen ankündigen zu können, die die Durchsetzung der Zugangskontrolle mit Amazon EMR auf EC2-Clustern (EMR-Clustern) erleichtern. Diese Funktionen sind für Jobs verfügbar, die mithilfe der EMR Steps-API an den Cluster übermittelt werden. Die erste Funktion ist die Laufzeitrolle mit EMR Steps. Eine Laufzeitrolle ist eine Rolle in AWS Identity and Access Management (IAM), die du mit einem EMR Step verknüpfst. Ein EMR Step verwendet diese Rolle zum Zugriff auf AWS-Ressourcen. Die zweite Funktion ist die Integration mit AWS Lake Formation zur Anwendung von Zugangskontrollen auf Tabellen- und Spaltenebene für Apache Spark- und Apache Hive-Jobs mit EMR Steps.

Zuvor verwendeten alle auf einem EMR-Cluster ausgeführten Jobs die mit den EC2-Instances des EMR-Clusters verknüpfte IAM-Rolle zum Zugriff auf Ressourcen. Diese Rolle wird als EMR EC2-Instance-Profil bezeichnet. Wenn etwa ein Spark- und ein Hive-Job auf dem gleichen Cluster auf unterschiedliche S3-Buckets zugreifen mussten, musste das Instance-Profil den Zugriff auf beide Buckets gewähren. Mit der Laufzeitrolle für EMR Steps gibst du unterschiedliche IAM-Rollen für den Spark- und den Hive-Job an und steuerst so den Zugriff auf Jobebene. So kannst du die Zugangskontrolle auf einem einzelnen EMR-Cluster vereinfachen, der unter mehreren Mandanten geteilt wird, wobei jeder Mandant mithilfe von IAM-Rollen isoliert wird.

Darüber hinaus kannst du AWS Lake Formation zur Anwendung von Berechtigungen auf Tabellen- und Spaltenebene bei Apache Spark- und Apache Hive-Jobs verwenden, die als EMR Steps übermittelt werden. AWS Lake Formation ist ein vollständig verwalteter Service, der es dir erleichtert, Data Lakes zu erstellen, zu sichern und zu verwalten. AWS Lake Formation ermöglicht dir die Anwendung einer präzisen Zugangskontrolle für in Data Lakes gespeicherte Daten über einen einfachen Gewährungs- und Rücknahmemechanismus, ähnlich wie in einem relationalen Datenbank-Managementsystem (RDBMS). Mit dieser Funktion werden in AWS Lake Formation für eine IAM-Rolle definierte Berechtigungen auf Tabellen- und Spaltenebene nahtlose für als EMR Steps übermittelte Apache Hive- und Apache Spark-Jobs durchgesetzt. So kannst du die Zugangskontrolle weiter vereinfachen und jedem Job den Zugang zu bestimmten Datenbanken, Tabellen und Spalten gewähren.

 Beide Funktionen sind in Amazon EMR Version 6.7 verfügbar. Weitere Informationen findest du unter Regionale Verfügbarkeit von Amazon EMR und in unseren Versionshinweisen.