Publié le: Dec 22, 2023
Amazon EMR sans serveur prend désormais en charge AWS Lake Formation pour un contrôle précis de l'accès aux données avec Apache Spark. Cela vous permet d'appliquer des politiques au niveau des bases de données, des tables, des colonnes, des lignes et des cellules pour les données stockées dans Amazon S3 à partir de vos tâches EMR sans serveur Spark. Les politiques que vous définissez dans Lake Formation prennent effet lorsque vous exécutez des applications Spark à l'aide d'EMR Studio, d'AWS CLI ou d'orchestrateurs de tâches tels qu'Amazon Managed Workflows pour Apache Airflow et AWS Step Functions.
Lake Formation simplifie la création, la sécurisation et la gestion des lacs de données. Il vous permet de définir des contrôles d'accès précis par le biais d'instructions d'autorisation et de révocation, similaires à celles utilisées avec les systèmes de gestion de base de données relationnelle (SGBDR), et d'appliquer automatiquement ces politiques via des moteurs compatibles tels qu'Athena, EMR sur EC2 et Redshift Spectrum. Avec le lancement d'aujourd'hui, les règles de Lake Formation que vous avez configurées pour être utilisées avec d'autres services tels qu'Athena s'appliquent désormais à vos jobs Spark sur EMR sans serveur, simplifiant ainsi davantage la sécurité et la gouvernance de vos lacs de données.
Le contrôle d'accès affiné avec Apache Spark sur EMR sans serveur est en version préliminaire et est disponible avec la version EMR 6.15 dans les régions suivantes : Asie-Pacifique (Mumbai, Séoul, Singapour, Sydney, Tokyo), Canada (Centre), Europe (Francfort, Irlande, Londres, Paris, Stockholm), Amérique du Sud (São Paulo), USA Est (Virginie du Nord, Ohio) et USA Ouest (Californie du Nord, Oregon). Pour commencer, consultez la section Utilisation d'AWS Lake Formation avec Amazon EMR sans serveur.