发布于: Dec 22, 2023

Amazon EMR Serverless 现在支持 AWS Lake Formation 使用 Apache Spark 实现精细数据访问控制。这使您能够从 EMR Serverless Spark 任务对存储在 Amazon S3 中的数据强制执行数据库、表、列、行和单元格级别的策略。当您使用 EMR Studio、AWS CLI 或任务编排工具(例如 Amazon Managed Workflows for Apache AirflowAWS Step Functions)运行 Spark 应用程序时,您在 Lake Formation 中定义的策略将生效。

Lake Formation 使构建、保护和管理数据湖变得简单。它允许您通过授权和撤销语句定义精细访问控制,类似于关系数据库管理系统 (RDBMS) 中使用的语句,并通过兼容引擎(如 Athena、EC2 上的 EMR 和 Redshift Spectrum)自动执行这些策略。随着今天的发布,您为在 Athena 等其他服务中使用而设置的相同的 Lake Formation 规则现在适用于 EMR Serverless 上的 Spark 任务,从而进一步简化了数据湖的安全和治理。

在 EMR Serverless 上使用 Apache Spark 实现精细访问控制现已提供预览版,并且通过 EMR 6.15 版本在以下区域推出:亚太地区(孟买、首尔、新加坡、悉尼、东京)、加拿大(中部)、欧洲地区(法兰克福、爱尔兰、伦敦、巴黎、斯德哥尔摩)、南美洲(圣保罗)、美国东部(弗吉尼亚州北部、俄亥俄州)和美国西部(北加利福尼亚、俄勒冈州)。要开始使用,请参阅将 AWS Lake Formation 与 Amazon EMR Serverless 结合使用