宣布通过结合使用 AWS Lake Formation 和 EMR on EKS 实现精细访问控制

发布于: 2025年2月21日

我们很高兴地宣布,AWS Lake Formation 全面推出精细数据访问控制 (FGAC),并且这一功能可以与 Apache Spark 和 Amazon EMR on EKS 集成使用。这使您能够强制执行 Lake Formation 中定义的完整 FGAC 策略(数据库、表、列、行和单元格级别),从而用于来自 EMR on EKS Spark 任务的数据湖表。我们还宣布全面将 Glue Data Catalog 视图和 EMR on EKS 结合用于 Spark 工作流。

借助 Lake Formation,您可以通过授权和撤销语句来定义精细访问控制(类似于 RDBMS),从而简化数据湖的构建、保护和管理。现在,同样的 Lake Formation 规则适用于 EMR on EKS 上针对 Hudi、Delta Lake 和 Iceberg 表格式的 Spark 任务,从而进一步简化数据湖的安全和治理。

结合使用 AWS Glue Data Catalog 视图和 EMR on EKS 后,客户能够通过可从多个引擎查询的 Spark 任务创建视图,而无需访问引用表。管理员可以使用 EMR on EKS Spark 任务提供的丰富 SQL 方言来控制底层数据访问。访问是通过 AWS Lake Formation 权限管理的,包括命名资源授权、数据筛选条件和 Lake Formation 标签。所有请求都记录在 AWS CloudTrail 中。

EMR 7.7 版本支持对 EMR on EKS 上的 Apache Spark 批处理任务的精细访问控制,现已在提供 EMR on EKS 的所有区域推出。要开始使用,请参阅将 AWS Lake Formation 与 Amazon EMR on EKS 结合使用