EC2 上的 Amazon EMR 增加了 Apache Spark 原生 FGAC 和 AWS Glue Data Catalog 视图支持
EC2 上的 Amazon EMR 宣布推出两项重大的治理改进:通过 AWS Lake Formation 进行 Apache Spark 原生精细访问控制 (FGAC),以及对 AWS Glue Data Catalog 视图的支持。这些功能使组织能够提高数据安全性,简化访问管理,并增强其分析环境中的数据共享能力。
Apache Spark 原生 FGAC 实施使客户只需在 AWS Lake Formation 中定义精细访问策略一次,并将其一致地应用于 EMR 集群。这降低了安全风险和管理开销,同时提供了统一的数据治理方法。客户现在可以使用常用的 Lake Formation 授权和撤销声明来管理对 EC2 上的 EMR 上的 Spark 作业和交互式会话的访问控制,这与其他 AWS 分析服务的工作方式类似。
AWS Glue Data Catalog 视图使客户能够在 AWS 区域、账户和组织中创建、管理和查询多引擎 SQL 视图。此功能允许管理员从 Spark 作业中创建可从多个引擎查询的视图,同时通过 Lake Formation 权限控制数据访问权限。这些权限包括命名资源授权、数据筛选器和标签,所有访问请求都会自动记录在 AWS CloudTrail 中以进行全面审计。
Amazon EMR 版本 7.10 在提供 EC2 上的 EMR 的所有 AWS 区域推出 Apache Spark 原生 FGAC 和 Glue Data Catalog 视图功能。要了解更多信息,请访问 Amazon EMR 文档中的将 AWS Lake Formation 与 Amazon EMR 结合使用和使用 AWS Glue Data Catalog 视图。