发布于: Aug 9, 2019

Amazon EMR 现在支持对 Apache Spark 执行基于 AWS Lake Formation 的精细访问控制策略。您可以对 Amazon S3 中存储的数据执行数据库、表格和列级策略。使用 Apache Zeppelin 或 EMR Notebooks 提交 Spark 应用程序时,将执行 AWS Lake Formation 中定义的策略。该版本中还包含对 EMR Notebooks 和 Apache Zeppelin 基于 SAML 的单点登录 (SSO),可使用 Active Directory 联合身份验证服务 (ADFS)、Okta 或 Auth0 简化组织身份验证工作。通过基于 SAML 的 SSO 与 AWS Lake Formation 结合策略,客户可以在共享多租户集群上安全运行 Spark 应用程序,同时具有对 Amazon S3 中存储数据的列级访问权限。

AWS Lake Formation 为完全托管服务,可让客户轻松构建、保护和管理数据湖。Lake Formation 可简化和自动化执行创建数据湖所需的许多复杂手动步骤,包括收集、清理和分类数据并做好安全数据分析准备。在 Lake Formation 之前,客户需要在其存储以及不同分析引擎中设置数据访问角色和执行安全策略,并在权限更改或添加新最终用户时更新安全策略。借助 Lake Formation,现在您可以一次性定义 Amazon EMR、Amazon Redshift Spectrum、AWS Glue 和 Amazon Athena 等服务的策略,然后以同样的方式进行执行。

AWS Lake Formation 与 Amazon EMR 集成工具目前提供测试版,在美国东部(弗吉尼亚北部)和美国西部(俄勒冈)可提供 EMR 5.26.0 版本。 

您可以订阅 EMR 发行说明的源,以了解有关 EMR 版本的最新信息。请使用 EMR 版本指南顶部的图标,将源 URL 直接链接至您最喜欢的源阅读器。