EC2 上的 Amazon EMR 新增支援 Apache Spark 原生 FGAC 和 AWS Glue Data Catalog
EC2 上的 Amazon EMR 宣布兩項重大的治理增強功能:透過 AWS Lake Formation 的 Apache Spark 原生精細存取控制 (FGAC),以及 AWS Glue Data Catalog 的支援。這些功能可協助組織在各個分析環境中提升資料安全性、簡化存取管理,以及增強資料共用功能。
Apache Spark 原生 FGAC 實作可讓客戶在 AWS Lake Formation 中定義精細的存取政策,並一致套用於各個 EMR 叢集。這可減少安全風險和管理負擔,同時提供統一的資料治理方法。客戶現在可使用熟悉的 Lake Formation grant 和 revoke 陳述式來管理其 Spark 工作和 EC2 上 EMR 互動工作階段的存取控制,與適用於其他 AWS 分析服務的運作方式類似。
AWS Glue Data Catalog 檢視可讓客戶在 AWS 區域、帳戶和組織中建立、管理和查詢多引擎 SQL 檢視。此功能允許管理員從 Spark 工作建立可供多個引擎查詢的檢視,同時透過 Lake Formation 許可控制資料存取權。這些許可包括命名資源授權、資料篩選器和標籤,所有存取要求都會自動記錄在 AWS CloudTrail 中以供全面稽核。
Apache Spark 原生 FGAC 和 Glue Data Catalog 檢視功能可透過 Amazon EMR 7.10 版使用,支援所有提供「EC2 上的 EMR」的 AWS 區域。若要進一步了解,請參閱 Amazon EMR 文件中的透過 Amazon EMR 使用 AWS Lake Formation 以及使用 AWS Glue Data Catalog。