Amazon EMR on EC2, Apache Spark 네이티브 FGAC 및 AWS Glue Data Catalog 뷰 지원 추가
Amazon EMR on EC2가 거버넌스를 위한 두 가지 중요한 개선 사항인 AWS Lake Formation을 통한 Apache Spark 네이티브 세분화된 접근 제어(FGAC)와 AWS Glue Data Catalog 뷰에 대한 지원을 발표했습니다. 이 기능을 통해 조직은 분석 환경 전반에서 데이터 보안을 개선하고, 액세스 관리를 간소화하며, 데이터 공유 역량을 개선할 수 있습니다.
Apache Spark 네이티브 FGAC 구현을 통해 고객은 AWS Lake Formation에서 세분화된 액세스 정책을 한 번 정의하고, 이를 EMR 클러스터 전반에 일관되게 적용할 수 있습니다. 따라서 보안 위험과 관리 부담을 줄이고, 데이터 거버넌스를 위한 통합된 접근 방식을 제공할 수 있습니다. 고객은 이제 Lake Formation의 익숙한 grant 및 revoke 문을 사용하여 EMR on EC2의 Spark 작업 및 대화형 세션에 대한 액세스 제어를 관리할 수 있으며, 이는 다른 AWS 분석 서비스에서 작동하는 방식과 유사합니다.
AWS Glue Data Catalog 뷰를 사용하면 고객은 AWS 리전, 계정, 조직 전반에서 다중 엔진 SQL 뷰를 생성, 관리, 쿼리할 수 있습니다. 관리자는 Spark 작업에서 뷰를 생성하고, 이를 여러 엔진에서 쿼리할 수 있으며, Lake Formation 권한을 통해 데이터 액세스를 제어할 수 있습니다. 해당 권한에는 명명된 리소스 권한 부여, 데이터 필터, 태그가 포함되며, 모든 액세스 요청은 AWS CloudTrail에 자동으로 기록되어 종합적인 감사 기능을 제공합니다.
Apache Spark 네이티브 FGAC와 Glue Data Catalog 뷰 기능은 Amazon EMR 7.10 릴리스부터 제공되며, Amazon EMR on EC2가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 자세한 내용은 Amazon EMR 설명서의 Amazon EMR을 통한 AWS Lake Formation 사용 및 AWS Glue Data Catalog 뷰 사용을 참조하시기 바랍니다.