게시된 날짜: Jul 21, 2022

AWS가 EC2 기반 Amazon EMR 클러스터(EMR 클러스터)를 통해 액세스 제어를 적용하는 두 가지 새로운 기능을 출시했습니다. 이러한 기능은 EMR 단계 API를 사용하여 클러스터에 제출되는 작업을 통해 지원됩니다. 첫 번째 기능은 EMR 단계의 런타임 역할입니다. 런타임 역할은 EMR 단계와 연결하는 AWS Identity and Access Management(IAM) 역할입니다. EMR 단계에서는 이 역할을 사용하여 AWS 리소스에 액세스합니다. 두 번째 기능은 EMR 단계를 통해 Apache Spark 및 Apache Hive 작업에 대해 테이블 및 열 수준 액세스 제어를 적용하는 AWS Lake Formation와의 통합 기능입니다.

이전에는 EMR 클러스터에서 실행되는 모든 작업의 경우 EMR 클러스터의 EC2 인스턴스와 연결된 IAM 역할을 사용하여 리소스에 액세스했습니다. 이 역할을 EMR EC2 인스턴스 프로파일이라고 합니다. 예를 들어 동일한 클러스터에서 실행되는 Spark 작업과 Hive 작업이 서로 다른 S3 버킷에 액세스해야 하는 경우 인스턴스 프로파일은 두 버킷 모두에 대한 액세스를 허용해야 합니다. EMR 단계의 런타임 역할을 사용하면 Spark 작업과 Hive 작업에 대해 서로 다른 IAM 역할을 지정하여 작업 수준에서 액세스 범위를 줄일 수 있습니다. 이렇게 하면 각 테넌트가 IAM 역할을 사용하여 격리되는 여러 테넌트 간에 공유되는 단일 EMR 클러스터에서 액세스 제어를 간소화할 수 있습니다.

또한 AWS Lake Formation을 사용하여 EMR 단계로 제출된 Apache Spark 및 Apache Hive 작업에 대해 테이블 및 열 수준 권한을 적용할 수 있습니다. AWS Lake Formation은 데이터 레이크를 쉽게 구축 및 보호하고 관리할 수 있게 해 주는 완전관리형 서비스입니다. AWS Lake Formation을 사용하면 관계형 데이터베이스 관리 시스템(RDBMS)과 매우 비슷한 단순한 권한 부여 또는 호출 메커니즘을 통해 데이터 레이크에 저장된 데이터에 세분화된 액세스 제어를 적용할 수 있습니다. 이 기능을 사용하면 IAM 역할에 대해 AWS Lake Formation에 정의된 테이블 및 열 수준 권한이 EMR 단계로 제출된 Apache Hive 및 Apache Spark 작업에 원활하게 적용됩니다. 이를 통해 액세스 제어를 한층 더 간소화하고, 각각의 작업에 특정 데이터베이스, 테이블 및 열에 대한 액세스 권한을 제공할 수 있습니다.

 두 기능 모두 Amazon EMR 릴리스 6.7에서 제공됩니다. 자세한 내용은 Amazon EMR의 리전별 가용성릴리스 정보를 참조하세요.