게시된 날짜: Mar 14, 2023
Amazon EMR에서 사용자가 Amazon EMR 단계 API를 사용하여 제출한 Apache Hive 작업의 쓰기 작업(예: INSERT INTO, INSERT OVERWRITE)에 대해 Amazon S3 데이터 레이크에서 AWS Lake Formation 기반 테이블 및 열 수준 권한을 적용할 수 있는 새로운 기능을 지원하게 되었습니다. 이 기능을 통해 데이터 관리자는 Amazon EMR에서 실행되는 Apache Hive를 통해 데이터에 액세스하는 고객을 위해 세분화된 테이블 및 열 수준 보안을 정의하고 적용할 수 있습니다.
Amazon EMR과 AWS Lake Formation이 통합됨에 따라 Amazon EMR에서 실행되는 Apache Spark 및 Apache Hive 같은 오픈 소스 데이터 처리 엔진을 사용하여 데이터베이스, 테이블 및 열 수준의 권한을 정의하고 적용할 수 있게 되었습니다. 이번 릴리스 이전에는 데이터 관리자가 EMR에서 Apache Hive를 사용하여 읽기 전용 워크로드에 대해 Lake Formation 기반 데이터베이스, 테이블 및 열 권한을 정의하고 적용할 수 있었습니다. 이제 현재 릴리스 버전에서는 Hive를 사용하여 Lake Formation 지원 테이블에 쓰거나 변경할 수 있습니다. 즉, 고객이 INSERT INTO, INSERT OVERWRITE 및 ALTER TABLE 쿼리를 실행할 때 Lake Formation 기반 데이터베이스, 테이블 및 열 수준 권한을 적용할 수 있습니다. Lake Formation 기반 권한을 사용하려면 고객이 Glue 데이터 카탈로그를 메타스토어로 사용해야 합니다.
이 기능은 Amazon EMR을 사용할 수 있는 모든 리전에서 EC2 클러스터의 Amazon EMR용 Amazon EMR 릴리스 버전 6.10을 통해 사용할 수 있습니다. 시작하려면 Amazon EMR 설명서에서 Amazon EMR과 AWS Lake Formation 통합 섹션을 참조하세요.