게시된 날짜: Dec 22, 2023
Amazon EMR Serverless는 이제 Apache Spark를 사용하여 세분화된 데이터 액세스 제어를 위한 AWS Lake Formation을 지원합니다. 이를 통해 EMR Serverless Spark 작업에서 Amazon S3에 저장된 데이터에 대해 데이터베이스, 테이블, 열, 행 및 셀 수준 정책을 적용할 수 있게 되었습니다. Lake Formation에서 정의한 정책은 EMR Studio, AWS CLI를 사용하여 Spark 애플리케이션을 실행하거나 Amazon Managed Workflows for Apache Airflow 및 AWS Step Functions와 같은 작업 오케스트레이터를 실행할 때 적용됩니다.
Lake Formation을 사용하면 데이터 레이크를 더 쉽게 구축, 보호 및 관리할 수 있습니다. 이를 통해 RDBMS(관계형 데이터베이스 관리 시스템)에서 사용되는 것과 유사한 권한 부여 및 취소 문을 통해 세분화된 액세스 제어를 정의하고, Athena, EC2 기반 EMR 및 Redshift Spectrum과 같은 호환 엔진을 통해 이러한 정책을 자동으로 적용할 수 있습니다. 오늘 출시를 통해 이제 Athena와 같은 다른 서비스에서 사용하기 위해 설정한 것과 동일한 Lake Formation 규칙이 EMR Serverless의 Spark 작업에 적용되어 데이터 레이크의 보안 및 거버넌스가 더욱 간소화됩니다.
EMR Serverless에서의 Apache Spark를 통한 세분화된 액세스 제어 기능은 평가판 모드로 사용할 수 있으며, EMR 6.15 릴리스와 함께 아시아 태평양(뭄바이, 서울, 싱가포르, 시드니, 도쿄), 캐나다(중부), 유럽(프랑크푸르트, 아일랜드, 런던, 파리, 스톡홀름), 남아메리카(상파울루), 미국 동부(버지니아 북부, 오하이오) 및 미국 서부(캘리포니아 북부, 오레곤)에서 사용할 수 있습니다. 시작하려면 Amazon EMR Serverless를 통해 AWS Lake Formation 사용을 참조하세요.