AWS Lake Formation, Amazon S3의 기본 데이터에 액세스할 수 있도록 테이블 권한 확장
이제 AWS Lake Formation을 사용하면 AWS Glue Data Catalog에 등록된 테이블의 기본 데이터 파일을 Amazon S3에서 읽고 쓸 수 있습니다. 그러면 기존 Lake Formation 테이블 권한을 사용하여 SQL 쿼리와 직접 파일 액세스 모두에 단일 권한 세트를 사용할 수 있습니다.
이번 출시를 통해 Lake Formation은 보유한 테이블 권한에 따라 등록된 S3 위치에 대해 한정된 범위의 임시 자격 증명을 제공합니다. SELECT 권한은 해당 위치의 데이터에 대한 읽기 권한을 부여하고, SUPER 권한은 읽기 권한과 쓰기 권한을 모두 부여합니다. 이 기능은 Amazon EMR 7.13 이상에 내장되어 있습니다. 결과적으로 모델 훈련, 특성 엔지니어링 또는 데이터 품질 문제 디버깅처럼 파일 수준 액세스가 필요한 태스크를 위해 Spark 작업에서 바로 데이터 파일에 액세스할 수 있습니다.
API를 사용하거나 AWS에서 제공하는 오픈 소스 플러그인을 통해 Apache Spark 또는 Trino 애플리케이션을 통합할 수도 있습니다. 또한 모든 액세스가 AWS CloudTrail에 기록되어 테이블에 대한 SQL 및 파일 기반 작업 전반에 걸쳐 통합된 감사 추적을 제공합니다.
이 기능은 AWS Lake Formation이 제공되는 모든 AWS 리전에서 추가 비용 없이 사용할 수 있습니다. 자세한 내용은 Lake Formation 설명서, EMR 설명서, API 참조, 오픈 소스 플러그인을 참조하세요.