게시된 날짜: Aug 9, 2019

AWS Lake Formation은 안전한 데이터 레이크를 며칠 만에 손쉽게 설정할 수 있도록 지원하는 서비스입니다. 데이터 레이크는 큐레이션된 안전한 중앙 집중식 리포지토리로, 모든 데이터를 원래 형식 및 분석에 필요한 형식으로 저장합니다. 데이터 레이크를 사용하면 데이터 사일로를 없애고 다양한 유형의 분석을 조합하여 통찰력을 얻을 수 있으며, 이를 바탕으로 더 나은 비즈니스 결정을 내릴 수 있습니다.

하지만 데이터 레이크를 설정하고 관리하기 위해서는 수많은 복잡하고 시간 소모적인 수작업이 필요합니다. 이러한 작업에는 다양한 소스로부터 데이터 로딩, 이러한 데이터 흐름 모니터링, 파티션 설정, 암호화 설정 및 키 관리, 변환 작업 정의 및 운영 모니터링, 열 기반 형식으로 데이터 재구성, 액세스 제어 설정 구성, 대략적인 중복 식별을 위해 기게 학습 이용, 링크된 레코드 매칭, 데이터 세트에 대한 액세스 권한 부여, 추후 액세스 감사 등이 포함됩니다. 

Lake Formation으로 데이터 레이크를 생성하는 작업은 데이터가 상주할 위치 및 적용할 액세스할 데이터 및 보안 정책을 정의하는 것만큼이나 간단합니다. 그러면 Lake Formation이 데이터베이스 및 객체 스토리지에서 데이터를 수집하고 카탈로그화한 후, 새로운 Amazon S3 데이터 레이크로 옮긴 다음, 기계 학습 알고리즘을 사용해 정리 및 분류하고, 민감한 데이터에 대한 액세스를 보호합니다. 이 과정이 마무리되면 사용자는 사용 가능한 데이터 세트 및 적절한 사용 방법이 설명된 중앙 집중식 데이터 카탈로그에 액세스할 수 있습니다. 그런 다음 사용자는 Amazon EMR for Apache Spark, Amazon Redshift Spektrum 및, Amazon Athena 등 분석 및 기계 학습 서비스를 선택하여 이러한 데이터 세트를 활용할 수 있습니다. 

AWS Lake Formation은 AWS 리전 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오리건), EU(아일랜드), 아시아 태평양(도쿄)에서 이용할 수 있습니다. AWS Lake Formation이 제공되는 모든 리전을 보려면 AWS 리전 페이지로 이동하십시오. AWS Lake Formation 콘솔을 방문하여 AWS Lake Formation를 시작하십시오.