게시된 날짜: Nov 28, 2018
AWS Lake Formation은 안전한 데이터 레이크를 며칠 안에 손쉽게 설정하도록 도와주는 서비스입니다. 데이터 레이크는 큐레이팅된 안전한 중앙 집중식 저장소로, 귀하의 모든 데이터를 원래 형식 및 분석에 필요한 형식으로 보관합니다. 데이터 레이크가 있으면 데이터 사일로를 분할하고 다양한 유형의 분석과 결합하여 통찰력을 얻을 수 있으며, 이를 바탕으로 더 나은 비즈니스 결정을 내릴 수 있습니다.
하지만 데이터 레이크를 설정하고 관리하는 과정에는 수동으로 해야 하는 복잡하고 시간이 많이 소요되는 작업이 포함됩니다. 이러한 작업에는 다양한 소스로부터 데이터를 불러오기, 데이터 흐름의 모니터링, 파티션 설정, 암호화 설정 및 키 관리, 변환 작업 정의 및 운영의 모니터링, 열 기반 형식으로 데이터 재정렬, 액세스 제어 설정 구성, 이중화 데이터 중복 제거, 링크된 기록 매칭, 데이터 세트에 액세스 부여, 추후 액세스 감사 등등이 있습니다.
Lake Formation으로 데이터 레이크를 생성하는 작업은 데이터가 상주할 위치 및 적용할 데이터 액세스 및 보안 정책을 정의하는 것만큼이나 간단합니다. Lake Formation은 데이터베이스 및 객체 스토리지의 데이터를 수집하고 카탈로그화한 후, 새로운 Amazon S3 데이터 레이크로 옮겨 기계 학습 알고리즘을 사용해 정제 및 분류한 다음, 민감한 데이터에 대한 액세스를 확보합니다. 이 과정이 마무리되면 사용자는 사용 가능한 데이터 세트 및 적절한 사용 방법이 설명된 중앙 집중식 데이터 카탈로그에 액세스할 수 있습니다. 그런 다음 사용자는 Amazon EMR for Apache Spark, Amazon Redshift, Amazon Athena, Amazon Sagemaker, Amazon QuickSight 등 원하는 분석 및 기계 학습 서비스를 통해 이러한 데이터 세트를 활용할 수 있습니다.
자세히 알아보고 평가판에 가입하려면 AWS Lake Formation 웹 페이지를 방문하십시오.
2018년 12월 10일에 열리는 AWS Lake Formation 웹 세미나에 참석하시려면 여기를 클릭하여 등록하십시오.