게시된 날짜: Jul 23, 2021
이제 고객은 AWS Glue DataBrew를 사용해 프로파일 작업을 실행할 때 데이터 집합용으로 자동 생성할 데이터 품질 통계를 지정할 수 있습니다. 이를 통해 사용자는 데이터 집합의 특성 및 크기를 기반으로 복제 값, 상관관계, 이상값 결정 등과 같은 데이터 프로파일 통계를 사용자 지정하고 필요를 만족하는 통계만으로 사용자 지정 프로파일 개요를 생성할 수 있습니다.
DataBrew는 프로파일 작업의 모든 통계를 시각적 프로파일 대시보드에 표시하고 원시 데이터를 JSON 객체로 Amazon S3 버킷에 저장합니다. 고객은 표시될 통계를 제어하고 시간에 따른 수신 데이터의 품질을 모니터링하며 몇 분 안애 데이터의 변경 사항을 발견할 수 있습니다. 코드를 작성할 필요 없이 이 모든 일을 할 수 있습니다. 또한 고객은 이 블로그 포스트에 설명한 바와 같이 DataBrew 및 AWS Lambda를 사용해 자동화된 데이터 품질 알림을 설정할 수 있습니다.
시작하려면 AWS 관리 콘솔로 이동하거나 노트북 환경에 DataBrew 플러그인을 설치하고 DataBrew 설명서를 참조하세요.