게시된 날짜: Sep 20, 2023

이제 AWS Glue Data Quality를 통해 CustomSQL 규칙 유형이 있는 레코드를 식별할 수 있으므로 고객은 문제가 있는 레코드를 양호한 레코드에서 분리하여 고품질 데이터만 데이터 레이크 및 웨어하우스로 흐르도록 할 수 있습니다.

AWS Glue Data Quality는 자동으로 통계를 계산하고, 품질 규칙을 권장하며 데이터 품질을 모니터링하고, 품질 저하를 탐지하면 사용자에게 알립니다. 고객은 25개 이상의 사전 정의된 데이터 품질 규칙 유형을 사용하여 규칙을 생성하고 문제가 있는 데이터를 찾아 해결할 수 있습니다. 이러한 규칙 유형 중 하나는 CustomSQL 규칙 유형으로, 고객은 SQL로 복잡한 비즈니스 규칙을 작성하여 품질 문제를 식별할 수 있습니다. 지금까지는 CustomSQL 규칙 유형이 문제가 있는 레코드의 존재 여부는 식별하되 어떤 레코드에 문제가 있는지 특정하지는 못했습니다. 이번 새 릴리스에서는 CustomSQL 규칙 유형이 규칙 실패의 원인이 되는 특정 레코드를 정확히 찾아내어 격리 플래그를 지정할 수 있습니다. 이 기능을 통해 고객은 SQL로 강력한 비즈니스 규칙을 생성하고, 문제가 있는 레코드를 탐지 및 격리하고, 고품질 데이터를 데이터 리포지토리로 전달할 수 있습니다.

자세한 내용은 설명서블로그를 참조하세요.

이 기능은 AWS Glue가 제공되는 모든 상용 AWS 리전에서 사용할 수 있습니다.