Amazon SageMaker Unified Studio, 이제 데이터 품질 규칙 작성과 평가 지원

게시된 날짜: 2026년 5월 20일

Amazon SageMaker Unified Studio가 이제 AWS Glue Data Quality를 기반으로 하는 데이터 품질 규칙 작성과 평가를 지원합니다. 데이터 엔지니어, 분석가, 데이터 과학자는 카탈로그 테이블의 저장 데이터와 Visual ETL 작업 내의 전송 중 데이터 모두에 대해 SageMaker Unified Studio 내에서 직접 데이터 품질 규칙을 정의하고, 규칙 세트 평가를 실행하고, 결과를 볼 수 있습니다. 이를 통해 불량 데이터가 데이터 레이크에 유입되거나 다운스트림 분석과 기계 학습 워크로드에 영향을 미치기 전에 데이터 품질 문제를 감지할 수 있습니다.

이번 출시로 AWS Glue Data Quality에 사용되는 것과 동일한 데이터 품질 정의 언어(DQDL)를 사용하여 규칙을 작성하고 SageMaker Unified Studio에서 두 워크플로에 걸쳐 직접 평가를 실행할 수 있습니다. 저장 데이터의 경우 카탈로그 자산의 전용 데이터 품질 탭에서 규칙 작성, 요청 시 또는 예약된 평가 그리고 규칙별 합격/불합격 결과에 대한 자세한 정보를 제공합니다. 전송 중 데이터의 경우 모든 Visual ETL 작업에 데이터 품질 평가 변환을 추가하고, 실행 세부 정보의 일부로 데이터 품질 결과를 검토할 수 있습니다. 완전성, 고유성, 최신성, 정확성 그리고 기타 데이터 품질 차원을 확인하는 규칙 세트를 만들 수 있습니다.

이 기능은 Amazon SageMaker Unified Studio가 제공되는 모든 AWS 리전의 AWS IAM Identity Center 기반 및 IAM 기반 도메인 모두에서 사용할 수 있습니다. 자세한 내용은 Amazon SageMaker Unified Studio 설명서를 참조하세요.