Amazon SageMaker Unified Studio ahora admite la creación y evaluación de reglas de calidad de datos
Amazon SageMaker Unified Studio ahora admite la creación y evaluación de reglas de calidad de datos con la tecnología de Calidad de datos de AWS Glue. Los ingenieros de datos, los analistas y los científicos de datos pueden definir reglas de calidad de datos, realizar evaluaciones de conjuntos de reglas y ver los resultados directamente en SageMaker Unified Studio, tanto para los datos en reposo en las tablas de catálogo como para los datos en tránsito en los trabajos de ETL visual. Esto le ayuda a detectar los problemas de calidad de los datos antes de que los datos incorrectos entren en sus lagos de datos o afecten a las cargas de trabajo posteriores de análisis y machine learning.
Con este lanzamiento, puede crear reglas con el mismo lenguaje de definición de calidad de datos (DQDL) que se utiliza en Calidad de datos de AWS Glue y realizar evaluaciones directamente en SageMaker Unified Studio en dos flujos de trabajo. Para los datos en reposo, una pestaña dedicada a la calidad de los datos en los activos del catálogo proporciona la creación de reglas, las evaluaciones programadas o bajo demanda, y los resultados detallados por regla aprobada o rechazada. Para los datos en tránsito, puede añadir una transformación de evaluación de la calidad de los datos a cualquier trabajo de ETL visual y revisar los resultados de la calidad de los datos como parte de los detalles de la ejecución. Puede crear conjuntos de reglas que comprueben la integridad, la unicidad, la actualidad, la precisión y otras dimensiones de la calidad de los datos.
Esta característica está disponible en todas las regiones de AWS en las que esté disponible Amazon SageMaker Unified Studio, tanto en los dominios basados en AWS IAM Identity Center como en los basados en IAM. Para obtener más información, consulte la documentación de Amazon SageMaker Unified Studio.