Publicado en: Oct 2, 2023

AWS anuncia la disponibilidad general de Calidad de datos de AWS Glue en las regiones de AWS GovCloud (Este de EE. UU. y Oeste de EE. UU.). Calidad de datos de Glue mide y supervisa automáticamente la calidad de los datos en los repositorios de datos y en las canalizaciones de extracción, transformación y carga (ETL) de AWS Glue. AWS Glue es un servicio de integración de datos escalable y sin servidor que facilita la detección, la preparación, el traslado y la integración de datos de varias fuentes.

Calidad de datos de AWS Glue ayuda a reducir la necesidad de realizar trabajos manuales de calidad de los datos al realizar análisis automáticos para obtener estadísticas de datos. Utiliza Deequ de código abierto para evaluar las reglas y medir y monitorear la calidad de los datos de los lagos de datos a escala de petabytes. Luego, recomienda reglas de calidad de los datos para comenzar. Puede actualizar las reglas recomendadas o añadir reglas nuevas. Si la calidad de los datos se deteriora, puede configurar acciones para alertar a los usuarios y profundizar en la causa principal del problema. Las reglas y acciones de calidad de los datos también se pueden configurar en las canalizaciones de datos de AWS Glue, lo que ayuda a evitar que los datos “defectuosos” ingresen a los lagos y almacenes de datos.

Con esta disponibilidad general, los clientes ahora pueden administrar la calidad de los datos en las regiones de AWS GovCloud (EE. UU.). Para obtener más información, visite Calidad de datos de AWS Glue.