Publicado en: Nov 26, 2023
AWS Glue presenta una versión preliminar de una nueva capacidad de calidad de datos de Glue que utiliza algoritmos de detección de anomalías basados en machine learning (ML) para detectar problemas y anomalías de calidad de datos difíciles de encontrar. Esto ayuda a los clientes a identificar de forma proactiva los problemas de calidad y a solucionarlos, de modo que los usuarios de los datos puedan tomar decisiones empresariales seguras.
Los ingenieros y analistas de datos escriben reglas de calidad para medir y monitorear sus datos. Las reglas funcionan bien cuando saben qué esperar de los datos. Sin embargo, no pueden identificar patrones anómalos, como aumentos repentinos en los valores faltantes o disminuciones repentinas en los recuentos de registros. Con esta nueva capacidad, los ingenieros y analistas de datos ahora pueden habilitar fácilmente los algoritmos de detección de anomalías para analizar las estadísticas de datos a lo largo del tiempo y generar información sobre estos patrones anómalos. Esta nueva capacidad también recomienda reglas que se pueden agregar fácilmente a las canalizaciones de datos para un monitoreo continuo. Para obtener más información, consulte el blog y la documentación.
Esta nueva capacidad está disponible en versión preliminar en las siguientes regiones de AWS: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Asia-Pacífico (Tokio) y Europa (Irlanda).
Para obtener más información, lea la documentación y la entrada del blog.