Publicado en: Apr 7, 2021
Ahora AWS Glue ofrece la función de imputación de datos faltantes para bases de datos incompletas. Puede utilizar la transformación Fill Missing Values para obtener los valores esperados para las entradas en blanco de una columna de datos. Esta característica facilita la limpieza de conjuntos de datos nulos o vacíos para que no sean tenidos en cuenta durante el tiempo de consultas.
Fill Missing Values es una nueva transformación ML de AWS Glue que aprende patrones de todas las filas de las bases de datos y predice los valores de los datos faltantes en una columna especificada. Funciona tanto con datos categóricos como numéricos en conjuntos de datos tabulares y utiliza la combinación de métodos tradicionales y de machine learning para generar una columna completa que AWS Glue agrega al conjunto de datos. La manera más fácil de empezar a utilizar Fill Missing Values es seleccionarlo en la lista de transformaciones de AWS Glue Studio.
La transformación Fill Missing Values está disponible en las mismas Regiones de AWS que AWS Glue.
Para más información sobre esta característica, consulte nuestra documentación de referencia y la documentación de AWS Glue Studio.