Publié le: Apr 7, 2021
AWS Glue propose désormais l'imputation des valeurs manquantes sur les jeux de données incomplets. Vous pouvez utiliser la transformation « Remplir les valeurs manquantes » pour obtenir des valeurs prédites pour les entrées vides dans une colonne de vos données. Cette fonction permet de nettoyer facilement les jeux de données qui ont des valeurs nulles ou vides afin qu'il ne soit pas nécessaire de les prendre en compte lors des requêtes.
« Remplir les valeurs manquantes » est une nouvelle transformation de ML dans AWS Glue qui apprend des modèles à partir des lignes complètes de votre jeu de données et prédit les valeurs des données manquantes dans une colonne que vous spécifiez. Elle fonctionne sur les données catégorielles et numériques dans les jeux de données tabulaires et utilise une combinaison de méthodes traditionnelles et de machine learning pour générer une colonne complète qu'AWS Glue ajoute à votre jeu de données. La façon la plus simple de commencer avec « Remplir les valeurs manquantes » est de la choisir dans la liste des transformations dans AWS Glue Studio.
La transformation « Remplir les valeurs manquantes » est disponible dans les mêmes régions AWS que pour AWS Glue.
Pour en savoir plus sur cette fonction, consultez notre documentation de référence et la documentation d'AWS Glue Studio.