Veröffentlicht am: Apr 7, 2021
AWS Glue bietet jetzt die Imputation fehlender Werte bei unvollständigen Datasets. Sie können die Transformation "Fill Missing Values" verwenden, um vorhergesagte Werte für leere Einträge in einer Spalte Ihrer Daten zu erhalten. Diese Funktion erleichtert das Bereinigen von Datasets mit Null- oder Leerwerten, sodass diese bei der Abfrage nicht berücksichtigt werden müssen.
Fill Missing Values ist eine neue ML-Transformation in AWS Glue, die Muster aus den vollständigen Zeilen in Ihrem Dataset lernt und Werte für fehlende Daten in einer von Ihnen angegebenen Spalte vorhersagt. Sie funktioniert sowohl mit kategorialen als auch mit numerischen Daten in tabellarischen Datasets und verwendet eine Kombination aus herkömmlichen und maschinellen Lernmethoden, um eine vollständige Spalte zu generieren, die AWS Glue an Ihren Datensatz anhängt. Die einfachste Möglichkeit, um mit Fill Missing Values zu beginnen, ist die Auswahl aus der Liste der Transformationen in AWS Glue Studio.
Die Fill-Missing-Values-Transformation ist in denselben AWS-Regionen wie AWS Glue verfügbar.
Um mehr über diese Funktion zu erfahren, besuchen Sie unsere Referenzdokumentation und die Dokumentation zu AWS Glue Studio.