Veröffentlicht am: Dec 14, 2022

Wir freuen uns, heute die Veröffentlichung automatisch generierter Visualisierungen auf Feature-Ebene in Amazon SageMaker Data Wrangler ankündigen zu können. Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für Machine Learning (ML) von Wochen auf Minuten. Mit Data Wrangler können Sie den Prozess der Datenvorbereitung und des Feature Engineering vereinfachen sowie jeden Schritt des Datenvorbereitungs-Workflows, einschließlich der Datenauswahl, -bereinigung, -erkundung und -visualisierung, in einer einzigen visuellen Oberfläche durchführen. Data Wrangler bietet eine Vielzahl konfigurierbarer Visualisierungsoptionen, von allgemeinen Datenvisualisierungen wie Histogrammen, Streudiagrammen oder Tabellenzusammenfassungen bis hin zu erweiterten Visualisierungen wie der Erkennung von Anomalien oder der Zerlegung saisonaler Trends für Zeitreihendaten, Datenlecks und Feature-Bias für maschinelles Lernen. 

Ab heute generiert SageMaker Data Wrangler automatisch Visualisierungen für jedes Feature im Datensatz. Diese Visualisierungen werden nach dem Import des Datensatzes oben in jeder Spalte des Datensatzes angezeigt. Diese Automatisierung reduziert die undifferenzierte Arbeit für Data Scientists weiter, indem sie automatisch Erkenntnisse über Datenverteilungen und Datenqualität auf Feature-Ebene generiert. 

Mit den automatisch generierten Visualisierungen können Sie sofort Einblicke in Datenverteilungen und Datentypen erhalten, ohne eine einzige Codezeile schreiben zu müssen. Mithilfe dieser Einblicke können Sie Datenqualitätsprobleme wie Ausreißer, fehlende oder ungültige Werte usw. für jede Spalte im Datensatz leicht erkennen. Darüber hinaus können Sie mit dem Mauszeiger auf die Visualisierungen zeigen, um detaillierte Statistiken wie Anzahl und Prozentsatz zu sehen.  

Dieses Feature ist in allen AWS-Regionen, die Data Wrangler aktuell unterstützen, ohne Zusatzkosten allgemein verfügbar. Weitere Informationen erhalten Sie im AWS News Blog und in der Produktdokumentation von SageMaker Data Wrangler.