Veröffentlicht am: Oct 6, 2021
Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für Machine Learning (ML) von Wochen auf Minuten. Mit SageMaker Data Wrangler können Sie den Prozess der Datenaufbereitung und des Merkmal-Engineerings vereinfachen, und jeden Schritt des Datenaufbereitungs-Arbeitsprozess, einschließlich der Datenauswahl, -Bereinigung, -Erkundung und -Visualisierung, über eine einzige visuelle Oberfläche abschließen.
Ab heute können Sie neue Funktionen von Amazon SageMaker Data Wrangler verwenden, die die Vorbereitung von Daten für ML vereinfachen und beschleunigen, einschließlich einer neuen Sammlung von Zeitreihentransformationen und zwei neuen Zeitreihenvisualisierungen, um schnell Erkenntnisse aus Ihren Zeitreihendaten zu gewinnen. Die neuen Zeitreihentransformationen unterstützen die Imputation von fehlenden Werten, die Ausstattung von Zeitreihen (z. B. Fourier-Koeffizienten, Autokorrelationsstatistiken, Entropie usw.), Neuabtast-Operatoren zum Abtasten von Datensätzen nach oben oder nach unten auf eine einheitliche Frequenz, Zeitverzögerungsmerkmale und Rollfensterfunktionen. Die neuen Transformationen unterstützen auch allgemeinere Operationen wie Gruppieren, Vereinheitlichen der Länge, Reduzieren und Exportieren von vektorwertigen Spalten.
Darüber hinaus können Sie jetzt Saisonalität und Trends in Ihren Daten visualisieren und Anomalien mit neuen Zeitreihenvisualisierungen in Amazon SageMaker Data Wrangler identifizieren. Mit der Saisonalitäts- und Trendvisualisierung können Sie beispielsweise saisonale Effekte von Trends in Ihren Verkaufsdaten trennen. Darüber hinaus können Sie mit der Visualisierung der Ausreißererkennung Ausreißer in Ihren Kundenkaufdatensätzen identifizieren, um Änderungen im Kaufverhalten der Kunden zu erkennen.
Zum Einstieg in die neuen Funktionen von Amazon SageMaker Data Wrangler können Sie Amazon SageMaker Studio nach dem Upgrade auf die neueste Version öffnen und im Menü auf Datei > Neu > Fluss oder im SageMaker Studio Launcher auf „Neuer Datenfluss“ klicken. Weitere Informationen zu den neuen Zeitreihentransformationen und Visualisierungen finden Sie in der Dokumentation.