Veröffentlicht am: Jul 25, 2023

Amazon SageMaker Canvas unterstützt jetzt fünf neue Datentransformationen, sodass Sie Ihre Daten besser vorbereiten und analysieren können, bevor Sie Machine Learning (ML)-Modelle erstellen. Daten sind die Grundlage für Machine Learning, und die Umwandlung von Rohdaten, um sie für die Erstellung von ML-Modellen und die Erstellung von Prognosen nutzbar zu machen, ist der Schlüssel zu besseren Ergebnissen. Ab heute können Sie mit SageMaker Canvas den Datentyp in Ihren Spalten zwischen „Numeric“, „Text“ und „Datetime“ ändern und gleichzeitig das zugehörige Feature für diesen Datentyp wie „Binary“ und „Categorical“ anzeigen lassen. Dadurch haben Sie die Möglichkeit, die Art der Daten in Ihren Spalten auf der Grundlage der Features manuell zu ändern. Die Möglichkeit, den richtigen Datentyp auszuwählen, gewährleistet Datenintegrität und -genauigkeit vor der Erstellung von ML-Modellen. Durch die Verwendung des Datentyps „Datetime“ wird beispielsweise sichergestellt, dass nur gültige Datumsangaben in dieser bestimmten Spalte gespeichert werden. 

Darüber hinaus können Sie mit Canvas Zeitreihendaten neu erfassen, indem Sie regelmäßige Intervalle für die Messungen in Ihrem Zeitreihendatensatz festlegen. Dies ist besonders sinnvoll, wenn Zeitreihendaten unregelmäßig verteilte Messungen enthalten. Das erneute Messen dieser Daten hilft Ihnen, sie gleichmäßig auf regelmäßige Zeitintervalle zu verteilen, sodass sie für anschließende Vorgänge wie Analysen und Prognosen verwendet werden können. Außerdem bietet Canvas jetzt bessere Möglichkeiten, die Zeilen in Ihren Daten zu verwalten. Sie können sie in aufsteigender oder absteigender Reihenfolge sortieren, Zeilen zufällig mischen und doppelte Zeilen löschen.

Diese neuen Funktionen für die Datentransformation sind in allen AWS-Regionen verfügbar, in denen Canvas heute unterstützt wird. Weitere Informationen finden Sie in der Produktdokumentation.