Amazon SageMaker Canvas unterstützt jetzt den Import von Datenflüssen und die schnellere Datenaufbereitung für ML

Veröffentlicht am: 20. Aug. 2024

Amazon SageMaker Data Wrangler in Amazon SageMaker Canvas unterstützt jetzt das Importieren von Datenflüssen aus Amazon SageMaker Studio Classic sowie eine schnellere und flexiblere Datenaufbereitung für Machine Learning (ML). Mit der neuesten Version von SageMaker Data Wrangler in SageMaker Canvas können Sie jetzt Daten mit benutzerdefinierten Trennzeichen und erweiterten Stichprobenoptionen einfacher aus S3 importieren und Daten mit gesteigerter Leistung aufbereiten. Außerdem können Sie Transformationen schneller validieren und die Datenrezepte einfach iterieren. Sie können auch Datenflüsse aus SageMaker Studio Classic importieren, um die Vorteile der neuesten Datenaufbereitungsfunktionen und Erweiterungen in SageMaker Canvas zu nutzen.

Das Aggregieren, Analysieren und Transformieren großer Datenmengen ist der zeitaufwendigste Teil eines ML-Projekts, zumal es sich hierbei um einen hochgradig iterativen und repetitiven Prozess handelt. Mit den neuen Erweiterungen können Sie Daten mit unterschiedlichen Stichprobenmethoden wie „Top-k“, „zufällig“ oder „geschichtet“ importieren und Stichprobenumfang und -methode nach Bedarf anpassen, um eine repräsentative Stichprobe zu erhalten. Sie können Daten mit geringerer Latenz umwandeln, den Einfluss der Transformationen auf die Datengröße schnell validieren und die Schritte entsprechend neu anordnen. Zudem können Sie ein Datenrezept kopieren und die Datenquellen ersetzen, um diese für verschiedene Datensätze und Modelle wiederzuverwenden. Darüber hinaus können Sie mit einem Klick alle bestehenden Datenflüsse von SageMaker Data Wrangler in SageMaker Studio Classic nach SageMaker Canvas importieren oder spezifische Datenflüsse über S3 oder lokale Dateiuploads manuell importieren.

Die erweiterten Funktionen für die Datenaufbereitung sind in allen AWS-Regionen verfügbar, in denen SageMaker Canvas unterstützt wird. Weitere Informationen finden Sie im Blog und in der technischen Dokumentation von AWS.