Veröffentlicht am: May 7, 2021
Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für maschinelles Lernen (ML) von Wochen auf Minuten. Mit SageMaker Data Wrangler können Sie den Prozess der Datenaufbereitung und des Merkmal-Engineerings vereinfachen, und jeden Schritt des Datenaufbereitungs-Arbeitsprozess, einschließlich der Datenauswahl, -bereinigung, -erkundung und -visualisierung, über eine einzige visuelle Oberfläche abschließen. Ab heute können Sie neue Funktionen von Amazon SageMaker Data Wrangler nutzen, welche die Vorbereitung von Daten für Machine Learning vereinfachen und beschleunigen, darunter: kontoübergreifender Zugriff auf Amazon S3, Support für bis zu 1000 Datenspalten, verteilte Aufträge und ein neues SageMaker Data Wrangler Notebook-Erlebnis.
Mit der Einführung des kontoübergreifenden Zugriffs auf Amazon S3 können Sie Daten aus jedem S3-Bucket importieren, auf das Sie Zugriff haben, und Daten in Ihren S3-Buckets einfach durchsuchen, unabhängig davon, in welchem Konto sie sich befinden. Nach dem Navigieren zum S3-Bucket können Sie den Inhalt des S3-Buckets interaktiv durchsuchen und mit einem einzigen Klick in Amazon SageMaker Data Wrangler importieren. Außerdem erfordern viele Machine Learning-Anwendungen die Aufbereitung von Datensätzen mit Hunderten von Spalten. Mit der Einführung des Supports für 1000-Spalten-Datensätze können Sie problemlos Daten für Machine Learning-Anwendungen vorbereiten. Mit dezentralen Aufträgen können Sie jetzt Ihre Datenverarbeitungs-Workloads auf mehrere Instances skalieren, um Daten nahezu beliebiger Größe zu verarbeiten. Heute ist es möglich, eine Instance-Anzahl von mehr als 1 für die Instance-Typen ml.m5.4xlarge, ml.m5.12xlarge und ml.m5.24xlarge anzugeben, um Ihre Datenverarbeitungs-Workloads einfach zu skalieren. Dank der neuen Notizbuchfunktion von SageMaker Data Wrangler sind die Notizbücher für Aufträge nun noch einfacher zu bedienen. Die Notizbücher wurden für eine einfache Konfiguration reorganisiert und bieten eine Dokumentation, um den Einstieg zu erleichtern.
Zum Einstieg in die neuen Funktionen von Amazon SageMaker Data Wrangler können Sie Amazon SageMaker Studio öffnen und im Menü auf "File > New > Flow" oder im SageMaker Studio Launcher auf "new data flow" klicken. Mehr erfahren Sie auf der Funktionsseite oder lesen Sie die Dokumentation.