Veröffentlicht am: Dec 8, 2020
Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für maschinelles Lernen (ML) von Wochen auf Minuten. Mit Amazon SageMaker Data Wrangler können Sie den Prozess der Datenaufbereitung und des Merkmal-Engineerings vereinfachen, und jeden Schritt des Datenaufbereitungs-Arbeitsprozess, einschließlich der Datenauswahl, -bereinigung, -erkundung und -visualisierung, über eine einzige visuelle Oberfläche abschließen.
Für die meisten ML-Modelle können Sie Wochen oder Monate damit verbringen, Daten aus verschiedenen Quellen zusammenzuführen und vorzubereiten: Konvertieren, Umwandlung und Validieren von Rohdaten in Merkmalen, die zum Trainieren von Modellen und für Vorhersagen verwendet werden können. Sie müssen Code schreiben, um Datenumwandlungen zu verfassen, damit Sie Daten in Formate umwandeln können, die effizient für ein Modell verwendet werden können, und zusätzlichen Code schreiben, der im Maßstab über eine große Anzahl von Datenquellen ausgeführt werden kann - Zeit, die weitaus besser für höherwertige Aufgaben verwendet werden kann.
Mit dem Datenauswahl-Werkzeug von Amazon SageMaker Data Wrangler können Sie die gewünschten Daten aus verschiedenen Datenquellen, einschließlich Amazon S3, Amazon Athena, Amazon Redshift, AWS Lake Formation, und Amazon SageMaker Feature Store, auswählen und mit einem einzigen Klick importieren. Amazon SageMaker Data Wrangler enthält über 300 integrierte Datenumwandlungen, sodass Sie schnell Funktionen normalisieren, umwandeln, und kombinieren können, ohne Code schreiben zu müssen. Mit den Visualisierungsvorlagen von Amazon SageMaker Data Wrangler können Sie in Amazon SageMaker Studio, der ersten vollständig integrierten Entwicklungsumgebung (IDE) für ML, schnell eine Vorschau anzeigen und prüfen, ob diese Umwandlungen wie beabsichtigt abgeschlossen sind. Sobald Ihre Daten vorbereitet sind, können Sie mit Amazon SageMaker Pipelines vollautomatische ML-Arbeitsprozesse erstellen, und diese zur Wiederverwendung im Amazon SageMaker Feature Store speichern.
Amazon SageMaker Data Wrangler ist jetzt allgemein in allen AWS Regionen verfügbar, in denen Amazon SageMaker Studio auch verfügbar ist. Um mit Amazon SageMaker Data Wrangler zu beginnen, besuchen Sie unsere Dokumentation.