Veröffentlicht am: Aug 29, 2022
Amazon SageMaker Data Wrangler reduziert die Zeit, die für die Aggregation und Vorbereitung von Daten für Machine Learning (ML) benötigt wird, von Wochen auf Minuten in Amazon SageMaker Studio, der ersten vollständig integrierten Entwicklungsumgebung (IDE) für ML. Mit SageMaker Data Wrangler kannst du den Prozess der Datenvorbereitung und des Feature-Engineerings vereinfachen, und jeden Schritt des Datenvorbereitungs-Workflows, einschließlich der Datenauswahl, -Bereinigung, -Erkundung und -Visualisierung, über eine einzige visuelle Oberfläche abschließen. Kunden, die Data Wrangler verwenden, können Daten aus Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks Lakehouse Platform und weiteren Quellen importieren.
Ab heute können Kunden, die Data Wrangler noch nicht kennen, Data Wrangler schneller nutzen, indem sie einen Beispieldatensatz verwenden und anhand einer Anleitung erstmals durch das Produkt navigieren. Data Wrangler stellt den öffentlichen Titanic-Datensatz zur Verfügung, der häufig zum Unterrichten und Experimentieren mit ML verwendet wird, sodass Kunden nicht mehr ihre eigenen Daten importieren müssen, um loszulegen. Data Wrangler schlägt jetzt Aktionen vor, um Neulinge dabei zu unterstützen, wichtige Funktionen zu entdecken, wie z. B. den Bericht zur Datenqualität und zu den Einblicken, eine beliebte Funktion, die die Datenqualität prüft und dir hilft, Anomalien in deinen Daten zu erkennen.
Um mehr über die ersten Schritte mit Amazon SageMaker Data Wrangler zu erfahren, besuche den Blog oder die AWS-Dokumentation.