Veröffentlicht am: Oct 21, 2022
Wir freuen uns, heute den Support für die Planung von Verarbeitungsaufträgen von Data-Wrangler in Amazon SageMaker Data Wrangler bekannt geben zu können. Amazon SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für Machine Learning (ML) von Wochen auf Minuten. Mit SageMaker Data Wrangler kannst du den Prozess der Datenvorbereitung und des Feature Engineerings vereinfachen und jeden Schritt des Datenvorbereitungs-Workflows, einschließlich der Datenauswahl, -reinigung, -erkundung und -visualisierung, über eine einzige visuelle Oberfläche abschließen. Bisher war für die Planung eines Datenverarbeitungsauftrags die Integration mit einer Serverless-Rechenkapazität und einem Event-Bus-Service erforderlich. Dieser Prozess beinhaltet auch das Schreiben von Code zur Planung der Datenverarbeitungsaufträge in einer Produktionsumgebung. Die Integration dieser verschiedenen Funktionen und das Schreiben des Codes zur Orchestrierung dieses Workflows kann für Datenwissenschaftler, Dateningenieure und ML-Ingenieure eine mühsame und zeitaufwändige Aufgabe sein.
Mit dem Support für die Planung in Data Wrangler kannst du jetzt einen Verarbeitungsauftrag von Data Wrangler mit wenigen Klicks planen. Aufträge können so geplant werden, dass sie zu bestimmten Zeiten und an bestimmten Wochentagen ausgeführt werden. Zeitpläne können auch für zusätzliche Anpassungen und Flexibilität als CRON-Ausdrücke eingegeben werden (z. B. um einen Job zu planen, der am ersten Mittwoch eines Kalendermonats durchgeführt wird). Du kannst an einem Verarbeitungsauftrag von Data Wrangler bis zu zwei Zeitpläne anhängen. Sobald ein gewünschter Zeitplan eingegeben wurde, zeigt Data Wrangler zur zusätzlichen Bestätigung eine Vorschau der fünf nächsten anstehenden Auftragsdurchläufe an. Du kannst auf diese Planungsfunktion als Teil des „Auftrag erstellen“-Workflows in Data Wrangler zugreifen.
Diese Funktion ist allgemein in allen AWS-Regionen, die Data Wrangler aktuell unterstützt, ohne zusätzliche Kosten verfügbar. Um mit der Planung deiner Datenverarbeitungsaufträge mit SageMaker Data Wrangler zu beginnen, lies die AWS-Dokumentation.