Veröffentlicht am: May 1, 2023
Amazon SageMaker Data Wrangler reduziert die Zeit, die zum Aggregieren und Aufbereiten von Daten für Machine Learning (ML) benötigt wird, von Wochen auf Minuten. Mit SageMaker Data Wrangler können Sie den Prozess der Datenaufbereitung und der Feature-Entwicklung vereinfachen und jeden Schritt des Datenvorbereitungsworkflows, einschließlich Datenauswahl, Erkundung, Bereinigung und Verarbeitung, von einer einzigen visuellen Oberfläche aus abschließen.
Ab heute können Sie die neuen Funktionen von Amazon SageMaker Data Wrangler nutzen, um Bilddaten für die Kennzeichnung, Schulung oder Inferenz vorzubereiten. Sie können Bilder in Amazon S3 in der Vorschau anzeigen und importieren und eine Vielzahl integrierter Bildtransformationen verwenden, um Ihre Bilddaten zu bereinigen, zu standardisieren und die Qualität zu verbessern. Zu diesen integrierten Transformationen gehören Größenänderung, Löschen von Duplikaten, Drehen, Spiegeln, Graustufen, Verbessern des Kontrasts, Weichzeichnen und Hinzufügen von Rauschen usw. Data Wrangler unterstützt auch erweiterte Anwendungsfälle wie das Erkennen von Ausreißern oder das Extrahieren von Texten aus Bildern mithilfe von benutzerdefiniertem Code und integrierten Codefragmenten. Diese Codefragmente enthalten Beispiele dafür, wie ein vortrainiertes Modell mithilfe von Amazon Sagemaker Jumpstart verwendet werden kann, um erweiterte Analysen oder Transformationen durchzuführen, indem ein vorab bereitgestellter Modellendpunkt aufgerufen wird. Nachdem Sie im interaktiven Modus ein Rezept für die gesampelten Bilddaten erstellt haben, können Sie über die visuelle Oberfläche einen PySpark-Job erstellen, um die Verarbeitung auf alle Bilder in Ihrem Datensatz zu skalieren.
Data Wrangler unterstützt die Bilddatenaufbereitung in allen Regionen, die derzeit von Data Wrangler unterstützt werden. Weitere Informationen finden Sie in diesem Blogbeitrag und in der technischen Dokumentation von AWS.