Veröffentlicht am: Aug 21, 2023
Amazon SageMaker Data Wrangler unterstützt jetzt S3-Zugriffspunkte für die Vorschau und den Import von Daten in SageMaker Data Wrangler und als Ziel für aus SageMaker Data Wrangler exportierte Daten. Die Aufbereitung hochwertiger Daten für ML ist oft komplex und zeitaufwändig, da sie die Aggregation von Daten aus verschiedenen Quellen und Formaten mit unterschiedlichen Tools erfordert. Mit SageMaker Data Wrangler können Sie Daten aus einer Vielzahl beliebter Quellen wie Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks und über 40 Saas-Datenquelle untersuchen und importieren. Kunden nutzen Amazon S3 zunehmend zur Speicherung gemeinsam genutzter Datensätze, in denen Daten zusammengefasst sind und auf die verschiedene Anwendungen, Teams und Einzelpersonen zugreifen. S3-Zugriffspunkte ermöglichen es Organisationen, eine differenzierte Zugriffskontrolle auf granularer Ebene zu gewähren. Anstatt eine einzige Bucket-Richtlinie zu ändern, können Organisationen mehrere Zugriffspunkte mit individuellen, auf bestimmte Anwendungsfälle zugeschnittenen Richtlinien erstellen und so das Risiko einer Fehlkonfiguration oder eines unbeabsichtigten Zugriffs auf sensible Daten verringern. Ab heute erleichtert SageMaker Data Wrangler Kunden die Aufbereitung von Daten aus gemeinsam genutzten, in S3 gespeicherten Datensätzen und ermöglicht gleichzeitig Organisationen, den Datenzugriff in ihrer Organisation sicher zu kontrollieren.
Sobald die Daten importiert sind, können Sie die Datenqualität schnell erfassen, die Daten bereinigen und mit über 300 integrierten Analyse- und Datenumwandlungsfunktionen Features erstellen. Sie können mithilfe von SageMaker Autopilot auch Modelle trainieren und bereitstellen. Darüber hinaus können Sie über die Integration mit SageMaker Pipeline von SageMaker Data Wrangler den Datenaufbereitungsprozess in einer Feature-Engineering-, Trainings- oder Bereitstellungspipeline operationalisieren.
SageMaker Data Wrangler unterstützt Amazon S3 Access Points in allen Regionen, die aktuell von Data Wrangler unterstützt werden. Weitere Informationen findest du in der technischen Dokumentation von AWS.