Veröffentlicht am: Jun 26, 2023
Amazon SageMaker Data Wrangler ermöglicht jetzt eine direkte Verbindung zu Snowflake, um Daten vorzubereiten und Features für Machine Learning (ML) zu erstellen. SageMaker Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für ML in Amazon SageMaker Studio dank einer visuellen Oberfläche von Wochen auf Minuten.
Ab heute können Kunden über SageMaker Data Wrangler eine Verbindung zu Snowflake herstellen, ohne eine Speicherintegration von Amazon Simple Storage Service (Amazon S3) bereitstellen oder dauerhafte Datenkopien in S3 verwalten zu müssen. Dieses Feature reduziert den Zeitaufwand für die Konfiguration und vereinfacht die Verbindung zwischen SageMaker Data Wrangler und Snowflake, sodass es problemlos auf eine große Anzahl von Benutzern in Ihrem Unternehmen skaliert werden kann. In SageMaker Data Wrangler können Sie Datenbanken, Tabellen, Schemata durchsuchen und Daten aus Snowflake abfragen sowie Daten aus anderen gängigen Datenquellen wie S3, Amazon Athena, Amazon Redshift, Amazon EMR und über 50 SaaS-Anwendungen verknüpfen, um den richtigen Datensatz für ML zu erstellen. Mithilfe der visuellen Oberfläche von SageMaker Data Wrangler können Sie anschließend schnell die Datenqualität verstehen, die Daten bereinigen und Features mit über 300 integrierten Analysen und Datentransformationen erstellen. Sie können Modelle auch mit Amazon SageMaker Autopilot trainieren und bereitstellen und den Datenvorbereitungsprozess in einer Feature-Engineering-, Schulungs- oder Bereitstellungspipeline mithilfe von Amazon SageMaker Pipelines automatisieren.
SageMaker Data Wrangler unterstützt die direkte Verbindung zu Snowflake ohne zusätzliche Kosten in allen Regionen, die derzeit von SageMaker Data Wrangler unterstützt werden. Weitere Informationen finden Sie in diesem Blogbeitrag und in der technischen Dokumentation von AWS.