Veröffentlicht am: Mar 22, 2023
Amazon SageMaker Data Wrangler unterstützt jetzt die OAuth-basierte Authentifizierung mit Identitätsanbietern wie Okta, Microsoft Azure AD und Ping Federate für den Zugriff auf Daten in Snowflake für Machine Learning (ML). Data Wrangler reduziert den Zeitaufwand für die Zusammenführung und Vorbereitung von Daten für ML in Amazon SageMaker Studio dank einer visuellen Benutzeroberfläche von Wochen auf Minuten.
Mit dieser Einführung können Kunden, die einen einzigen Identitätsanbieter verwenden möchten, ihre Benutzer, Gruppen und Zugriffskontrollen für alle Anwendungen, einschließlich Snowflake, verwalten. Sobald die Administratoren den OAuth-Zugriff auf Snowflake für Data Wrangler konfiguriert haben, können Sie sich bei der Verbindung von Data Wrangler zu Snowflake mit dem Identitätsanbieter Ihres Unternehmens anmelden, um Daten für ML zu übernehmen. Sie können Daten aus anderen beliebten Datenquellen wie Amazon S3, Amazon Athena, Amazon Redshift, Amazon EMR und über 40 von Data Wrangler unterstützten SaaS-Anwendungen zusammenführen, um den richtigen Datensatz für ML zu erstellen. Mit der visuellen Benutzeroberfläche von Data Wrangler können Sie schnell die Datenqualität verstehen, die Daten bereinigen und Features mit über 300 integrierten Analysen und Datentransformationen erstellen. Von Data Wrangler aus können Sie auch Modelle mit SageMaker Autopilot trainieren und bereitstellen und den Datenaufbereitungsprozess in einem Feature Engineering, Training oder einer Pipeline mithilfe der Integration mit SageMaker Pipeline operationalisieren.
Data Wrangler unterstützt ohne zusätzliche Kosten Okta, Microsoft Azure AD und Ping Federate für Snowflake-Verbindungen in allen Regionen, die derzeit von Data Wrangler unterstützt werden. Weitere Informationen finden Sie in diesem Blog-Beitrag und in der technischen Dokumentation von AWS.