Veröffentlicht am: Apr 17, 2024
Die JupyterLab-Notebooks von Amazon SageMaker Studio verfügen jetzt über eine integrierte SQL-Erweiterung, mit der Datenwissenschaftler Daten aus mehreren Datenquellen mithilfe von SQL und Python direkt von den Notebooks aus nahtlos entdecken, untersuchen und transformieren können.
Datenwissenschaftler, die an Studio-Notebooks arbeiten, können sich jetzt über AWS-Glue-Verbindungen nahtlos mit beliebten Datendiensten wie Amazon Athena, Amazon Redshift und Snowflake verbinden. Administratoren können diese Verbindungen sicher verwalten, sodass Datenwissenschaftler auf autorisierte Daten zugreifen können, ohne Anmeldeinformationen manuell verwalten zu müssen. Sobald eine Verbindung zu einer Datenquelle hergestellt ist, können Datenwissenschaftler problemlos nach Datenbanken, Schemas, Tabellen und Ansichten suchen und eine Vorschau der Daten in der Notebook-Oberfläche anzeigen. Sie können dann SQL- und Python-Code im selben Notebook mischen, um Daten für die Verwendung in Machine-Learning-Projekten effizient zu untersuchen und zu transformieren. Zusätzliche Funktionen wie die Vervollständigung von SQL-Befehlen, Unterstützung bei der Codeformatierung und Syntaxhervorhebung beschleunigen die Codeentwicklung und verbessern die allgemeine Produktivität der Entwickler. Durch die Integration beliebter Datendienste, SQL/Python-Datenexploration und durchgängiges Machine Learning in eine einheitliche Benutzeroberfläche reduziert SageMaker Studio die Notwendigkeit, dass Datenwissenschaftler bei der Arbeit an Analyse- und Machine-Learning-Aufgaben zwischen Tools wechseln müssen, was zu erheblichen Zeiteinsparungen und höherer Produktivität führt.
Diese Funktion ist in allen kommerziellen AWS-Regionen verfügbar, in denen SageMaker Studio verfügbar ist.
Weitere Informationen finden Sie in diesem Blog und im Entwicklerhandbuch zu SageMaker.