Veröffentlicht am: Nov 29, 2023
Amazon SageMaker-Notebook-Jobs ermöglichen es Datenwissenschaftlern, ihre Notebooks nach Bedarf oder nach einem Zeitplan mit wenigen Klicks in Amazon SageMaker Studio, einer webbasierten IDE für Machine Learning (ML), auszuführen. Heute freuen wir uns, Ihnen mitteilen zu können, dass Sie Notebooks mithilfe von APIs, die von SageMaker Pipelines, dem ML-Workflow-Orchestrierungsdienst von SageMaker, bereitgestellt werden, programmgesteuert als Jobs ausführen können. Darüber hinaus können Sie mithilfe dieser APIs einen mehrstufigen ML-Workflow mit mehreren abhängigen Notebooks erstellen.
Datenwissenschaftler können SageMaker Notebooks Jobs für Anwendungsfälle wie das Ausführen von Notebooks mit langer Laufzeit, die Generierung wiederkehrender Berichte und für die Skalierung von der Vorbereitung kleiner Stichprobendatensätze auf die Arbeit mit Big Data im Petabyte-Bereich verwenden. Bei der Umstellung dieser Notebooks in die Produktion benötigen Kunden API-Unterstützung für die programmgesteuerte Ausführung von Notebooks als Teil von CI/CD-Workflows. Mit diesem Launch wird der Notebook-Job als integrierten Schritttyp beim Erstellen von Pipelines mit Amazon SageMaker Pipelines eingeführt. Kunden können diesen Notebook-Jobschritt nutzen, um Notebooks mithilfe des Amazon SageMaker Python SDK mit nur wenigen Codezeilen einfach als Jobs auszuführen. Darüber hinaus können Kunden auch mehrere voneinander abhängige Notizbücher zusammenfügen, um einen Workflow in Form von Directed Acyclic Graphs (DAG) zu erstellen. Kunden können diese Notebook-Jobs oder DAGs dann ausführen und sie mithilfe von Amazon SageMaker Studio verwalten und visualisieren.
Diese Funktion ist generell in allen kommerziellen AWS-Regionen verfügbar, in denen Amazon SageMaker Studio verfügbar ist. Weitere Informationen finden Sie im Entwicklerhandbuch von SageMaker Studio oder im Feature-Blog.