Amazon SageMaker Unified Studio Notebooks unterstützen jetzt EMR Serverless
Amazon SageMaker Unified Studio Notebooks unterstützen nun Amazon EMR Serverless mit Apache Spark Connect. Dadurch erhalten Data Engineers und Analysten mehr Flexibilität bei der Wahl ihrer Spark-Laufzeitumgebung für interaktive Analysen und Data-Engineering-Workloads. Zusätzlich zu Amazon Athena Spark können Benutzer nun Amazon EMR Serverless als Spark-Laufzeitumgebung verwenden und die jeweils passende Engine entsprechend ihren Anforderungen auswählen.
Mit diesem Launch können Sie PySpark und Spark SQL auf einer EMR-Serverless-Spark-Anwendung in Notebook-Zellen ausführen. Benutzer können ihre Spark-Laufzeitumgebung in der Seitenleiste des Notebooks auswählen und die ausgewählte Laufzeit gilt sowohl für Python- als auch für SQL-Zellen. Darüber hinaus können Benutzer SageMaker Data Agent, den integrierten KI-Assistenten, einsetzen, um Code und Ausführungspläne aus natürlichsprachlichen Prompts zu generieren und so Spark-Entwicklungsworkflows mit EMR Serverless zu beschleunigen. Organisationen können vorinitialisierte Kapazität nutzen, um Sitzungsstartzeiten zu verbessern, und profitieren zugleich von einer einheitlichen Spark-UI-Überwachung über alle unterstützten Engines hinweg, die eine konsistente Transparenz der Jobausführung und Performance bietet. Zusätzlich unterstützt EMR Serverless VPC-Konnektivität für Workloads, die Netzwerkisolierung erfordern.
Diese Funktion ist in allen AWS-Regionen verfügbar, in denen Amazon SageMaker Unified Studio angeboten wird, und unterstützt sowohl SageMaker Unified Studio Notebooks als auch JupyterLab-IDE-Umgebungen. Weitere Informationen finden Sie im Benutzerleitfaden für Amazon SageMaker Unified Studio.