- Amazon SageMaker›
- Amazon-SageMaker-Datenverarbeitung›
- Häufig gestellte Fragen
Häufig gestellte Fragen zur Amazon-SageMaker-Datenverarbeitung
Allgemeines
Was ist Amazon-SageMaker-Datenverarbeitung?
Amazon-SageMaker-Datenverarbeitung analysiert, bereitet, integriert und orchestriert Ihre Daten mit Verarbeitungsfunktionen von Amazon Athena, Amazon EMR, AWS Glue und Amazon Managed Workflows für Apache Airflow (MWAA). Sie können Open-Source-Datenverarbeitungs-Frameworks wie Apache Spark nutzen, Daten mit Trino im großen Maßstab analysieren und mit Apache Flink und Apache Spark nahtlos Echtzeitanalytik erstellen.
Welche Dienste sind in SageMaker Data Processing enthalten?
SageMaker Data Processing vereint Amazon EMR, Athena, AWS Glue und Amazon MWAA.
Warum sollte ich SageMaker-Datenverarbeitung verwenden?
SageMaker-Datenverarbeitung hilft Ihnen dabei, Daten zu untersuchen, Datentransformationsaufträge zu erstellen, Datenpipelines in großem Umfang zu orchestrieren und bereitzustellen. Sie verbessert die Leistung und liefert schnellere Einblicke als herkömmliche Open-Source-Systeme mit kostengünstigen und Open-Source-API-kompatiblen Versionen von Apache Spark, Apache Airflow, Apache Flink, Trino und mehr. Die Datenverarbeitung ermöglicht den Zugriff auf Ihre Datenquellen in Amazon SageMaker Lakehouse über Null-ETL-Integrationen, Verbundabfragefunktionen und Konnektoren.
Migration und Zugriff
Muss ich zu SageMaker migrieren, um bestehende Dienste wie Amazon EMR, Athena oder AWS Glue nutzen zu können?
Nein, Sie müssen nicht zu SageMaker migrieren. Sie können Amazon EMR, Athena, AWS Glue und Amazon MWAA weiterhin wie bisher verwenden. Wir empfehlen Ihnen jedoch, mit SageMaker zu beginnen, um einheitliche Tools, integrierte Datenverwaltung und vereinfachte SageMaker Lakehouse-Architekturen zu verwenden.
Was passiert mit den Aufträgen, Abfragen, Code und Ressourcen, die ich bereits in Amazon EMR, Athena oder AWS Glue erstellt habe oder zu erstellen plane?
Es hat keine Auswirkungen auf aktuellen Code, Abfragen, Aufträge und andere Ressourcen, die Sie mit Amazon EMR, Athena oder AWS Glue erstellt und verwendet haben. Sie können diese Services weiterhin für neue Workloads verwenden, wenn Sie dies bevorzugen. Ressourcen, die in diesen Diensten erstellt wurden, wie Amazon EMR auf Amazon Elastic Compute Cloud (Amazon EC2) -Clustern, sind in SageMaker sichtbar, um die Entwicklung von Analyse- und KI-Anwendungen zu vereinfachen. Bestehende Entwicklungserlebnisse, die in Amazon EMR, AWS Glue und Athena integriert sind, werden weiterhin existieren, zusätzlich zu einem neuen Entwicklungserlebnis innerhalb von Amazon SageMaker.
Welche Version von AWS Glue ist in SageMaker verfügbar?
Die neueste Version von AWS Glue, AWS Glue 5.0, ist in SageMaker verfügbar. AWS Glue 5.0 beschleunigt Datenverarbeitungs-Workloads und bietet die neueste leistungsoptimierte Apache-Spark-3.5.2-Laufzeit, sodass Sie für schnellere Einblicke entwickeln, ausführen und skalieren können. Weitere Informationen finden Sie unter AWS Glue.
Preise
Was ist das Preismodell für SageMaker-Datenverarbeitung?
Für jeden AWS-Service, den Sie über SageMaker nutzen, gelten individuelle Preise. Weitere Informationen finden Sie auf der AWS-Preisseite für Athena, Amazon EMR, AWS Glue und Amazon MWAA.