Veröffentlicht am: Mar 30, 2021
AWS Glue ist ein serverloser Datenintegrationsservice, der das Auffinden, Aufbereiten und Kombinieren von Daten für Analysen, Machine Learning und die Anwendungsentwicklung vereinfacht. Mit AWS Glue Workflows können Sie einen komplexen Workflow zur Datenintegration mit mehreren Aufträgen und Crawlern orchestrieren und ausführen. Mit den benutzerdefinierten Blueprints von AWS Glue können Datentechniker ganz einfach wiederholbare AWS Glue Workflows erstellen.
Bevor Sie mit dem AWS Glue Blueprint beginnen, identifizieren Sie einen wiederholbaren Datenintegrations-Workflow. Beispiel: Ein ETL-Workflow, der CSV-Daten in Ihrem Raw-S3-Bucket in das Parquet-Format in Ihrem Produktions-S3-Bucket konvertiert, und Sie möchten diesen ETL-Workflow mehrmals in verschiedenen AWS-Konten ausführen. Anstatt einen Workflow für jeden ETL-Prozess zu erstellen, können Sie einen AWS Glue Blueprint erstellen und registrieren, der den S3-Bucket als Eingabeparameter akzeptiert. Ein Datenanalyst muss lediglich Eingabeparameter (z. B. Datenquellen und Ziele) bereitstellen, um neue Datenintegrations-Workflows zu erstellen.
Die öffentliche Vorschau von AWS Glue Blueprint ist in jeder Region verfügbar, in der AWS Glue verfügbar ist. Weitere Informationen erhalten Sie im Benutzerhandbuch zu AWS Glue. Öffnen Sie die AWS Glue-Konsole für die ersten Schritte.