AWS Glue

Einfache, skalierbare und serverlose Datenaufbereitung

AWS Glue ist ein serverloser Service zur Datenvorbereitung, der es Dateningenieuren, ETL-Entwicklern, Datenanalytikern und Daten-Wissenschaftlern leicht macht, Daten zu extrahieren, zu bereinigen, anzureichern, zu normalisieren und zu laden. AWS Glue reduziert die Zeit, die für die Analyse Ihrer Daten benötigt wird, von Monaten auf Minuten.

Die Datenaufbereitung ist ein kritischer, aber anspruchsvoller Prozess. Um Daten für die Analyse vorzubereiten, extrahieren Sie zunächst Daten aus verschiedenen Quellen. Anschließend bereinigen Sie es, transformieren es in das erforderliche Format und laden es zur weiteren Analyse in Datenbanken, Data Warehouses und Data Lakes. Diese Aufgaben werden oft von verschiedenen Gruppen mit unterschiedlichen Tools durchgeführt.

AWS Glue bietet Ihnen sowohl visuelle als auch codebasierte Schnittstellen, um die Datenaufbereitung zu erleichtern. Dateningenieure und ETL-Entwickler können AWS Glue Studio verwenden, um ETL-Workflows mit wenigen Klicks zu erstellen, auszuführen und zu überwachen. Datenanalytiker und Daten-Wissenschaftler können AWS Glue DataBrew verwenden, um Daten visuell zu bereinigen und zu normalisieren, ohne Code zu schreiben.

Einführung von AWS Glue (1:47)

Vorteile

Daten schneller vorbereiten

AWS Glue bietet integrierte Tools für alle Ihre Benutzer, um die Datenaufbereitung für Analysen und Machine Learning zu vereinfachen. Verschiedene Gruppen in Ihrem Unternehmen können zusammenarbeiten, um Daten vorzubereiten, einschließlich Extrahieren, Bereinigen, Normalisieren, Laden und Ausführen skalierbarer ETL-Workflows. Auf diese Weise reduzieren Sie die Zeit, die für die Analyse Ihrer Daten benötigt wird, von Monaten auf Minuten.

Automatisieren im Maßstab

AWS Glue automatisiert einen Großteil des Aufwands, der für die Datenaufbereitung erforderlich ist. AWS Glue durchsucht Ihre Datenquellen, identifiziert Datenformate und schlägt Schemata zur Speicherung Ihrer Daten vor. Es generiert automatisch den Code zur Ausführung Ihrer Datentransformationen und Ladeprozesse. Mit AWS Glue können Sie leicht Tausende von ETL-Jobs ausführen und verwalten, um Petabytes von Daten für Analysen und Machine Learning effizient vorzubereiten.

Keine Server zu verwalten

AWS Glue führt Apache Spark und Python in einer serverlosen Umgebung aus. Es gibt keine Infrastruktur zur Verwaltung, und AWS Glue stellt die für die Ausführung Ihrer Datenvorbereitungsjobs erforderlichen Ressourcen bereit, konfiguriert und skaliert sie. Sie zahlen nur für die Ressourcen, die Ihre Jobs während der Ausführung verbrauchen.

Anwendungsfälle


Einheitliche Ansicht Ihrer Daten in mehreren Datenspeichern

Sie können mithilfe des AWS Glue-Datenkatalogs schnell mehrere AWS-Datensätze durchsuchen, ohne die Daten zu verschieben. Die Daten sind nach der Katalogisierung sofort zum Durchsuchen und Abfragen mit Amazon Athena, Amazon EMR und Amazon Redshift Spectrum bereit.

Erstellen und Ausführen von ELT-Jobs in AWS Glue

Ereignisgesteuerte ETL-Pipelines

AWS Glue kann Ihre ETL-Jobs ausführen, sobald neue Daten eintreffen. Sie können zum Auslösen Ihre ETL-Aufträge beispielsweise eine AWS Lambda-Funktion nutzen, um sie auszuführen, sobald in Amazon S3 neue Daten verfügbar sind. Darüber hinaus haben Sie die Möglichkeit, den neuen Datensatz im Rahmen Ihrer ETL-Aufträge im AWS Glue-Datenkatalog zu speichern.

Ereignisgesteuertes ETL Pipelines-Diagramm

Big Data ETL ohne Kodierung

AWS Glue Studio macht es einfach, AWS Glue ETL-Aufgaben visuell zu erstellen, auszuführen und zu überwachen. Sie können ETL-Aufgaben zusammenstellen, die Daten verschieben und transformieren und diese mit AWS Glue ausführen. Sie können dann das AWS Glue Studio Job Run Dashboard verwenden, um die ETL-Ausführung zu überwachen und sicherzustellen, dass Ihre Aufgaben wie vorgesehen funktionieren. Mehr über AWS Glue Studio erfahren Sie hier.

Visuelles ETL-Tool für ETL-Entwickler

Visuelle Self-Service-Datenaufbereitung

AWS Glue DataBrew ermöglicht es Ihnen, Daten direkt aus Ihrem Data Lake, Data Warehouses und Datenbanken, einschließlich Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora und Amazon RDS, zu untersuchen und mit ihnen zu experimentieren. Sie können aus über 250 vorgefertigten Transformationen in AWS Glue DataBrew wählen, um Datenvorbereitungsaufgaben wie das Filtern von Anomalien, die Standardisierung von Formaten und die Korrektur ungültiger Werte zu automatisieren. Nachdem die Daten aufbereitet sind, können Sie sie sofort für Analysen und Machine Learning verwenden. Mehr über AWS Glue DataBrew erfahren Sie hier.

Visuelle Datenbereinigung und Datennormalisierung

Neues

Datum
  • Datum
1
AWS Glue-Funktionen
Funktionen von AWS Glue testen

Erfahren Sie mehr über die wichtigsten Funktionen von AWS Glue.

Weitere Informationen 
Registrieren Sie sich für ein AWS-Konto
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Mit der Entwicklung in der Konsole beginnen
Mit der Entwicklung in AWS Glue beginnen

Beginnen Sie mit der Entwicklung mit AWS Glue in der visuellen ETL-Schnittstelle.

Anmelden