AWS Glue

Alle Ihre Daten in beliebigem Umfang entdecken, vorbereiten und integrieren

Gratis 1 Million Objekte speichern

Funktionsweise

AWS Glue ist ein serverloser Datenintegrationsdienst, der das Erkennen, Aufbereiten, Verschieben und Integrieren von Daten aus verschiedenen Quellen für Analysen, Machine Learning (ML) und Anwendungsentwicklung erleichtert.

  • Ereignisgesteuertes ETL
  • AWS Glue kann Ihre Extraktions-, Transformations- und Ladeaufträge (ETL) ausführen, sobald neue Daten eintreffen. Sie können AWS Glue zum Beispiel so konfigurieren, dass Ihre ETL-Aufträge ausgeführt werden, sobald neue Daten im Amazon Simple Storage Service (S3) verfügbar sind.

    Diagramm, das anzeigt, wie AWS Glue Ihre ETL-Jobs ausführen kann, sobald neue Daten eintreffen.
  • AWS-Glue-Datenkatalog
  • Sie können mithilfe des Datenkatalogs schnell mehrere AWS-Datensätze durchsuchen, ohne die Daten zu verschieben. Die Daten sind nach der Katalogisierung sofort zum Durchsuchen und Abfragen mit Amazon Athena, Amazon EMR und Amazon Redshift Spectrum bereit.

    Das Diagramm zeigt, wie der Datenkatalog Datensätze entdeckt und durchsucht, ohne die Daten zu verschieben.
  • Codefreie ETL-Aufträge
  • AWS Glue Studio macht es einfacher, AWS Glue ETL-Aufgaben visuell zu erstellen, auszuführen und zu überwachen. Sie können in einem Drag-and-Drop-Editor ETL-Aufgaben erstellen, die Daten verschieben und transformieren, und AWS Glue erzeugt den Code automatisch.

    Diagramm, das zeigt, wie Benutzer ETL-Aufgaben zusammenstellen können, die Daten mithilfe eines Drag-and-Drop-Editors verschieben und umwandeln.
  • Self-Service-Datenaufbereitung
  • Mit AWS Glue DataBrew können Sie Daten direkt aus Ihrem Data Lake, Data Warehouses und Datenbanken, einschließlich Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora und Amazon Relational Database Service (RDS), untersuchen und mit ihnen experimentieren. Sie können aus über 250 vorgefertigten Transformationen in DataBrew wählen, um Datenaufbereitungsaufgaben wie das Filtern von Anomalien, die Standardisierung von Formaten und die Korrektur ungültiger Werte zu automatisieren.

    Diagramm, das zeigt, wie DataBrew Datenaufbereitungsaufgaben für Benutzer automatisiert.
Einführung in AWS Glue (01:54)
Warum AWS Glue?
Der erste Schritt bei einem Analyse- oder ML-Projekt ist die Vorbereitung Ihrer Daten, um qualitativ hochwertige Ergebnisse zu erhalten. AWS Glue ist ein serverloser Datenintegrationsservice, der die Datenaufbereitung einfacher, schneller und kostengünstiger macht. Sie können über 70 verschiedene Datenquellen entdecken und mit ihnen in Verbindung treten, Ihre Daten in einem zentralen Datenkatalog verwalten und ETL-Pipelines visuell erstellen, ausführen und überwachen, um Daten in Ihre Data Lakes zu laden.

Anwendungsfälle

Die Entwicklung von ETL-Pipelines vereinfachen

Beseitigen Sie das Infrastrukturmanagement mit automatischer Bereitstellung und Worker-Management und konsolidieren Sie all Ihre Datenintegrationsanforderungen in einem einzigen Service.

Weitere Information zu AWS Glue Auto Scaling »

Daten effizient entdecken

Identifizieren Sie schnell Daten über mehrere AWS-Datensätze hinweg und machen Sie sie dann sofort für Abfragen und Umwandlungen verfügbar.

Weitere Informationen zum AWS-Glue-Datenkatalog »

Interaktives Erkunden, Experimentieren und Verarbeiten von Daten

Mit interaktiven AWS-Glue-Sitzungen können Dateningenieure Daten interaktiv erkunden und vorbereiten, indem sie die integrierte Entwicklungsumgebung (IDE) oder das Notebook ihrer Wahl verwenden.

Weitere Informationen zu interaktiven AWS-Glue-Sitzungen »

Unterstützung verschiedener Verarbeitungs-Frameworks und Workloads

Einfachere Unterstützung verschiedener Datenverarbeitungs-Frameworks wie ETL und ELT sowie verschiedener Workloads, einschließlich Batch, Micro-Batch und Streaming.

Weitere Informationen zum Streaming von ETL-Aufträgen »

Erste Schritte

AWS Glue kostenlos testen

Entdecken, bereiten Sie Daten auf, verschieben und integrieren Sie sie aus verschiedenen Quellen mit der Leichtigkeit einer serverlosen Umgebung.

Entwickeln mit AWS Glue

Erfahren Sie, wie Sie Datenpipelines mit der visuellen ETL-Schnittstelle von AWS Glue Studio erstellen.

Ihr Daten integrieren

Folgen Sie diesen Anweisungen, um AWS Glue einzurichten und zu verwenden.


Mehr von AWS entdecken