Warum AWS Glue?
Der erste Schritt bei einem Analyse- oder ML-Projekt ist die Vorbereitung Ihrer Daten, um qualitativ hochwertige Ergebnisse zu erhalten. AWS Glue ist ein Serverless-Datenintegrationsservice, der die Datenaufbereitung einfacher, schneller und kostengünstiger macht. Sie können über 70 verschiedene Datenquellen entdecken und eine Verbindung dazu herstellen, Ihre Daten in einem zentralen Datenkatalog verwalten und ETL-Pipelines visuell erstellen, ausführen und überwachen, um Daten in Ihre Data Lakes zu laden.
Einführung in AWS Glue (01:54)

Vorteile von AWS Glue

Alle Datennutzer, von Entwicklern bis hin zu Geschäftsanwendern unterstützen
Petabyte-Skala, nutzungsbasierte Abrechnung, beliebige Datengröße
Vollständige Datenintegrationsfunktionen in einem serverlosen Service
Flexible Unterstützung für ETL, ELT, Batch, Streaming und mehr, ohne Lock-In

Funktionsweise

AWS Glue ist ein Serverless-Datenintegrationsservice, der das Erkennen, Aufbereiten, Verschieben und Integrieren von Daten aus verschiedenen Quellen für Analysen, Machine Learning (ML) und Anwendungsentwicklung erleichtert.

  • Datenintegrations-Engine-Optionen
  • Wählen Sie Ihre bevorzugte Datenintegrations-Engine in AWS Glue, um Ihre Benutzer und Workloads zu unterstützen.

    Das Diagramm zeigt mehrere Optionen für die Datenverarbeitungs-Engine von AWS Glue.
  • Ereignisgesteuertes ETL
  • AWS Glue kann Ihre Extraktions-, Transformations- und Ladeaufträge (ETL) ausführen, sobald neue Daten eintreffen. Sie können AWS Glue zum Beispiel so konfigurieren, dass Ihre ETL-Aufträge ausgeführt werden, sobald neue Daten im Amazon Simple Storage Service (S3) verfügbar sind.

    Diagramm, das anzeigt, wie AWS Glue Ihre ETL-Jobs ausführen kann, sobald neue Daten eintreffen.
  • AWS-Glue-Datenkatalog
  • Sie können mithilfe des Datenkatalogs schnell mehrere AWS-Datensätze durchsuchen, ohne die Daten zu verschieben. Die Daten sind nach der Katalogisierung sofort zum Durchsuchen und Abfragen mit Amazon Athena, Amazon EMR und Amazon Redshift Spectrum bereit.

    Das Diagramm zeigt, wie der Datenkatalog Datensätze entdeckt und durchsucht, ohne die Daten zu verschieben.
  • Codefreie ETL-Aufträge
  • AWS Glue Studio macht es einfacher, AWS-Glue-ETL-Aufgaben visuell zu erstellen, auszuführen und zu überwachen. Sie können in einem Drag-and-Drop-Editor ETL-Aufgaben erstellen, die Daten verschieben und transformieren, und AWS Glue erzeugt den Code automatisch.

    Diagramm, das zeigt, wie Benutzer ETL-Aufgaben zusammenstellen können, die Daten mithilfe eines Drag-and-Drop-Editors verschieben und umwandeln.
  • Datenqualität verwalten und überwachen
  • AWS Glue Data Quality automatisiert die Erstellung, Verwaltung und Überwachung von Datenqualitätsregeln, um eine hohe Datenqualität in Ihren Data Lakes und Pipelines zu gewährleisten.

    Das Diagramm zeigt, wie AWS Glue Data Quality automatisch die Datenqualität in Data Lakes und Datenpipelines misst, überwacht und verwaltet.
  • Datenaufbereitung
  • Mit AWS Glue DataBrew können Sie Daten direkt aus Ihrem Data Lake, Data Warehouses und Datenbanken, einschließlich Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora und Amazon Relational Database Service (RDS), untersuchen und mit ihnen experimentieren. Sie können aus über 250 vorgefertigten Transformationen in DataBrew wählen, um Datenaufbereitungsaufgaben wie das Filtern von Anomalien, die Standardisierung von Formaten und die Korrektur ungültiger Werte zu automatisieren.

    Diagramm, das zeigt, wie DataBrew Datenaufbereitungsaufgaben für Benutzer automatisiert.

Anwendungsfälle

Interaktives Erkunden, Experimentieren und Verarbeiten von Daten

Using AWS Glue interactive sessions, data engineers can interactively explore and prepare data using the integrated development environment (IDE) or notebook of their choice.

Daten effizient entdecken

Quickly identify data across AWS, on premises, and other clouds, and then make it instantly available for querying and transforming.

Unterstützung verschiedener Verarbeitungs-Frameworks und Workloads

More easily support various data processing frameworks, such as ETL and ELT, and various workloads, including batch, micro-batch, and streaming.

Die Entwicklung von ETL-Pipelines vereinfachen

Remove infrastructure management with automatic provisioning and worker management, and consolidate all your data integration needs into a single service.

Neuerungen

  • Datum (neuestes bis ältestes)
Keine Ergebnisse gefunden
1

Mehr von AWS erkunden