AWS Glue
Alle Ihre Daten in beliebigem Umfang entdecken, vorbereiten und integrieren
Gratis 1 Million Objekte speichern
Funktionsweise
AWS Glue ist ein Serverless-Datenintegrationsservice, der das Erkennen, Aufbereiten, Verschieben und Integrieren von Daten aus verschiedenen Quellen für Analysen, Machine Learning (ML) und Anwendungsentwicklung erleichtert.
-
Datenintegrations-Engine-Optionen
-
Ereignisgesteuertes ETL
-
AWS-Glue-Datenkatalog
-
Codefreie ETL-Aufträge
-
Datenqualität verwalten und überwachen
-
Datenaufbereitung
-
Datenintegrations-Engine-Optionen
-
Wählen Sie Ihre bevorzugte Datenintegrations-Engine in AWS Glue, um Ihre Benutzer und Workloads zu unterstützen.
-
Ereignisgesteuertes ETL
-
AWS Glue kann Ihre Extraktions-, Transformations- und Ladeaufträge (ETL) ausführen, sobald neue Daten eintreffen. Sie können AWS Glue zum Beispiel so konfigurieren, dass Ihre ETL-Aufträge ausgeführt werden, sobald neue Daten im Amazon Simple Storage Service (S3) verfügbar sind.
-
AWS-Glue-Datenkatalog
-
Sie können mithilfe des Datenkatalogs schnell mehrere AWS-Datensätze durchsuchen, ohne die Daten zu verschieben. Die Daten sind nach der Katalogisierung sofort zum Durchsuchen und Abfragen mit Amazon Athena, Amazon EMR und Amazon Redshift Spectrum bereit.
-
Codefreie ETL-Aufträge
-
AWS Glue Studio macht es einfacher, AWS-Glue-ETL-Aufgaben visuell zu erstellen, auszuführen und zu überwachen. Sie können in einem Drag-and-Drop-Editor ETL-Aufgaben erstellen, die Daten verschieben und transformieren, und AWS Glue erzeugt den Code automatisch.
-
Datenqualität verwalten und überwachen
-
AWS Glue Data Quality automatisiert die Erstellung, Verwaltung und Überwachung von Datenqualitätsregeln, um eine hohe Datenqualität in Ihren Data Lakes und Pipelines zu gewährleisten.
-
Datenaufbereitung
-
Mit AWS Glue DataBrew können Sie Daten direkt aus Ihrem Data Lake, Data Warehouses und Datenbanken, einschließlich Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora und Amazon Relational Database Service (RDS), untersuchen und mit ihnen experimentieren. Sie können aus über 250 vorgefertigten Transformationen in DataBrew wählen, um Datenaufbereitungsaufgaben wie das Filtern von Anomalien, die Standardisierung von Formaten und die Korrektur ungültiger Werte zu automatisieren.
Anwendungsfälle
Die Entwicklung von ETL-Pipelines vereinfachen
Beseitigen Sie das Infrastrukturmanagement mit automatischer Bereitstellung und Worker-Management und konsolidieren Sie all Ihre Datenintegrationsanforderungen in einem einzigen Service.
Daten effizient entdecken
Identifizieren Sie schnell Daten in AWS, lokalen und anderen Clouds und stellen Sie sie dann sofort für Abfragen und Transformationen zur Verfügung.
Interaktives Erkunden, Experimentieren und Verarbeiten von Daten
Mit interaktiven AWS-Glue-Sitzungen können Dateningenieure Daten interaktiv erkunden und vorbereiten, indem sie die integrierte Entwicklungsumgebung (IDE) oder das Notebook ihrer Wahl verwenden.
Unterstützung verschiedener Verarbeitungs-Frameworks und Workloads
Einfachere Unterstützung verschiedener Datenverarbeitungs-Frameworks wie ETL und ELT sowie verschiedener Workloads, einschließlich Batch, Micro-Batch und Streaming.
Erste Schritte
AWS Glue kostenlos testen
Eine Serverless-Umgebung erleichtert es, Daten zu finden, aufzubereiten, zu verschieben sowie Daten aus verschiedenen Quellen zu integrieren.
Mit AWS Glue entwickeln
Erfahren Sie, wie Sie Datenpipelines mit der visuellen ETL-Schnittstelle von AWS Glue Studio erstellen.
Daten integrieren
Folgen Sie diesen Anweisungen, um AWS Glue einzurichten und zu verwenden.