Erhalten Sie Informationen für die Arbeit mit Amazon EMR, Amazon Redshift, Amazon Kinesis, Amazon Athena und allen weiteren Komponenten der Big Data-Plattform von AWS für die Verarbeitung von Daten und die Erstellung von Big Data-Umgebungen.

Big Data on AWS bietet eine Einführung in Cloud-basierte Big Data-Lösungen wie Amazon (EMR), Amazon Redshift, Amazon Kinesis und alle weiteren Komponenten der AWS-Plattform für Big Data. In diesem Kurs zeigen wir Ihnen, wie Sie Amazon EMR zum Verarbeiten von Daten mithilfe des umfassenden Angebots an Hadoop-Tools wie beispielsweise Hive und Hue einsetzen. Sie erfahren außerdem, wie Sie Big Data-Umgebungen erstellen, mit Amazon DynamoDB, Amazon Redshift, Amazon Quicksight, Amazon Athena und Amazon Kinesis arbeiten, und wie Sie durch Befolgen bewährter Methoden sichere und wirtschaftliche Big Data-Umgebungen einrichten.

Stufe

Fortgeschritten

Modalität

Schulungsraum, Live- oder virtueller Kurs

Dauer

3 Tage

Was Sie in diesem Kurs lernen:

  • Integrieren von AWS-Lösungen in ein Big Data-Ökosystem.
  • Nutzen von Apache Hadoop im Kontext von Amazon EMR.
  • Identifizieren der Komponenten eines Amazon EMR-Clusters.
  • Starten und Konfigurieren eines Amazon EMR-Clusters.
  • Nutzen gängiger Programmierungs-Frameworks, die für Amazon EMR zur Verfügung stehen, wie z. B. Hive, Pig und Streaming.
  • Nutzen von Hue zur Verbesserung der Benutzerfreundlichkeit von Amazon EMR.
  • Verwenden von In-Memory-Analysen mit Spark auf Amazon EMR.
  • Auswählen der geeigneten AWS-Datenspeicherungsoptionen.
  • Erkennen der Vorteile des Einsatzes von Amazon Kinesis für die Verarbeitung von Big Data beinahe in Echtzeit.
  • Nutzen von Amazon Redshift, um Daten effizient zu speichern und zu analysieren.
  • Verstehen und Verwalten der Kosten und Sicherheit einer Big Data-Lösung.
  • Identifizieren von Optionen für das Einlesen, die Übertragung und die Komprimierung von Daten.
  • Verwenden von Amazon Athena für Ad-hoc-Abfrageanalysen.
  • Verwenden von AWS Glue für das Automatisieren von ETL-Arbeitslasten.
  • Verwenden von Visualisierungssoftware zur Abbildung von Daten und Abfragen mit Amazon QuickSight.
  • Registrieren von Big Data-Workflows mithilfe von AWS Data Pipeline.

Dieser Kurs ist konzipiert für:

  • Zuständige für die Konzeption und Umsetzung von Big Data-Lösungen, d. h. Solutions Architects und SysOps-Administratoren
  • Datenwissenschaftler und Datenanalysten, die die Services und Architekturmuster für Big Data-Lösungen auf AWS näher kennenlernen möchten

Wir empfehlen, dass die Teilnehmer an diesem Kurs die folgenden Voraussetzungen erfüllen:

Dieser Kurs setzt sich zusammen aus:

  • Schulung mit Kursleiter
  • Praktische Übungen

In diesem Kurs können Sie neue Fertigkeiten testen und Ihr Wissen in verschiedenen praktischen Übungen in Ihrer Arbeitsumgebung anwenden.

Hinweis: Der Kursinhalt kann je nach Standort und/oder Sprache leicht variieren.

1. Tag

  • Überblick über Big Data
  • Aufnahme
  • Big Data-Streaming und Amazon Kinesis
  • Verwenden von Amazon Kinesis zum Streamen und Analysieren von Apache-Serverprotokollen
  • Speicherlösungen
  • Verwenden von Amazon Athena zur Analyse von Protokolldaten
  • Einführung in Apache Hadoop und Amazon EMR

2. Tag

  • Verwenden von Amazon Elastic MapReduce
  • Speichern und Abfragen von Daten in DynamoDB
  • Hadoop-Programmierungs-Frameworks
  • Verarbeiten von Serverprotokollen mit Hive auf Amazon EMR
  • Optimieren Ihrer Amazon EMR-Erfahrung mit Hue
  • Ausführen von Pig-Skripten in Hue auf Amazon EMR
  • Spark auf Amazon EMR
  • Verarbeiten eines New York Taxi-Datensatzes unter Verwendung von Spark auf Amazon EMR

3. Tag

  • Verwenden von AWS Glue für das Automatisieren von ETL-Arbeitslasten
  • Amazon Redshift und Big Data
  • Visualisieren und Orchestrieren von Big Data
  • Kostenmanagement für Amazon EMR
  • Schützen von Big Data-Lösungen
  • Big Data-Designmuster
Big Data Thumbnail

Zu aws.training gehen