Schaffen Sie eine Grundlage für die Arbeit mit AWS-Services für Big Data-Lösungen

Big Data Technology Fundamentals vermittelt Basiswissen zu den bei Big Data-Lösungen verwendeten Technologien. Im Kurs wird die Entwicklung von Big Data-Lösungen mithilfe des Hadoop-Systems einschließlich MapReduce, HDFS und der Programmierungs-Frameworks Pig und Hive behandelt. Dieser webbasierte Kurs vermittelt Grundlagenwissen für das Arbeiten mit AWS-Services für Big Data-Lösungen. Dieser Kurs wird kostenlos angeboten und kann eigenständig oder zur Vorbereitung auf den Kurs Big Data on AWS mit Kursleiter genutzt werden.

Stufe

Grundlagen

Modalität

Digital, Selbststudium

Dauer

90 Minuten

In diesem Kurs lernen Sie Folgendes:

  • Bestimmen gängiger Tools und Technologien, die zum Entwickeln von Big Data-Lösungen verwendet werden können.
  • Die Grundlagen des Programmierungs-Framework MapReduce einschließlich der Komponenten Map, Shuffle and Sort und Reduce.
  • Differenzieren der verschiedenen Optionen zum Entwickeln einer Big Data-Lösung mithilfe des Programmierungs-Frameworks Hive.

Dieser Kurs ist konzipiert für:

  • Teilnehmer, die noch nicht mit Big Data-Konzepten vertraut sind, z. B. Architekten von Unternehmens- und Big Data-Lösungen, Datenwissenschaftler und Datenanalysten

Voraussetzungen für Kursteilnehmer:

  • Grundkenntnisse der Standardprogrammierung in einer Sprache wie Java oder C#

Dieser Kurs wird auf folgende Weise vermittelt:

  • Webbasiertes E-Learning

Hinweis: Der Kursinhalt kann je nach Standort und/oder Sprache leicht variieren.

Modul 1 – Einführung in Big Data

  • Die betriebswirtschaftliche Bedeutung von Big Data
  • Das Hadoop-System
  • Merkmale von Big Data
  • Verarbeitung von Big Data
  • Tools und Techniken für die Analyse von Big Data
  • Implementieren von Big Data-Lösungen
  • Fallstudie – Analyse sozialer Medien

Modul 2 – Einführung in MapReduce und Hadoop

  • Architektur von Hadoop
  • MapReduce-Framework
  • MapReduce-Programmierung
  • MapReduce und HDFS/S3
  • Anwendungsfall – Empfehlungsfunktion

Modul 3 – Datenanalyse mithilfe der Pig-Programmierung

  • Einführung in Pig
  • Pig-Datentypen
  • Darstellen von Daten in Pig
  • Ausführen von Pig
  • Benutzerdefinierte Funktionen
  • Pig im Vergleich zu herkömmlichen RDBMS
  • Erweiterte Methoden in Pig  

Modul 4 – Big Data-Abfragen mit Hive

  • Einführung in Hive
  • Darstellen von Daten in Hive
  • Hive-Datentypen
  • Untersuchen von Daten mithilfe von Hive-Abfragen
  • Hive und AWS
  • Anwendungsfall – Ad-hoc-Analysen und Feedback zu Produkten
Registrieren Sie sich jetzt auf aws.training.