為針對大數據解決方案使用 AWS 服務建立基礎。

Big Data Technology Fundamentals 提供大數據解決方案所用技術的一般基本知識。其中涵蓋了使用 Hadoop 生態系統 (包括 MapReduce、HDFS 和 Pig、Hive 程式設計框架) 開發大數據解決方案。這套 Web 課程可以協助您建構使用 AWS 服務來建立大數據解決方案的基礎知識。本課程免費提供,既可以獨立使用,也可以協助您準備 Big Data on AWS 講師指導課程。

等級

基礎

形式

數位,自主進度

長度

90 分鐘

本課程中您將學習:

  • 認識可用於建立大數據解決方案的常用工具和技術。
  • 了解 MapReduce 程式設計框架,包括 map、shuffle 與 sort 以及 reduce 元件。
  • 辨別使用 Hive 程式設計框架建立大數據解決方案時可用的各種選項。

本課程適用於:

  • 對大數據概念還不熟悉的個人,包括企業解決方案架構師、大數據解決方案架構師、資料科學家以及資料分析師。

我們建議以下人員參加此課程:

  • 具有基本程式設計語言 (例如 Java 或 C#) 工作經驗

本課程將透過以下方式講授:

  • Web 線上學習方式

注意:課程大綱根據授課區域位置和/或語言而略有不同。

單元 1 – 大數據簡介

  • 大數據對商業的重要性
  • Hadoop 生態系統
  • 大數據特點
  • 處理大數據
  • 分析大數據使用的工具和技術
  • 實作大數據解決方案
  • 案例研究 – 社交媒體分析

單元 2 – MapReduce 和 Hadoop 簡介

  • Hadoop 架構
  • MapReduce 框架
  • MapReduce 程式設計
  • MapReduce 和 HDFS/S3
  • 使用案例 – 推薦引擎

單元 3 – 使用 Pig 程式設計的資料分析

  • Pig 簡介
  • Pig 資料類型
  • 在 Pig 中呈現資料
  • 執行 Pig
  • 使用者定義的函數
  • Pig 與傳統 RDBMS 的比較
  • Pig 中的進階技術  

單元 4 – 使用 Hive 進行大數據查詢

  • Hive 簡介
  • 在 Hive 中呈現數據
  • Hive 資料類型
  • 使用 Hive 查詢探查資料
  • Hive 與 AWS
  • 使用案例 – 臨機操作分析與產品意見回饋
立即註冊 aws.training