Big Data on AWS

了解如何使用 Amazon EMR、Amazon Redshift、Amazon Kinesis、Amazon Athena 及其他 AWS 大數據平台來處理資料和建立大數據環境。

在本課程中,您將了解以雲端為基礎的大數據解決方案,例如 Amazon EMR、Amazon Redshift、Amazon Kinesis 及其他 AWS 大數據平台。我們為您介紹如何使用 Amazon EMR,以 Hive 和 Hue 這類廣泛的 Hadoop 工具生態系統處理資料。授課內容還包括如何建立大數據環境,使用 Amazon DynamoDB、Amazon Redshift、Amazon QuickSight、Amazon Athena 和 Amazon Kinesis,以及利用最佳實務來設計具安全性和成本效益的大數據環境。

課程目標

在本課程中,您將了解:

  • 將 AWS 解決方案融入大數據生態系統
  • 利用 Amazon EMR 環境中的 Apache Hadoop
  • 識別 Amazon EMR 叢集的元件,然後啟動並設定 Amazon EMR 叢集
  • 使用 Amazon EMR 的常用程式設計框架,包括 Hive、Pig 和串流
  • 透過 Hadoop 使用者體驗 (Hue),提升 Amazon EMR 的易用性
  • 在 Amazon EMR,透過 Apache Spark 使用記憶體內分析
  • 選擇適當的 AWS 資料儲存體選項
  • 識別針對幾乎即時的大數據處理使用 Amazon Kinesis 的好處
  • 利用 Amazon Redshift 有效率地存放和分析資料
  • 了解和管理大數據解決方案的費用和安全
  • 識別導入、傳輸和壓縮資料等選項
  • 將 Amazon Athena 用於臨機操作查詢分析
  • 利用 AWS Glue 自動擷取、轉換和載入 (ETL) 工作負載
  • 透過 Amazon QuickSight 使用視覺化軟體描述資料和查詢

目標對象

本課程適用於:

  • 解決方案架構師
  • SysOps 管理員
  • 資料科學家
  • 資料分析師
icon_big-data

課程概觀

mini-icon_training

課程形式
課堂 + 實作實驗室

mini-icon_level

課程等級
中級

mini-icon_time

課程用時
3 天

mini-icon_language

課程語言
提供多種語言版本