了解如何使用 Amazon EMR、Amazon Redshift、Amazon Kinesis、Amazon Athena 及其他 AWS 大數據平台來處理資料和建立大數據環境

在本課程中,您將了解以雲端為基礎的大數據解決方案,例如 Amazon EMR、Amazon Redshift、Amazon Kinesis 及其他 AWS 大數據平台。我們為您介紹如何使用 Amazon EMR,以 Hive 和 Hue 這類廣泛的 Hadoop 工具生態系統處理資料。授課內容還包括如何建立大數據環境,使用 Amazon DynamoDB、Amazon Redshift、Amazon QuickSight、Amazon Athena 和 Amazon Kinesis,以及利用最佳實務來設計具安全性和成本效益的大數據環境。

等級

中級

形式

課堂培訓、實作實驗室

長度

3 天

本課程適用於:

  • 解決方案架構師
  • SysOps 管理員
  • 資料科學家
  • 資料分析師

在本課程中,您將了解如何:

  • 將 AWS 解決方案融入大數據生態系統
  • 利用 Amazon EMR 環境中的 Apache Hadoop
  • 識別 Amazon EMR 叢集的元件,然後啟動並設定 Amazon EMR 叢集
  • 使用 Amazon EMR 的常用程式設計框架,包括 Hive、Pig 和串流
  • 透過 Hadoop 使用者體驗 (Hue),提升 Amazon EMR 的易用性
  • 在 Amazon EMR,透過 Apache Spark 使用記憶體內分析
  • 選擇適當的 AWS 資料儲存體選項
  • 識別針對幾乎即時的大數據處理使用 Amazon Kinesis 的好處
  • 利用 Amazon Redshift 有效率地存放和分析資料
  • 了解和管理大數據解決方案的費用和安全
  • 識別導入、傳輸和壓縮資料等選項
  • 將 Amazon Athena 用於臨機操作查詢分析
  • 利用 AWS Glue 自動擷取、轉換和載入 (ETL) 工作負載
  • 透過 Amazon QuickSight 使用視覺化軟體描述資料和查詢
我們建議參加此課程的人必須符合以下先決條件:
 
  • 熟悉大數據技術,包括 Apache Hadoop、Hadoop 分散式檔案系統 (HDFS) 和 SQL/NoSQL 查詢
  • Big Data Technology Fundamentals 數位培訓或同等經驗
  • 具有核心 AWS 服務和公有雲端實作工作經驗
  • AWS Technical Essentials 或同等經驗
  • 了解資料倉儲、關聯式資料庫系統和資料庫設計

本課程將結合以下方式授課:

  • 課堂培訓
  • 實作實驗室

本課程讓您透過各種實作練習來測試新技能,並將學到的知識應用到您的工作環境。

Big Data Thumbnail

前往 aws.training