Big Data on AWS

了解如何使用 Amazon EMR、Amazon Redshift、Amazon Kinesis、Amazon Athena 以及其余 AWS 大数据平台来处理数据和创建大数据环境。

在本课程中,您将了解基于云的大数据解决方案(例如 Amazon EMR、Amazon Redshift、Amazon Kinesis)以及其余的 AWS 大数据平台。我们向您介绍如何使用 Amazon EMR 来利用诸如 Hive 和 Hue 等广泛 Hadoop 工具体系来处理数据。授课内容还包括如何创建大数据环境、如何使用 Amazon DynamoDB、Amazon Redshift、Amazon QuickSight、Amazon Athena 和 Amazon Kinesis 以及如何利用最佳实践来设计大数据环境,从而实现安全性和经济性。

课程目标

在本课程中,您将了解:

  • 在大数据体系内使用 AWS 解决方案
  • 在 Amazon EMR 环境中使用 Apache Hadoop
  • 了解 Amazon EMR 群集的组件,然后启动和配置 Amazon EMR 群集
  • 使用 Amazon EMR 的常用编程框架,包括 Hive、Pig 和 Streaming
  • 使用 Hadoop User Experience (Hue) 提高 Amazon EMR 的易用性
  • 在 Amazon EMR 上借助 Apache Spark 使用内存分析
  • 选择适当的 AWS 数据存储选项
  • 确定使用 Amazon Kinesis 以近乎实时的方式处理大数据的优势
  • 利用 Amazon Redshift 有效地存储和分析数据
  • 了解并管理大数据解决方案的费用和安全性
  • 确定用于获取、传输和压缩数据的选项
  • 利用 Amazon Athena 进行临时查询分析
  • 使用 AWS Glue 自动提取、转换和加载 (ETL) 工作负载
  • 借助 Amazon QuickSight 使用可视化软件描述数据和查询

培训对象

本课程适用于:

  • 解决方案架构师
  • 系统操作管理员
  • 数据科学家
  • 数据分析师
icon_big-data

课程概述

mini-icon_training
mini-icon_level
mini-icon_time
mini-icon_language

课程授课方式
课堂 | 动手实验室

课程级别
中级

课程时间
3 天

课程语言
提供多种语言