Big Data on AWS
了解如何使用 Amazon EMR、Amazon Redshift、Amazon Kinesis、Amazon Athena 以及其余 AWS 大数据平台来处理数据和创建大数据环境
在本课程中,您将了解基于云的大数据解决方案(例如 Amazon EMR、Amazon Redshift、Amazon Kinesis)以及其余的 AWS 大数据平台。我们向您介绍如何使用 Amazon EMR 来利用诸如 Hive 和 Hue 等广泛 Hadoop 工具体系来处理数据。授课内容还包括如何创建大数据环境、如何使用 Amazon DynamoDB、Amazon Redshift、Amazon QuickSight、Amazon Athena 和 Amazon Kinesis 以及如何利用最佳实践来设计大数据环境,从而实现安全性和经济性。
课程目标
在本课程中,您将了解:
- 在大数据体系内使用 AWS 解决方案
- 在 Amazon EMR 环境中使用 Apache Hadoop
- 了解 Amazon EMR 群集的组件,然后启动和配置 Amazon EMR 群集
- 使用 Amazon EMR 的常用编程框架,包括 Hive、Pig 和 Streaming
- 使用 Hadoop User Experience (Hue) 提高 Amazon EMR 的易用性
- 在 Amazon EMR 上借助 Apache Spark 使用内存分析
- 选择适当的 AWS 数据存储选项
- 确定使用 Amazon Kinesis 以近乎实时的方式处理大数据的优势
- 利用 Amazon Redshift 有效地存储和分析数据
- 了解并管理大数据解决方案的费用和安全性
- 确定用于获取、传输和压缩数据的选项
- 利用 Amazon Athena 进行临时查询分析
- 使用 AWS Glue 自动提取、转换和加载 (ETL) 工作负载
- 借助 Amazon QuickSight 使用可视化软件描述数据和查询
培训对象
本课程适用于:
- 解决方案架构师
- 系统操作管理员
- 数据科学家
- 数据分析师