了解如何使用 Amazon EMR、Amazon Redshift、Amazon Kinesis、Amazon Athena 以及其余 AWS 大数据平台来处理数据和创建大数据环境

在本课程中,您将了解基于云的大数据解决方案(例如 Amazon EMR、Amazon Redshift、Amazon Kinesis)以及其余的 AWS 大数据平台。我们向您介绍如何使用 Amazon EMR 来利用诸如 Hive 和 Hue 等广泛 Hadoop 工具体系来处理数据。授课内容还包括如何创建大数据环境、如何使用 Amazon DynamoDB、Amazon Redshift、Amazon QuickSight、Amazon Athena 和 Amazon Kinesis 以及如何利用最佳实践来设计大数据环境,从而实现安全性和经济性。

级别

中级

授课方式

课堂培训、动手实验

时长

3 天

本课程适用于:

  • 解决方案架构师
  • 系统操作管理员
  • 数据科学家
  • 数据分析师

在本课程中,您将了解如何:

  • 在大数据体系内使用 AWS 解决方案
  • 在 Amazon EMR 环境中使用 Apache Hadoop
  • 了解 Amazon EMR 群集的组件,然后启动和配置 Amazon EMR 群集
  • 使用 Amazon EMR 的常用编程框架,包括 Hive、Pig 和 Streaming
  • 使用 Hadoop User Experience (Hue) 提高 Amazon EMR 的易用性
  • 在 Amazon EMR 上借助 Apache Spark 使用内存分析
  • 选择适当的 AWS 数据存储选项
  • 确定使用 Amazon Kinesis 以近乎实时的方式处理大数据的优势
  • 利用 Amazon Redshift 有效地存储和分析数据
  • 了解并管理大数据解决方案的费用和安全性
  • 确定用于获取、传输和压缩数据的选项
  • 利用 Amazon Athena 进行临时查询分析
  • 使用 AWS Glue 自动提取、转换和加载 (ETL) 工作负载
  • 借助 Amazon QuickSight 使用可视化软件描述数据和查询
我们建议参加学习本课程的人员符合以下先决条件:
 
  • 熟悉大数据技术,包括 Apache Hadoop、Hadoop 分布式文件系统 (HDFS) 和 SQL/NoSQL 查询
  • 已参加大数据技术基础知识数字培训或拥有同等经验
  • 具有核心 AWS 产品和公有云实施工作经验
  • 已参加 AWS 技术基础知识课程或拥有同等经验
  • 了解数据仓库、关系数据库系统和数据库设计

本课程将结合以下方式授课:

  • 课堂培训
  • 动手实验

您可以通过本课程提供的各种实践练习来测试新的技能并将所学到的知识应用到您的工作环境中。

Big Data Thumbnail

前往 aws.training