开始使用 AWS 上的大数据

对 Amazon S3 中的数据轻松直接运行交互式查询。只需为您运行的查询付费。

 

了解更多 »

轻松部署 Apache Hadoop、Spark、Presto、HBase 和 Flink 等常用的开源大数据框架。

了解更多 »

快速且完全托管的 PB 级数据仓库,让您可以对大量结构化数据轻松运行非常复杂的查询。

了解更多 »

使用标准 SQL 轻松查询 Amazon S3 中的数据
了解更多 | 入门

Diagram_Big-Data_Athena-S3

Amazon Athena 是一种交互式查询服务,让您可以使用标准 SQL 轻松分析 Amazon S3 中的数据。Athena 是无服务器服务,因此您无需设置或管理基础设施,可以立即开始分析数据。

您可以使用 Athena 处理日志、执行临时分析和运行交互式查询,并且只需为您运行的查询付费。

NewsCorp-Logo

“事实证明,Athena 速度快、使用方便,而且经济高效。”
观看视频 »

 


构建可以大规模扩展的应用程序,用于数据转换、实时分析和预测性分析。
了解更多 | 入门

big-data_diagram_2

Amazon EMR 是一种托管服务,让您可以使用最新版本的大数据处理框架 (如 Apache Hadoop、Spark、HBase 和 Presto) 在完全可定制的群集上处理和分析极大的数据集。

Amazon EMR 的功能远超 SQL。您可以运行自定义应用程序和机器学习、图形分析、数据转换、流数据等应用程序的代码。您可以定义具体的计算、内存、存储和应用程序参数以便优化分析要求。

R-Divider_Redfin_Logo

Redfin 向数以百万计的购房者提供房地产清单和建议。Redfin 每天都会使用带有竞价型实例的 Amazon EMR (可动态调整 Apache Hadoop 群集) 进行大数据转换并向内部和外部客户交付数据。观看视频 »

 


使用现有商业智能工具分析所有数据。使用来自多种来源的数据运行复杂的业务报告。
了解更多 | 入门

Diagram_Big-Data_Redshift

Amazon Redshift 是一种快速、完全托管的 PB 级数据仓库服务,让您可以通过简单而经济高效的方式使用现有商业智能工具来分析所有数据。Redshift 中的查询引擎经过优化,可以非常快速地运行 SQL 查询,包括整合了大量数据库表的复杂查询。

如果您需要将多种不同来源 (如库存系统、财务系统、零售系统,甚至日志数据) 的数据整合成一种常见格式并长时间存储,您可以使用 Amazon Redshift 构建查询性能非常高的复杂报告。

 

R-Divider_Nasdaq_Logo

“通过迁移到 Amazon Redshift,Nasdaq 实现了更快、更丰富的分析和数据仓库功能,同时将成本降低了 57%。”观看研讨会 »

 


如果您需要 可以考虑使用
对 S3 中存储的数据运行临时查询 Athena
先对 S3 中的数据执行交互式分析,然后再将其加载到 Redshift 中 Athena
在 Spark、Hive、Pig、Presto 群集上运行自定义代码
EMR
使用 Spark 构建和训练预测模型 EMR
提供实时建议的自定义应用程序 EMR
整合了来自多个结构化数据源的数据的企业报告 Redshift
持续运行整合了大量数据库表的复杂查询 Redshift
支持商业智能工作负载 Redshift

使用 SQL 查询 Amazon S3 中的数据

按照本教程使用 Amazon Athena 即时查询 Amazon S3 中存储的数据。
 

使用 Hadoop 分析大数据

在这个 60 分钟的项目中,使用 Amazon EMR 创建一个 Hadoop 群集并运行一个 Hive 脚本来处理日志数据。

部署数据仓库 

在这个简单的项目中使用 Amazon Redshift 在 60 分钟内部署一个完全托管的数据仓库。