AWS 上的数据湖和分析

从所有数据中获得对所有用户的解答的最快方式
构建数据湖和分析的最简单方式
设置和管理数据湖涉及大量手动的耗时任务,如加载、转换和保护数据以及审计对数据的访问。AWS Lake Formation 可以自动执行许多手动步骤,并将成功构建数据湖所需的时间从几个月缩短至几天。
可扩展且经济高效
数据量呈指数级增加,但存储和分析这些数据的成本却不会以同样的速度增加。AWS 提供全面的工具来帮助控制大规模存储和分析所有数据的成本,包括 S3 中进行数据存储的智能分层等功能,以及有助于降低计算使用成本的功能,如 auto-scaling 和与 EC2 的 Spot 实例集成。
全面且开放
我们提供最广泛且最深入的专用分析工具组合,让您可以使用最适合处理相应作业的工具,从数据中快速获得见解。我们所有的分析服务都支持开放的文件格式(如 Apache Parquet),因此您不需要移动和转换数据来进行分析,而是能将数据以标准格式存储一次,然后使用最合适的工具或技术进行分析。
安全的分析基础设施
保护大量数据是大多数组织面临的最大挑战之一。除了您期望从 AWS 获得的所有认证和最佳实践之外,我们还设计了一些安全功能来帮助您遵守最佳实践和行业法规。例如,Amazon Macie 有助于发现意外存储在错误位置的敏感数据,Amazon Inspector 有助于发现可能导致数据泄漏的配置错误。

AWS 分析服务

类别
使用案例
AWS 服务
分析
交互式分析

Amazon Athena

使用 SQL 在 S3 中查询数据。

大数据处理

Amazon EMR

托管 Hadoop 框架。

数据仓库

Amazon Redshift

快速简单、经济高效的数据仓库。

实时分析

Amazon Kinesis

分析实时视频和数据流。

运营分析

Amazon Elasticsearch Service

运行和扩展 Elasticsearch 集群。

控制面板和可视化

Amazon QuickSight

高速业务分析服务。

数据移动
实时数据移动

Amazon Kinesis Video Streams

获取、处理和存储视频流用于分析和机器学习。

Amazon Kinesis Data Firehose

准备实时数据流并将其加载到数据存储和分析工具中。

Amazon Kinesis Data Streams

大规模收集流数据以进行实时分析。

Amazon Kinesis Data Analytics

从实时流数据中获得可执行的见解。

数据湖
对象存储

Amazon S3

专为从任意位置存储和检索任意数量的数据而构建的对象存储。

AWS Lake Formation

在数天内构建安全的数据湖。

备份与存档

Amazon S3 Glacier

云中的低成本存档存储。

AWS Backup

跨 AWS 服务进行集中化备份。

数据目录

AWS Glue

准备和加载数据。

AWS Lake Formation

在数天内构建安全的数据湖。

第三方数据

AWS Data Exchange

查找和订阅云中的第三方数据。

预测性分析和机器学习
框架和接口

AWS Deep Learning AMI

Amazon EC2 上的深度学习。

平台服务

Amazon SageMaker

大规模构建、训练和部署机器学习模型。

AWS 分析服务

类别 使用案例 AWS 服务
分析 交互式分析 Amazon Athena
大数据处理 Amazon EMR
数据仓库 Amazon Redshift
实时分析 Amazon Kinesis
运营分析 Amazon Elasticsearch Service
控制面板和可视化 Amazon QuickSight
数据移动 实时数据移动 Amazon Kinesis Data Analytics | Amazon Kinesis Data FirehoseAmazon Kinesis Data Streams | Amazon Kinesis Video Streams 
数据湖 对象存储 Amazon S3 | AWS Lake Formation
备份与存档 Amazon S3 Glacier | AWS Backup
数据目录
AWS Glue | AWS Lake Formation
第三方数据 AWS Data Exchange
预测性分析和机器学习 框架和接口 AWS Deep Learning AMI
平台服务 Amazon SageMaker

使用案例

Page-Illo_Data-warehousing
数据仓库

对结构化和非结构化数据运行 SQL 和复杂的分析查询,而无需进行不必要的数据移动。

试用 Amazon Redshift »
Page-Illo_Big-data-processing
大数据处理

快速方便地处理大量数据,用于数据工程、数据科学开发和协作。
 

试用 Amazon EMR »
Page-Illo_Real-time-analytics
实时分析

在流数据到达数据池时收集、处理和分析流数据,并实时响应。
 

试用 Amazon Kinesis »
Page-Illo_Data-visualization
运营分析

对于应用程序监控、日志分析和点击流分析,近乎实时地搜索、浏览、过滤、聚合和可视化数据。

试用 Amazon Elasticsearch Service »

客户

JD-Power_Logo_@1x

“我们在 Amazon S3 上建立了一个 120TB 的数据池,其中有 1500 个不同方案,并广泛使用了像 Glue、Redshift 和 Athena 这样的 AWS 分析服务。我们无法从一堆孤立的数据库和仓库中获得这些见解—我们需要一个 S3 级的数据池。”

- Bernardo Rodriguez
首席数字官,J.D.Power

查看所有客户 »
netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
gt-customer_landing_page_graphics166x_epic
Adobe_Customer-Reference_Logo
Pfizer

其他资源

AWS 数据实验室

AWS 数据实验室是一个由客户构建者团队和 AWS 技术资源组成的为期四天的密集型项目,旨在创建可加速数据和分析现代化计划的切实可交付成果。

了解更多 »

新闻通讯

想随时了解来自 AWS 分析的教育内容、即将发生的事件和其他创新吗?

订阅 AWS 分析新闻通讯 »