AWS 上的分析

从所有数据中获得对所有用户的解答的最快方式
可扩展的数据湖
成千上万的客户在 AWS 上运行其数据湖。如今,设置和管理数据湖涉及大量耗时的手动任务。AWS Lake Formation 可实现这些任务自动化,因此您可以在数天内构建和保护数据湖,而不再需要数月时间。对于您的数据湖存储,Amazon S3 是构建数据湖的最佳场所,原因如下:它具有无与伦比的 99.999999999%(11 个 9)的持久性和 99.99% 的可用性;具有针对对象级别审计日志和访问控制的最佳安全性、合规性和审计功能;具有五个存储层的最大灵活性;拥有最低的价格,每 TB 每月最少不到 1 USD。
专用分析服务
AWS 为您提供最广泛、最深入且经过专门构建的分析服务组合,可针对您独特的分析使用案例进行优化。这些服务都是一流的服务,这意味着您在使用这些服务时不必在性能、规模和成本方面作出妥协。例如,Amazon Redshift 的速度比其他云数据仓库快 3 倍,但价格至少便宜 50%。Amazon EMR 上的 Spark 的速度比标准 Apache Spark 3.0 快 1.7 倍,而且您可以用不到传统本地解决方案一半的成本运行 PB 级分析。
无缝迁移数据
随着数据湖和专用数据存储中的数据量不断增长,您通常需要能够轻松地将一部分数据从一个数据存储迁移到另一个数据存储。AWS 使您能够轻松地跨多个数据存储和数据湖合并、迁移和复制数据。例如,AWS Glue 可提供全面的数据集成功能,使您可以轻松地发现、准备和合并数据,用于分析、机器学习和应用程序开发,而 Amazon Redshift 则可以轻松在 S3 数据湖中查询数据。没有其他分析提供商能让您轻松地将数据大规模迁移到最需要的位置。
统一治理
现代化分析架构最重要的因素之一是客户授权、管理和审计数据访问的能力。这可能非常具有挑战性,因为管理组织中所有数据存储的安全性、访问控制和审计跟踪过程非常复杂,而且很耗时并容易出错。借助集中访问控制和策略以及列级数据筛选等功能,其他任何分析提供商都无法为您提供治理功能,让您管理从单个位置对数据湖和专用数据存储中所有数据的访问。
高性能和经济高效
AWS 致力于以最低的成本为所有分析服务提供最佳性能,并坚持不断创新以提高我们服务的性价比。我们除了为分析服务提供行业领先的性价比外,对于存储在数据湖中的数据,我们的 S3 智能分层还可为客户节省高达 70% 的数据存储成本,而 Amazon EC2 可提供行业领先的选择:超过 200 种实例类型、高达 100Gbps 的网络带宽,以及在按需实例、预留实例和 Spot 实例之间进行选择的能力。

AWS 分析服务

类别
使用案例
AWS 服务
分析
交互式分析

Amazon Athena

使用 SQL 在 S3 中查询数据。

大数据处理

Amazon EMR

托管 Hadoop 框架。

数据仓库

Amazon Redshift

快速简单、经济高效的数据仓库。

实时分析

Amazon Kinesis

分析实时视频和数据流。

运营分析

Amazon Elasticsearch Service

运行和扩展 Elasticsearch 集群。

控制面板和可视化

Amazon QuickSight

高速业务分析服务。

可视化数据准备

AWS Glue DataBrew

将清理和标准化数据的速度最高提高 80%。

数据移动
实时数据移动

Amazon Managed Streaming for Apache Kafka (MSK)

完全托管、高度可用且安全的 Apache Kafka 服务

Amazon Kinesis Video Streams

获取、处理和存储视频流用于分析和机器学习。

Amazon Kinesis Data Firehose

准备实时数据流并将其加载到数据存储和分析工具中。

Amazon Kinesis Data Streams

大规模收集流数据以进行实时分析。

数据湖
对象存储

Amazon S3

专为从任意位置存储和检索任意数量的数据而构建的对象存储。

AWS Lake Formation

在数天内构建安全的数据湖。

备份与存档

Amazon S3 Glacier

云中的低成本存档存储。

AWS Backup

跨 AWS 服务进行集中化备份。

数据目录

AWS Glue

准备和加载数据。

AWS Lake Formation

在数天内构建安全的数据湖。

第三方数据

AWS Data Exchange

查找和订阅云中的第三方数据。

预测性分析和机器学习
框架和接口

AWS Deep Learning AMI

Amazon EC2 上的深度学习。

平台服务

Amazon SageMaker

大规模构建、训练和部署机器学习模型。

AWS 分析服务

类别 使用案例 AWS 服务
分析 交互式分析 Amazon Athena
大数据处理 Amazon EMR
数据仓库 Amazon Redshift
实时分析 Amazon Kinesis Data Analytics
运营分析 Amazon Elasticsearch Service
控制面板和可视化 Amazon QuickSight
可视化数据准备 Amazon Glue DataBrew
数据移动 实时数据移动 Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Amazon Kinesis Data Streams | Amazon Kinesis Data Firehose | Amazon Kinesis Video Streams | AWS Glue
数据湖 对象存储 Amazon S3 | AWS Lake Formation
备份与存档 Amazon S3 Glacier | AWS Backup
数据目录
AWS Glue | AWS Lake Formation
第三方数据 AWS Data Exchange
预测性分析和机器学习 框架和接口 AWS Deep Learning AMI
平台服务 Amazon SageMaker

使用案例

Page-Illo_Data-warehousing
数据仓库

在数据仓库和数据湖中对结构化和非结构化数据运行 SQL 和复杂的分析查询,而无需进行不必要的数据移动。

试用 Amazon Redshift »
Page-Illo_Big-data-processing
大数据处理

在数据湖或本地快速、轻松地处理大量数据,用于数据工程、数据科学开发和协作。

试用 Amazon EMR »
Page-Illo_Real-time-analytics
实时分析

收集、处理和分析流数据,并将数据流直接加载到数据湖、数据存储和分析服务中,以实现实时响应。

试用 Amazon MSK » 试用 Amazon Kinesis »
Page-Illo_Data-visualization
运营分析

对于应用程序监控、日志分析和点击流分析,近乎实时地搜索、浏览、过滤、聚合和可视化数据。

试用 Amazon Elasticsearch Service »

客户

JD-Power_Logo_@1x

“我们在 Amazon S3 上建立了一个 120TB 的数据池,其中有 1500 个不同方案,并广泛使用了像 Glue、Redshift 和 Athena 这样的 AWS 分析服务。我们无法从一堆孤立的数据库和仓库中获得这些见解—我们需要一个 S3 级的数据池。”

- Bernardo Rodriguez
首席数字官,J.D.Power

netflix
Chick-fil-A_Logo
3M Company_Logo
280x100_Georgia-Pacific_Logo
Pinterest_Customer-Reference_Logo
TMobile_Logo_@1x
Epic Games
Equinox.svg
Adobe_Customer-Reference_Logo
Pfizer
查看所有客户 »

其他资源

AWS 数据实验

创建切实的交付成果,加快数据和分析现代化计划的进程。AWS 数据实验室是您的创建者团队和 AWS 技术资源之间为期四天的密集活动。

了解更多 »

contactus-chat

售前在线咨询
云计算专家一对一解答您的问题与需求

contactus-phone

专属热线咨询
1010 0866 早9:00-晚8:00 (法定假期除外)

contactus-form

联系销售人员
填写表单,AWS 云计算专家将尽快与您联系。