AWS 云
Amazon Redshift 入门

数据和分析已然成为各大企业保持竞争力所不可或缺的部分。他们使用报告、控制面板和分析工具从其数据中获得洞察力、监控企业绩效以及更明智地决策。这些报告、控制面板和分析工具由数据仓库提供支持;数据仓库可以高效地存储数据以便最大限度地减少 I/O,并以极快的速度同时向成千上万的用户提供查询结果。

下载白皮书:Enterprise Data Warehousing on AWS

数据仓库充当中央存储库,可以存储来自一个或多个数据源的信息。数据从事务系统和其他关系数据库流入数据仓库,通常包括结构化、半结构化和非结构化数据。这些数据会定期得到处理、转换和提取。包括数据科学家、商业分析师和决策者在内的用户可以通过商业智能工具、SQL 客户端和电子表格访问数据仓库中经过处理的数据。

 

  数据仓库 事务数据库
适合的工作负载 分析、大数据 事务处理
操作类型 针对批量写入操作和大量数据读取操作进行了优化,可最大限度地减少 I/O 和提高数据吞吐量 针对连续写入操作和大量小型读取操作进行了优化,可最大限度地提高事务吞吐量
数据标准化 采用非规范化架构,例如星型架构和雪花型架构 采用高度标准化的架构,更能满足高事务吞吐量要求
存储 需要列式存储或其他专业存储 将整行存储在物理数据块中的行式数据库

AWS 允许您利用与按需计算相关的所有核心优势,例如能够访问看似无限的存储和计算容量,以及能够借助越来越多所收集、存储和查询的数据并行扩展系统,而只需为预置的资源付费。此外,AWS 还提供一系列已相互无缝集成的托管服务,以便您能够快速部署端到端分析和数据仓库解决方案。

下图显示了端到端分析流程链的主要步骤,以及每个步骤可以使用的 AWS 托管服务:

AWS 上的分析管道

Amazon Redshift 是一种快速、易于使用且完全托管的数据仓库解决方案。它可以自动执行基础设施预置以及备份、复制和修补等管理任务。Amazon Redshift 可以与第三方 BI 和 ETL 工具无缝集成,因此可以快速生成报告。而且,您加载和分析的数据数量不受任何限制。在数据增加时,您无需担心昂贵的系统升级或性能下降。Redshift 在任何规模下都能快速部署,因为它采用的是列式存储并进行了一系列优化。Amazon Redshift 还是一种经济高效的服务,您只需按使用量付费。您只需每年为每 TB 支付 1000 USD 的费用,便可让无限数量的用户对您的所有数据进行无限次分析。了解更多