AWS 云
AWS 云
开始免费试用

Amazon Redshift 是一种快速且完全托管的数据仓库,让您可以使用标准 SQL 和现有的商业智能 (BI) 工具经济高效地轻松分析您的所有数据。利用 Amazon Redshift,您可以使用高性能本地磁盘上的列式存储通过复杂的查询优化对 PB 级结构化数据运行复杂的分析查询,并能大规模执行并行查询。大多数结果在几秒内返回。使用 Amazon Redshift 时,您可以从小规模开始,费用只有每小时 0.25 USD,并且无需承诺;然后将数据量扩展到 PB 级,费用为每年每 TB 1000 USD,不到传统解决方案的十分之一。

Amazon Redshift 还包含 Redshift Spectrum,让您可以对 Amazon S3 中的 EB 级非结构化数据直接运行 SQL 查询。不需要加载或转换,并且您可以使用 Avro、CSV、Grok、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV 等开源数据格式。Redshift Spectrum 可以根据检索的数据自动扩展查询计算容量,因此对 Amazon S3 的查询速度非常快,不受数据集大小的影响。 了解有关 Redshift Spectrum 的更多信息»

要向专家学习并与之交流,请加入我们的技术讲座:Serverless Analytics with Amazon Redshift Spectrum, AWS Glue, and Amazon QuickSight 立即注册>>

快速稳定的性能

快速

Amazon Redshift 使用列存储技术来改善 I/O 效率并能跨过多个节点并行查询,可以实现快速查询。数据加载的速度随着群集的大小线性扩展;能够与 Amazon S3、Amazon DynamoDB、Amazon EMR、Amazon Kinesis 和任何启用 SSH 的主机集成。

高度可扩展

价格低廉

您只需按实际使用量付费。每年每 TB 1000 USD 即可让不限数量的用户对您的所有数据进行不限次数的分析,成本只有传统数据仓库解决方案的十分之一。大多数客户的数据大小在压缩之后减小到原来的三分之一到四分之一,每年每 TB 未压缩数据的成本降低到 250 – 333 USD。

性能快速稳定

可扩展

Redshift Spectrum 让您可以利用现在使用的 SQL 语法和 BI 工具,对 Amazon S3 中的 EB 级数据进行查询,就像在 Amazon Redshift 本地磁盘中存储的 PB 级数据运行查询一样简单。您可以将高度结构化并且频繁访问的数据存储在 Redshift 本地磁盘中,并将大量非结构化数据存储在 Amazon S3“数据湖”中,然后在二者范围内进行无缝查询。

灵活

简单

借助 Amazon Redshift,您可以轻松自动执行大多数常规管理任务,以管理、监控和扩展数据仓库。通过处理所有这些耗时耗力的任务,Amazon Redshift 使您得到了解脱并专注于您的数据和业务。

高度可扩展

可扩展

只需在控制台中单击几下或使用简单的 API 调用,即可根据性能和容量需求的更改来轻松扩展和缩小群集。

灵活

安全

安全件是内置的。您可以使用硬件加速型 AES-256 和 SSL 加密静态和动态数据,使用 Amazon VPC 隔离您的群集,甚至使用 AWS Key Management Service (KMS)硬件安全模块 (HSM) 管理您的密钥。

事件驱动编程

兼容

Amazon Redshift 支持标准 SQL 并提供自定义 JDBC 和 ODBC 驱动程序 (您可从控制台下载这些驱动程序),从而使您能够使用各种常见的 SQL 客户端。您也可以使用标准的 PostgreSQL JDBC 和 ODBC 驱动程序。

专为数据仓库而优化

Amazon Redshift 使用各种创新技术,对于大小在 100GB 到 1EB 或更高的数据集,拥有非常高的查询性能。对于 PB 级本地数据,它使用列式存储、数据压缩及区域映射,降低了执行查询所需的 I/O 数量。Amazon Redshift 采用大规模并行处理 (MPP) 数据仓库架构,可对 SQL 操作进行并行分布处理,以便利用所有可用资源。底层硬件支持高性能数据处理,使用本地连接的存储以便尽可能增大 CPU 与驱动器之间的吞吐量,同时使用 10GigE 网状网络以便尽可能增大节点之间的吞吐量。对于 Amazon S3 中的 EB 级数据,Amazon Redshift 可以生成优化的查询方案,这种方案可以尽可能减少扫描的数据量并将查询工作委派给可以自动扩展的 Redshift Spectrum 实例池,因此查询可以快速运行,不受数据大小的影响。

PB 级

只需在控制台中单击几下或使用简单的 API 调用,即可轻松更改数据仓库中的节点数量或类型,并可将用户压缩数据扩展至 1PB 或更大。通过密集存储 (DS) 节点,您可以以非常低的价格使用硬盘 (HDD) 创建超大型数据仓库。通过密集计算 (DC) 节点,您可以使用高速 CPU、大量 RAM 和固态硬盘 (SSD) 创建超高性能数据仓库。调整大小时,Amazon Redshift 允许您以只读模式继续查询数据仓库,直到新群集已完全预置好且可供使用。

查询 Amazon S3“数据湖”

Redshift Spectrum 让您可以对 Amazon S3 中的 EB 级非结构化数据运行查询,不需要进行加载或 ETL 操作。当您发布查询时,查询会进入 Amazon Redshift SQL 终端节点,该终端节点会生成查询方案并对其进行优化。 Amazon Redshift 会确定哪些数据存储在本地以及哪些数据存储在 Amazon S3 中,然后生成一种方案来尽可能减少需要读取的 Amazon S3 数据量,从共享资源池中请求 Amazon Redshift Spectrum 工作线程来读取和处理 Amazon S3 中的数据,让后将结果返回 Amazon Redshift 群集进行任何剩余处理。

无需预付费用

您仅需为实际调用的资源付费。您可选择无预付费用的按需定价或长期合约,或者用预留实例定价来获得大幅折扣。按需定价的起点仅为每 160GB DC2.Large 节点 0.25 USD 每小时,或每 2TB DS1.XLarge 节点 0.85 USD 每小时。使用部分前期预留实例,您可以将实际价格降低至每 DC1.Large 节点 0.10 USD 每小时 (5500 USD/TB/年) 或每 DS2.XLarge 节点 0.228 USD 每小时 (999 USD/TB/年)。Redshift Spectrum 查询的价格为 5 USD/TB S3 扫描数据。有关更多信息,请参阅 Amazon Redshift 定价页面。

容错

Amazon Redshift 拥有多种能够提高数据仓库群集可靠性的功能。所有写入群集内节点的数据均会自动复制到群集内的其他节点,且所有数据会被连续备份至 Amazon S3。Amazon Redshift 会持续监控群集的运行状况并会自动从出故障的驱动器重新复制数据,并在必要时替换节点。

自动备份

Amazon Redshift 可自动持续地将新数据备份到 Amazon S3。您可以按用户定义的期间存储您的快照,此期间可以是 1 到 35 天。您可以随时拍摄自己的快照,而这些快照可以一直保留,直到您显式将其删除。Amazon Redshift 还能将您的快照异步复制到另一个区域的 S3 中以备灾难恢复之用。删除某个群集后,您的系统快照也会被移除,但您的用户快照在您显式将其删除之前将一直处于可用状态。

快速恢复

您可通过 AWS 管理控制台或 Amazon Redshift API 使用任何系统快照或用户快照来恢复您的群集。系统元数据恢复后,您的群集就可供使用,并且您可在用户数据在后台输出时开始运行查询。

加密

仅需若干参数设置,您即可设置 Amazon Redshift,使其利用 SSL 来保护中转数据,并利用硬件加速型 AES-256 加密来保护静态数据。如果您选择启用静态数据的加密,那么所有写入硬盘的数据以及任何备份数据也将被加密。默认情况下,Amazon Redshift 会负责密钥管理,但您也可以选择使用您自己的硬件安全模块 (HSM)、AWS CloudHSMAWS Key Management Service 管理您的密钥。

网络隔离

借助 Amazon Redshift,您可以配置防火墙规则,以控制对数据仓库群集的网络访问。您可以在 Amazon VPC 中运行 Amazon Redshift,将您的数据仓库群集隔离在自己的虚拟网络中,并用行业标准加密的 IPsec VPN 将其连接至您现有的 IT 基础设施。

审核与合规性

Amazon Redshift 与 AWS CloudTrail 相集成,使您能够对所有的 Redshift API 调用进行审计。Amazon Redshift 还会记录所有的 SQL 操作,包括连接尝试、查询和数据库的变动。您可以使用 SQL 查询在系统表格中访问这些记录,或选择将其下载到 Amazon S3 上的安全位置。Amazon Redshift 与 SOC1、SOC2、SOC3 和 PCI DSS 1 级要求兼容。有关更多详细信息,请访问 AWS 云合规性

440x220_APN-Blog

借助 Amazon Redshift Spectrum,您可以将 Amazon Redshift 的分析能力扩展到数据仓库中本地磁盘上存储的数据以外,查询 Amazon S3“数据湖”中的海量非结构化数据,而不必转换和加载任何数据。在本博客文章中,我们整理了 Amazon Redshift Spectrum 的 10 项重要最佳实践,并将其分为多个不同的功能组。

阅读整篇文章 »

借助 Amazon Redshift Spectrum,Amazon Redshift 客户可以轻松查询 Amazon S3 中的数据。Redshift Spectrum 可以直接操作原生格式 (包括 Avro、CSV、Grok、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile 和 TSV) 的源数据。这意味着无需加载或转换数据。

阅读整篇文章 »

为了让您就地处理原样数据并利用 Amazon Redshift 的强大功能和灵活性,我们推出了 Amazon Redshift Spectrum。您可以使用 Spectrum 对存储在 Amazon Simple Storage Service (S3) 上的数据运行各种复杂的查询,不需要进行加载或其他数据准备工作。

阅读整篇文章 »

列式压缩是 Amazon Redshift 中的一项重要技术。它通过提高节点的有效存储容量来降低了客户成本,并通过减少处理 SQL 请求所需的 I/O 来提高了性能。提高 I/O 效率对于数据仓库非常重要。去年,我们的 I/O 改善让查询吞吐量增加了一倍。我们来分析一下 Amazon Redshift 近期新增加的一些压缩改进。

阅读整篇文章 »

有关 Amazon Redshift 博客文章的完整列表,请参阅博客文章页面 »

免费试用 Amazon Redshift获得每月 750 小时免费 DC1.Large,为期 2 个月。要开始免费试用,请创建 AWS 账户并登录 Amazon Redshift 控制台。然后,启动 Amazon Redshift 群集并选择 DC1.Large 节点类型。要请求为您的概念验证或评估提供支持,请单击此处

 

立即开始试用