Amazon Redshift 将数据仓库查询扩展到您的数据湖,无需加载。您可以针对 Redshift 中本地存储的 PB 级数据运行分析查询,以及直接针对 Amazon S3 中存储的 EB 级数据运行分析查询。设置和自动执行大多数管理任务以及在任意规模中提供快速性能都非常简单。

主要功能

更快的性能

大规模并行:Amazon Redshift 在数据集(大小从数 GB 到数 EB)上提供快速查询性能。Redshift 使用列式存储、数据压缩和区域映射来降低执行查询所需的 I/O 数量。它使用大规模并行处理 (MPP) 数据仓库架构来并行执行和分配 SQL 操作,以便利用所有可用资源。底层硬件支持高性能数据处理,使用本地连接的存储以便尽可能增大 CPU 与驱动器之间的吞吐量,同时使用高带宽网状网络以便尽可能增大节点之间的吞吐量。

机器学习:Amazon Redshift 使用机器学习来根据您的工作负载提供高吞吐量。Redshift 利用复杂的算法来预测传入查询运行时间,并将其分配给最佳队列,以尽可能提升处理速度。例如,具有高并行要求的控制面板和报告等查询会路由到高速查询,以便立即进行处理。

结果缓存:Amazon Redshift 使用结果缓存来为重复查询提供亚秒级响应时间。执行重复查询的控制面板、可视化和商业智能工具带来了性能的大幅提升。在执行查询时,Redshift 会对缓存进行搜索,看看是否有之前运行的查询的缓存结果。如果找到缓存结果且数据没有变化,将立即返回缓存结果,而不会重新运行查询。

易于设置、部署和管理

自动预置:Amazon Redshift 易于设置和操作。您只需在 AWS 控制台中单击几下即可部署新的数据仓库,并且 Redshift 会为您自动预置基础设施。大多数管理任务可自动执行,例如备份和复制,因此您可以专注于您的数据,而不是管理。当您想要进行控制时,Redshift 会提供相应选项来帮助您对特定工作负载进行调整。新功能公开发布,消除了计划和应用升级和修补的需要。

自动备份:Amazon Redshift 会自动持续地将您的数据备份到 Amazon S3。Redshift 能够将您的快照异步复制到另一个区域中的 S3,以实现灾难恢复。您可通过 AWS 管理控制台或 Redshift API 使用任何系统快照或用户快照来恢复您的集群。系统元数据恢复后,您的集群就可供使用,并且您可在用户数据在后台输出时开始运行查询。

容错:Amazon Redshift 拥有多种可提高数据仓库集群可靠性的功能。Redshift 会持续监控集群的运行状况,并自动从出故障的驱动器重新复制数据,同时根据需要替换节点以实现容错。

与第三方工具集成:使用行业领先的工具并与专家合作以对数据进行加载、转换和可视化,从而改进 Amazon Redshift。我们的大量合作伙伴已认证他们的解决方案可与 Amazon Redshift 搭配使用。 

物有所值

无需预付费,只需按需付费:Amazon Redshift 是极其实惠的数据仓库,您只需为预置的资源付费。您可以从每小时 0.25 USD 的无承诺小规模开始,扩展到每年每 TB 仅需 250 USD。Redshift 是独一无二的云数据仓库,因为它提供无需预付费的按需定价、可通过承诺使用 1 年或 3 年最多为您节省 75% 的预留实例定价,以及基于 Amazon S3 数据湖中扫描的数据数量的每查询定价。 有关更多信息,请参阅 Amazon Redshift 定价页面。

选择您的节点类型:您可以从两种节点类型中选择,以优化 Redshift 来满足您的数据仓库需求。通过密集计算 (DC) 节点,您可以使用高速 CPU、大量 RAM 和固态硬盘 (SSD) 创建超高性能数据仓库。如果您想要进一步扩展或降低成本,可以切换到更经济高效的密集存储 (DS) 节点类型,以非常低的价格使用更大的硬盘驱动器。要扩展集群或在节点类型之间切换,您需要进行一次 API 调用或在 AWS 控制台中单击几下。

快速扩展以满足您的需求

PB 级数据仓库:Amazon Redshift 根据您的需求变化轻松快速地扩展。只需在控制台中单击几下或进行简单 API 调用,即可轻松更改数据仓库中的节点数量或类型,并且根据您的需求变化进行扩展和缩减。

EB 级数据湖分析:Redshift Spectrum 是 Redshift 的一种功能,可以帮助您针对 Amazon S3 中的 EB 级数据运行查询,无需加载或转换任何数据。您可以将 S3 用作高度可用、安全且划算的数据湖,以开放数据格式存储无限数据。

无限的并发性:Redshift Spectrum 支持多种查询同时访问 Amazon S3 中的相同数据,从而提供无限的并发性。Redshift Spectrum 在成千上万的并行节点中执行查询,无论查询有多复杂或数据量有多大都可以快速提供结果。

查询您的数据湖

Amazon S3 数据湖:Amazon Redshift 是将您的查询扩展到 Amazon S3 数据湖而无需加载数据的唯一数据仓库。您可以直接在 S3 中查询已使用的开放文件格式,例如 Avro、CSV、Grok、JSON、ORC 和 Parquet 等。这让您可以在 Redshift 本地磁盘中灵活地存储高度结构化、频繁访问的数据,将 EB 级结构化和非结构化数据保留在 S3 中,并且在这两者中无缝查询,以提供您无法通过查询独立的数据集获取的独特见解。

AWS 分析生态系统:Amazon Redshift 与 AWS 分析生态系统进行原生集成。AWS Glue 可以将数据提取、转换和加载 (ETL) 到 Redshift 中。Amazon Kinesis Data Firehose 是捕获、转换流数据并将其加载到 Redshift 以实现近乎实时分析的一种简单方式。您可以使用 Amazon QuickSight 创建报告、可视化和控制面板。 为了加速向 Amazon Redshift 的迁移,您可以免费使用 AWS Database Migration Service (DMS) 六个月。了解更多 »

安全

端到端加密 – 只需进行几项参数设置,您即可将 Amazon Redshift 设置为利用 SSL 来保护动态数据,并利用硬件加速型 AES-256 加密来保护静态数据。如果您选择启用静态数据的加密,那么所有写入硬盘的数据以及任何备份数据也将被加密。默认情况下,Amazon Redshift 会负责密钥管理。

网络隔离:Amazon Redshift 使您能够配置防火墙规则,以控制对数据仓库集群的网络访问。您可以在 Amazon VPC 中运行 Amazon Redshift,将您的数据仓库集群隔离在自己的虚拟网络中,并用行业标准加密的 IPsec VPN 将其连接至您现有的 IT 基础设施。

审计与合规性:Amazon Redshift 与 AWS CloudTrail 相集成,使您能够审计所有 Redshift API 调用。Redshift 还会记录所有 SQL 操作,包括连接尝试、查询和数据库变更。您可以使用 SQL 查询在系统表格中访问这些日志记录,或选择将其下载到 Amazon S3 上的安全位置。Amazon Redshift 符合 SOC1、SOC2、SOC3 和 PCI DSS 1 级要求。有关更多详细信息,请访问 AWS 云合规性。

了解有关 Amazon Redshift 定价的更多信息

访问定价页面
准备好开始构建?
Amazon Redshift 入门
还有更多问题?
联系我们