最新资讯

阅读我们的最新资讯文章,了解有关 Amazon Redshift 和 Redshift Spectrum 的最新功能和公告。

在概念验证方面需要帮助?

如果您使用 Amazon Redshift 构建概念验证解决方案,建议您阅读为 Amazon Redshift 构建概念验证。要请求我们为您提供概念验证方面的帮助,请单击此处

文档

入门指南:向您介绍 Amazon Redshift,帮助您创建账户,然后通过一个简单的示例向您演示首次使用 Amazon Redshift 的过程。还提供了高级产品功能和资源的提示和链接。HTML | PDF | Kindle

Amazon Redshift 群集管理指南:介绍如何创建和管理 Amazon Redshift 群集。HTML | PDF | Kindle

Amazon Redshift 数据库开发人员指南:说明如何设计、构建、查询和维护构成数据仓库的数据库。它还包括 Amazon Redshift SQL 命令和函数的语法。HTML | PDF

Amazon Redshift API 参考:详细介绍 Amazon Redshift 的所有 API 操作。它还为支持的 Web 服务协议提供了请求、响应和错误的示例。HTML | PDF

Amazon Redshift CLI 指南:详细介绍 Amazon Redshift 的命令行界面。它提供了每个命令的基本语法、选项和用法示例。HTML

最佳实践

加载数据:使用“COPY”命令、批量插入和暂存表格高效地加载数据。了解更多 »

设计数据仓库 schema:设计可满足高查询性能、低存储和内存需求以及 I/O 操作最少的数据库。了解更多 »

优化查询性能:使用这些技巧和策略优化查询以最大限度提升性能。了解更多 »

优化及管理脚本和工具

Amazon Redshift 管理脚本   

SQL 脚本,用于在 Amazon Redshift 群集上使用系统表运行诊断程序。在此下载 »

脚本列表:

  • top_queries.sql – 用于返回最近 7 天内前 50 条最费时的语句
  • perf_alerts.sql – 用于与表扫描相结合返回出现频率高的警报
  • filter_used.sql – 返回应用于扫描表的筛选条件,以帮助选择排序键
  • commit_stats.sql – 用于通过“COMMIT”语句显示群集资源的相关消耗信息
  • current_session_info.sql – 用于通过当前运行的查询显示会话信息
  • missing_table_stats.sql – 用于显示在底层表上标记为“missing statistics”的“EXPLAIN”计划
  • queuing_queries.sql – 用于列出在 WLM 查询槽中处于等待状态的查询
    table_info.sql – 用于返回表存储信息(大小、偏移等) 

Admin SQL 视图    

SQL 视图,用于管理 Amazon Redshift 群集和生成 schema DDL。所有视图均假定您拥有一个称为“Admin”的 schema。在此下载 »

视图列表:

  • v_check_data_distribution.sql – 用于获取分片间的数据分配
  • v_constraint_dependency.sql – 用于获取表之间的外键约束
  • v_generate_group_ddl.sql – 用于获取组的 DDL
  • v_generate_schema_ddl.sql – 用于获取 schema 的 DDL
  • v_generate_tbl_ddl.sql – 用于获取表(包含分布键、排序键和约束)的 DDL
  • v_generate_unload_copy_cmd.sql – 用于生成对象的卸载和复制命令
  • v_generate_user_object_permissions.sql – 用于获取用户的表和视图权限的 DDL
  • v_generate_view_ddl.sql – 用于获取视图的 DDL
  • v_get_obj_priv_by_user.sql – 用于获取用户可访问的表/视图
  • v_get_schema_priv_by_user.sql – 用于获取用户可访问的 schema
  • v_get_tbl_priv_by_user.sql – 用于获取用户可访问的表
  • v_get_users_in_group.sql – 用于获取组中的所有用户
  • v_get_view_priv_by_user.sql – 用于获取用户可访问的视图
  • v_object_dependency.sql – 用于将不同的依赖关系视图合并在一起
  • v_space_used_per_tbl.sql – 用于提取每个表中使用的空间
  • v_view_dependency.sql – 用于获取依赖其他表/视图的视图的名称
  • v_check_transaction_locks.sql – 用于获取未结事务持有的锁的相关信息
  • v_check_wlm_query_time.sql – 用于获取过去 7 天内的 WLM 等待时间和执行时间
  • v_check_wlm_query_trend_daily.sql – 用于获取每天的 WLM 查询数量、等待时间、执行时间
  • v_check_wlm_query_trend_hourly.sql – 用于获取每小时的 WLM 查询数量、等待时间、执行时间
  • v_generate_cancel_query.sql – 用于获取取消查询
  • v_get_cluster_restart_ts.sql – 用于获取最近重新启动群集的日期/时间
  • v_get_vacuum_details.sql – 用于获取有关 vacuum 操作的详细信息

列编码实用工具

可使用此实用工具来确定 Amazon Redshift 数据的最佳压缩率。在此下载 »

卸载/复制实用工具

在两个 Amazon Redshift 表(可位于不同的数据库、群集或区域中)之间轻松迁移数据。所有导出的数据均通过 AWS Key Management Service (KMS) 进行加密。您可以使用此实用工具补充 AWS Data Pipeline 以定期在系统间(如生产和测试之间)移动数据,或者用于维护其他群集上的只读副本。在此下载 »

社区贡献的函数和工具

分析和管理工具

轻松  

常见的用户定义函数 (UDF)。一组适合每个人使用的有用 UDF。贡献者:Periscope。了解更多 » | 在此下载 »

适用于 Amazon Redshift 的 Yelp ETL 工具。使用 Yelp Mycroft 将数据自动加载到 Amazon Redshift。请阅读这篇博客文章,了解更多信息。在此下载 »

用于开发 UDF 的框架。为了使开发变得更加轻松,Periscope 构建了一个用于管理和测试 UDF 的框架。贡献者:Periscope Data。在此下载 »

re:Dash。免费的开源数据协作和虚拟化平台,旨在快速而方便地访问数十亿条记录。功能包括 schema 浏览器、改善的计划、自动完成和编写 Python 查询的能力。贡献者:Everthing.me。在此下载 »

EverythingMe 的 Amazon Redshift 管理控制面板。使用这一用户友好型工具监控正在运行的查询、WLM 队列以及您的表/schema。贡献者:EverythingMe。在此下载 »

Spark-Redshift 库。使用该库将数据从 Amazon Redshift 加载到 Apache Spark SQL DataFrames,然后再将数据从 Apache Spark 回写到 Amazon Redshift。这是在 Amazon Redshift 中使用 AVRO 数据获取的一个很好的示例。贡献者:Swiftkey。在此下载 »

博客文章

我们拥有一系列丰富的博客文章,可提供使用案例和最佳实践指导,帮助您充分利用 Amazon Redshift。通过以下资源访问我们的完整博客文章列表。

阅读 AWS 新闻博客中有关 Amazon Redshift 的文章。

AWS 大数据博客中了解最佳实践、功能特性和客户使用案例。

AWS 数据库博客中了解如何从本地数据仓库迁移到 Amazon Redshift 等。

网络研讨会

Amazon Redshift Spectrum 简介:现在可在 S3 中查询数 EB 的数据

Redshift Spectrum 可以将 Amazon Redshift 扩展为覆盖数据仓库中存储的数据之外的数据,以便您在 Amazon S3 中查询您的数据。您可以对 S3 数据运行查询,或者加入 S3 和 Redshift 数据,以获取通过查询独立数据环境无法获得的独特见解。

无服务器分析 – Amazon Redshift Spectrum、AWS Glue 和 Amazon QuickSight

了解如何使用 Amazon Redshift Spectrum、AWS Glue 和 Amazon QuickSight 构建无服务器大数据分析解决方案,而无需投资于数据库、数据仓库、复杂的 ETL 解决方案和 BI 应用程序。

快速分析任何规模的数据湖

了解如何针对 Amazon S3 中存储的开放数据格式以及 Amazon Redshift 数据仓库中存储的数据运行 SQL 查询。我们还将向您介绍如何分析数据湖和数据仓库,并快速获得任何规模(从数 GB 到数 EB)的结果。

通过 AWS 网络研讨会随时了解最新信息。

精选活动会议

将传统数据仓库迁移到现代数据湖 (ABD327)

了解最近推出的可用性、性能和管理增强功能,然后观看探讨 21st Century Fox 如何从本地数据仓库迁移到 Amazon Redshift 和数据湖架构的视频。

开发洞察平台 – Sysco 采用不同数据来源的过程 (ABD303)

了解 Sysco 的商业智能和分析团队如何使用 Amazon Redshift Spectrum、Amazon S3、Amazon EMR、AWS Glue、Amazon Elasticsearch Service 和其他 AWS 产品,借助利用 AWS 产品的可扩展分析和查询引擎创建数据库。

使用 Amazon Redshift 和 Redsh 进行数据仓库存储的最佳实践 (ABD304)

深入了解现代数据仓库如何分析数据仓库内外的所有数据,而无需移动数据。了解有关如何设计最佳 schema、有效加载数据以及优化查询的最佳实践,以提供高吞吐量和性能。

使用 AWS 大数据和 Tableau 进行自助分析 (ARC217)

了解 Expedia 全球支付商业智能团队如何在线使用 AWS 和 Tableau 从头开始设计和构建完整的云数据集市解决方案。了解最佳实践、优化技巧和经验教训。

将数据库和数据仓库迁移到云 (DAT317)

了解如何使用 AWS Database Migration Service (AWS DMS) 和 AWS Schema Conversion Tool (AWS SCT) 轻松安全地将数据和程序代码从现有数据库和数据仓库迁移到 Amazon Redshift 和其他 AWS 产品。

GPS:优化提示:使用 Amazon Redshift 进行云数据仓库存储 (GPSTEC315)

了解各项提示和技巧,以优化 Amazon Redshift 部署,高效扩展并以经济高效的方式满足数据仓库不断增长的需求。

了解有关 Amazon Redshift 定价的更多信息

访问定价页面
准备好开始构建?
Amazon Redshift 入门
还有更多问题?
联系我们