介绍了如何创建和管理 Amazon Redshift 集群。  HTML | PDF | Kindle

说明如何设计、构建、查询和维护构成数据仓库的数据库。它还包括 Amazon Redshift SQL 命令和函数的语法。  HTML | PDF

详细描述了 Amazon Redshift 的所有 API 操作。它还为支持的 Web 服务协议提供了请求、响应和错误的示例。  HTML | PDF

详细描述了适用于 Amazon Redshift 的命令行界面。它提供了每个命令的基本语法、选项和用法示例。  HTML


AWS 网络广播涵盖在 Amazon Redshift 中加载数据和优化查询性能的最佳实践。  观看视频的第 1 部分 | 观看视频的第 2 部分

使用“COPY”命令、批量插入和暂存表格高效地加载数据。  了解更多 »

设计可满足高性能查询、低存储和内存需求以及 I/O 操作最少的数据库。  了解更多 »

使用这些技巧和策略优化查询以最大限度提升性能。  了解更多 »


SQL 脚本,用于在 Amazon Redshift 集群上使用系统表运行诊断程序。  在此下载 »

脚本列表:

  • top_queries.sql – 用于返回最近 7 天内前 50 条最费时的语句
  • perf_alerts.sql – 用于与表扫描相结合返回出现频率高的警报
  • filter_used.sql – 用于返回扫描时对表应用的筛选条件。帮助选择分类键
  • commit_stats.sql – 用于通过“COMMIT”语句显示集群资源的相关消耗信息
  • current_session_info.sql – 用于通过当前运行的查询显示会话信息
  • missing_table_stats.sql – 用于显示在底层表上标记为“missing statistics”的“EXPLAIN”计划
  • queuing_queries.sql – 用于列出在 WLM 查询槽中处于等待状态的查询
  • table_info.sql – 用于返回表存储信息(大小、偏移等)

SQL 视图,用于管理 Amazon Redshift 集群和生成架构 DDL。所有视图均假定您拥有一个称为“Admin”的架构。  在此下载 »

视图列表:

  • v_check_data_distribution.sql – 用于获取分片间的数据分配
  • v_constraint_dependency.sql – 用于获取表之间的外键约束
  • v_generate_group_ddl.sql – 用于获取组的 DDL
  • v_generate_schema_ddl.sql – 用于获取架构的 DDL
  • v_generate_tbl_ddl.sql – 用于获取表(包含分布键、排序键和约束)的 DDL
  • v_generate_unload_copy_cmd.sql – 用于生成对象的卸载和复制命令
  • v_generate_user_object_permissions.sql – 用于获取用户的表和视图权限的 DDL
  • v_generate_view_ddl.sql – 用于获取视图的 DDL
  • v_get_obj_priv_by_user.sql – 用于获取用户可访问的表/视图
  • v_get_schema_priv_by_user.sql – 用于获取用户可访问的架构
  • v_get_tbl_priv_by_user.sql – 用于获取用户可访问的表
  • v_get_users_in_group.sql – 用于获取组中的所有用户
  • v_get_view_priv_by_user.sql – 用于获取用户可访问的视图
  • v_object_dependency.sql – 用于将不同的依赖关系视图合并在一起
  • v_space_used_per_tbl.sql – 用于提取每个表中使用的空间
  • v_view_dependency.sql – 用于获取依赖其他表/视图的视图的名称
  • v_check_transaction_locks.sql – 用于获取未结事务持有的锁的相关信息
  • v_check_wlm_query_time.sql – 用于获取过去 7 天内的 WLM 等待时间和执行时间
  • v_check_wlm_query_trend_daily.sql – 用于获取每天的 WLM 查询数量、等待时间、执行时间
  • v_check_wlm_query_trend_hourly.sql – 用于获取每小时的 WLM 查询数量、等待时间、执行时间
  • v_generate_cancel_query.sql – 用于获取取消查询
  • v_get_cluster_restart_ts.sql – 用于获取最近重新启动集群的日期/时间
  • v_get_vacuum_details.sql – 用于获取有关 vacuum 操作的详细信息

可使用此实用工具来确定 Amazon Redshift 数据的最佳压缩率。  在此下载 »

在两个 Amazon Redshift 表(可位于不同的数据库、集群或区域中)之间轻松迁移数据。所有导出的数据均通过 AWS Key Management Service (KMS) 进行加密。您可以使用此实用工具补充 AWS Data Pipeline 以定期在系统间(如生产和测试之间)移动数据,或者用于维护其他集群上的只读副本。  在此下载 »


常见的用户定义函数 (UDF)。一组适合每个人使用的有用 UDF。贡献者:Periscope。了解更多 » | 在此下载 »

用于开发 UDF 的框架。为了使开发变得更加轻松,Periscope 构建了一个用于管理和测试 UDF 的框架。贡献者:Periscope。  在此下载 »

re:Dash.免费的开源数据协作和虚拟化平台,旨在快速而方便地访问数十亿条记录。功能包括架构浏览器、改善的计划、自动完成和编写 Python 查询的能力。贡献者:Everthing.me。  在此下载 »

EverythingMe 的 Amazon Redshift 管理仪表板。使用这一用户友好型工具监控正在运行的查询、WLM 队列以及您的表/架构。贡献者:EverythingMe。  在此下载 »

适用于 Amazon Redshift 的 Yelp ETL 工具。使用 Yelp Mycroft 将数据自动加载到 Amazon Redshift。请阅读该篇博客文章,了解更多信息。  在此下载 »

Spark-Redshift 库。使用该库将数据从 Amazon Redshift 加载到 Apache Spark SQL DataFrames,然后再将数据从 Apache Spark 回写到 Amazon Redshift。这是在 Amazon Redshift 中使用 AVRO 数据获取的一个很好的示例。贡献者:Swiftkey。  在此下载 »


我们拥有一系列丰富的博客文章,可提供用例和最佳实践指导,帮助您充分利用 Amazon Redshift。在此处访问博客文章的完整列表。