新增内容

阅读我们的最新资讯文章,了解有关 Amazon Redshift 和 Redshift Spectrum 的最新功能和公告。

在概念验证方面需要帮助?

如果您使用 Amazon Redshift 构建概念验证解决方案,建议您阅读为 Amazon Redshift 构建概念验证。要请求我们为您提供概念验证方面的帮助,请单击此处

文档

入门指南:向您介绍 Amazon Redshift,帮助您创建账户,然后通过一个简单的示例向您演示首次使用 Amazon Redshift 的过程。还提供了高级产品功能和资源的提示和链接。HTML | PDF | Kindle

Amazon Redshift 群集管理指南:介绍如何创建和管理 Amazon Redshift 群集。HTML | PDF | Kindle

Amazon Redshift 数据库开发人员指南:说明如何设计、构建、查询和维护构成数据仓库的数据库。它还包括 Amazon Redshift SQL 命令和函数的语法。HTML | PDF

Amazon Redshift API 参考:详细介绍 Amazon Redshift 的所有 API 操作。它还为支持的 Web 服务协议提供了请求、响应和错误的示例。HTML | PDF

Amazon Redshift CLI 指南:详细介绍 Amazon Redshift 的命令行界面。它提供了每个命令的基本语法、选项和用法示例。HTML

最佳实践

加载数据:使用“COPY”命令、批量插入和暂存表格高效地加载数据。了解更多 »

设计数据仓库 schema:设计可满足高查询性能、低存储和内存需求以及 I/O 操作最少的数据库。了解更多 »

优化查询性能:使用这些技巧和策略优化查询以最大限度提升性能。了解更多 »

优化及管理脚本和工具

Amazon Redshift 管理脚本   

SQL 脚本,用于在 Amazon Redshift 群集上使用系统表运行诊断程序。在此下载 »

脚本列表:

  • top_queries.sql – 用于返回最近 7 天内前 50 条最费时的语句
  • perf_alerts.sql – 用于与表扫描相结合返回出现频率高的警报
  • filter_used.sql – 返回应用于扫描表的筛选条件,以帮助选择排序键
  • commit_stats.sql – 用于通过“COMMIT”语句显示群集资源的相关消耗信息
  • current_session_info.sql – 用于通过当前运行的查询显示会话信息
  • missing_table_stats.sql – 用于显示在底层表上标记为“missing statistics”的“EXPLAIN”计划
  • queuing_queries.sql – 用于列出在 WLM 查询槽中处于等待状态的查询
    table_info.sql – 用于返回表存储信息(大小、偏移等) 

Admin SQL 视图    

SQL 视图,用于管理 Amazon Redshift 群集和生成 schema DDL。所有视图均假定您拥有一个称为“Admin”的 schema。在此下载 »

视图列表:

  • v_check_data_distribution.sql – 用于获取分片间的数据分配
  • v_constraint_dependency.sql – 用于获取表之间的外键约束
  • v_generate_group_ddl.sql – 用于获取组的 DDL
  • v_generate_schema_ddl.sql – 用于获取 schema 的 DDL
  • v_generate_tbl_ddl.sql – 用于获取表(包含分布键、排序键和约束)的 DDL
  • v_generate_unload_copy_cmd.sql – 用于生成对象的卸载和复制命令
  • v_generate_user_object_permissions.sql – 用于获取用户的表和视图权限的 DDL
  • v_generate_view_ddl.sql – 用于获取视图的 DDL
  • v_get_obj_priv_by_user.sql – 用于获取用户可访问的表/视图
  • v_get_schema_priv_by_user.sql – 用于获取用户可访问的 schema
  • v_get_tbl_priv_by_user.sql – 用于获取用户可访问的表
  • v_get_users_in_group.sql – 用于获取组中的所有用户
  • v_get_view_priv_by_user.sql – 用于获取用户可访问的视图
  • v_object_dependency.sql – 用于将不同的依赖关系视图合并在一起
  • v_space_used_per_tbl.sql – 用于提取每个表中使用的空间
  • v_view_dependency.sql – 用于获取依赖其他表/视图的视图的名称
  • v_check_transaction_locks.sql – 用于获取未结事务持有的锁的相关信息
  • v_check_wlm_query_time.sql – 用于获取过去 7 天内的 WLM 等待时间和执行时间
  • v_check_wlm_query_trend_daily.sql – 用于获取每天的 WLM 查询数量、等待时间、执行时间
  • v_check_wlm_query_trend_hourly.sql – 用于获取每小时的 WLM 查询数量、等待时间、执行时间
  • v_generate_cancel_query.sql – 用于获取取消查询
  • v_get_cluster_restart_ts.sql – 用于获取最近重新启动群集的日期/时间
  • v_get_vacuum_details.sql – 用于获取有关 vacuum 操作的详细信息

列编码实用工具

可使用此实用工具来确定 Amazon Redshift 数据的最佳压缩率。在此处下载 »

卸载/复制实用工具

在两个 Amazon Redshift 表(可位于不同的数据库、群集或区域中)之间轻松迁移数据。所有导出的数据均通过 AWS Key Management Service (KMS) 进行加密。您可以使用此实用工具补充 AWS Data Pipeline 以定期在系统间(如生产和测试之间)移动数据,或者用于维护其他群集上的只读副本。在此处下载 »

社区贡献的函数和工具

分析和管理工具

轻松  

常见的用户定义函数 (UDF)。一组适合每个人使用的有用 UDF。贡献者:Periscope。了解更多 » | 在此下载 »

适用于 Amazon Redshift 的 Yelp ETL 工具。使用 Yelp Mycroft 将数据自动加载到 Amazon Redshift。请阅读这篇博客文章,了解更多信息。在此下载 »

用于开发 UDF 的框架。为了使开发变得更加轻松,Periscope 构建了一个用于管理和测试 UDF 的框架。贡献者:Periscope Data。在此下载 »

re:Dash。免费的开源数据协作和虚拟化平台,旨在快速而方便地访问数十亿条记录。功能包括 schema 浏览器、改善的计划、自动完成和编写 Python 查询的能力。贡献者:Everthing.me。在此下载 »

EverythingMe 的 Amazon Redshift 管理控制面板。使用这一用户友好型工具监控正在运行的查询、WLM 队列以及您的表/schema。贡献者:EverythingMe。在此下载 »

Spark-Redshift 库。使用该库将数据从 Amazon Redshift 加载到 Apache Spark SQL DataFrames,然后再将数据从 Apache Spark 回写到 Amazon Redshift。这是在 Amazon Redshift 中使用 AVRO 数据获取的一个很好的示例。贡献者:Swiftkey。在此处下载 »

电子书和白皮书

精选博客文章
通过新的 AWS 课程学习如何构建数据仓库解决方案
作者:Kumar Kumaraguruparan,2021 年 11 月 15 日

我们拥有一系列丰富的博客文章,可提供使用案例和最佳实践指导,帮助您充分利用 Amazon Redshift。通过以下资源访问我们的完整博客文章列表。

目前还没有找到任何博客文章。请参阅 AWS 博客,了解其他资源。

阅读 AWS 新闻博客中有关 Amazon Redshift 的更多文章。

AWS 大数据博客中了解最佳实践、功能特性和客户使用案例。

AWS 数据库博客中了解如何从本地数据仓库迁移到 Amazon Redshift 等。

网络研讨会

数据仓库 2019 年回顾和 2020 年展望

了解 Amazon Redshift 团队在 2019 年代表客户投资的领域,以及对 2020 年的预测。

观看视频 » 

使用 AWS 统一您的数据仓库和数据湖

在此 300 级技术讲座中,了解如何使用数据仓库的 Lake house 方法打破数据孤岛。

观看视频 » 

将 IBM Netezza 数据仓库迁移到云的实用提示

了解如何准备和计划从 IBM Netezza 到 Amazon Redshift 的迁移。

观看视频 » 

关注 AWS 网络研讨会,了解最新信息。