Amazon Redshift クラスターの作成と管理の方法を説明します。  HTML | PDF | Kindle

データウェアハウスを構成するデータベースの設計、構築、クエリ、およびメンテナンスを行う方法について説明します。Amazon Redshift SQL コマンドおよび関数の構文も含まれています。  HTML | PDF

Amazon Redshift に対して行えるすべての API 操作を詳しく説明します。サポートされるウェブサービスプロトコルについて、リクエスト、レスポンス、およびエラーのサンプルも掲載されています。  HTML | PDF

Amazon Redshift のコマンドラインインターフェイスを詳しく説明します。各コマンドの基本的な構文、オプション、および使用例が掲載されています。  HTML


Amazon Redshift でのデータのロードとクエリパフォーマンスの最適化のベストプラクティスについて扱った AWS ウェブキャストです。  動画パート 1 を見る | 動画パート 2 を見る

COPY コマンド、一括挿入およびステージングテーブルを使用して効率的にデータをロードします。  詳細 »

高いクエリパフォーマンス、ストレージとメモリ要件の引き下げ、および I/O 操作の最小化を目指してデータベースを設計します。  詳細 »

これらのヒントや戦略を使用して、クエリのパフォーマンスが最大になるようチューニングします。  詳細 »


システムテーブルを使用して Amazon Redshift クラスターで診断を実行する SQL スクリプトです。  ダウンロードはこちら »

スクリプトの一覧

  • top_queries.sql – 過去 7 日間で実行に最も時間を要したステートメントの上位 50 件を返します。
  • perf_alerts.sql – 最も頻繁に発生した上位のアラートを返します。テーブルスキャンと結合します。
  • filter_used.sql – スキャン時にテーブルに適用されるフィルターを返します。ソートキーの選択時に便利です。
  • commit_stats.sql – COMMIT ステートメントによりクラスターリソースの消費に関する情報を表示します。
  • current_session_info.sql – クエリが現在実行されているセッションに関する情報を表示します。
  • missing_table_stats.sql – 基礎となるテーブルについて "統計不足" とフラグの付いた EXPLAIN プランを表示します。
  • queuing_queries.sql – WLM クエリスロットで待機中のクエリを表示します。
  • table_info.sql – テーブルストレージの情報 (サイズ、スキューなど) を返します。

Amazon Redshift クラスターの管理と Schema DDL 生成のための SQL ビューです。すべてのビューで、Admin というスキーマがあることが想定されています。  ダウンロードはこちら »

ビューの一覧

  • v_check_data_distribution.sql – スライス間のデータ分散を取得します。
  • v_constraint_dependency.sql – テーブル間の外部キー制約を取得します。
  • v_generate_group_ddl.sql – グループの DDL を取得します。
  • v_generate_schema_ddl.sql – スキーマの DDL を取得します。
  • v_generate_tbl_ddl.sql – テーブルの DDL を取得します。分散キー、ソートキー、制約が含まれます。
  • v_generate_unload_copy_cmd.sql – オブジェクトのアンロードおよびコピーコマンドを生成します。
  • v_generate_user_object_permissions.sql – テーブルとビューに対するユーザーアクセス権限の DDL を取得します。
  • v_generate_view_ddl.sql – ビューの DDL を取得します。
  • v_get_obj_priv_by_user.sql – ユーザーがアクセス権限を持つテーブル/ビューを取得します。
  • v_get_schema_priv_by_user.sql – ユーザーがアクセス権限を持つスキーマを取得します。
  • v_get_tbl_priv_by_user.sql – ユーザーがアクセス権限を持つテーブルを取得します。
  • v_get_users_in_group.sql – グループのすべてのユーザーを取得します。
  • v_get_view_priv_by_user.sql – ユーザーがアクセス権限を持つビューを取得します。
  • v_object_dependency.sql – 異なる依存関係ビューをマージします。
  • v_space_used_per_tbl.sql – テーブル単位で使用される領域を取得します。
  • v_view_dependency.sql – 他のテーブル/ビューに依存しているビューの名前を取得します。
  • v_check_transaction_locks.sql – 開いているトランザクションによるロックについての情報を取得します。
  • v_check_wlm_query_time.sql – 過去 7 日間の WLM 待機時間と実行時間を取得します。
  • v_check_wlm_query_trend_daily.sql – 日ごとの WLM クエリカウント、待機時間、実行時間を取得します。
  • v_check_wlm_query_trend_hourly.sql – 時間ごとの WLM クエリカウント、待機時間、実行時間を取得します。
  • v_generate_cancel_query.sql – キャンセルクエリを取得します。
  • v_get_cluster_restart_ts.sql – クラスターが最近再起動された日付と時刻を取得します。
  • v_get_vacuum_details.sql – バキュームの詳細を取得します。

このユーティリティを使用して、Amazon Redshift データの最適な圧縮を決定します。  ダウンロードはこちら »

異なるデータベース、クラスター、リージョンにある、2 つの Amazon Redshift テーブル間でデータを簡単に移行します。エクスポートされたデータはすべて、AWS Key Management Service (KMS) によって暗号化されます。このユーティリティを AWS Data Pipeline を補完するものとして使用して、本番環境とテスト環境との間や、他のクラスターでの読み取り専用コピーの保持といった、システム間での定期的なデータ移行を行えます。  ダウンロードはこちら »


一般的なユーザー定義関数 (UDF)。すべての人にとって便利な UDF のコレクションです。Periscope によって提供されました。 詳細 » | ダウンロードはこちら »

UDF 開発のフレームワーク。 開発を容易にするため、Periscope によって UDF の管理とテストのためのフレームワークが構築されました。Periscope によって提供されました。  ダウンロードはこちら »

re:Dash。何十億ものレコードにすばやく容易にアクセスできるように設計された、無料のオープンソースのデータコラボレーションおよび可視化プラットフォームです。スキーマブラウザ、改良されたスケジューリング、自動入力、Python クエリの作成などの機能を備えています。Everthing.me によって提供されました。  ダウンロードはこちら »

EverythingMe の Amazon Redshift 管理ダッシュボード。この使いやすいツールによって実行中のクエリ、WLM クエリ、およびテーブル/スキーマをモニタリングできます。EverythingMe によって提供されました。  ダウンロードはこちら »

Yelp の Amazon Redshift 用 ETL ツール。Yelp の Mycroft を使用して、自動的に Amazon Redshift へデータをロードします。詳細については、こちらのブログ投稿を参照してください。  ダウンロードはこちら »

Spark-Redshift ライブラリ。このライブラリを使用して、Amazon Redshift から Apache Spark SQL DataFrames にデータをロードし、Apache Spark からのデータを Amazon Redshift に書き戻します。Amazon Redshift で AVRO 取り込みを使用したよい例です。Swiftkey によって提供されました。  ダウンロードはこちら »


Amazon Redshift を最大限に活用するのに役立つユースケースやベストプラクティスのガイダンスが得られる、豊富なブログ記事が用意されています。こちらから、ブログ記事の一覧をご覧ください。