Amazon Redshift データ共有を使用すると、Amazon Redshiftが単一クラスターで提供する使いやすさ、パフォーマンス、コスト上の利点を、データを共有しながらマルチクラスターでのデプロイで拡張できます。データ共有により、データをコピーまたは移動することなく、Amazon Redshift クラスター全体で瞬時に詳細かつ高性能なデータアクセスが可能になります。データ共有はデータへのライブアクセスを提供するため、データウェアハウスで更新されるときに、ユーザーは常に一貫性のある最新情報を確認することができます。Amazon Redshift クラスターでデータ共有を使用する際に追加費用は発生しません。

Amazon Redshift データ共有により、以下が可能になります。

  1. Amazon Redshift データウェアハウス間でデータを共有するシンプルで直接的な方法
  2. データのコピーや移動を伴わない、瞬時のきめ細かい高性能アクセス。
  3. すべてのコンシューマーにわたるデータのライブでトランザクションとして一貫性があるビュー。
  4. 組織内および組織間での安全で管理されたコラボレーション。
Amazon Redshift データ共有ワークフロー (8:53)
Amazon Redshift RA3 マネージドストレージに基づいて構築されているこのデータ共有は、ストレージとコンピューティングを分離し、どちらも独立して拡張できるようにします。データ共有により、共有データにアクセスするワークロードが互いに分離されます。共有データにアクセスするクエリはコンシューマークラスターで実行され、プロデューサークラスターのパフォーマンスに影響を与えることなく Amazon Redshift が管理するストレージレイヤーから直接データを読み取ります。さまざまなデータアクセスパターンと SLA 要件を備えたワークロードをいくつでも迅速にオンボーディングできるようになり、リソースの競合を気にする必要がなくなりました。共有データにアクセスするワークロードは、ワークロード固有のコストパフォーマンス要件を満たす柔軟なコンピューティングリソースによりプロビジョニングでき、セルフサービス方式で必要に応じて個別にスケーリングできます。

仕組み

Amazon Redshift データ共有の仕組み

ユースケース

  • ワークロードの分離と課金
  • グループ間のコラボレーション
  • サービスとしてのデータと分析
  • 開発の俊敏性
  • ワークロードの分離と課金
  • ワークロードの分離と課金

    ETL クラスターからのデータをハブスポークアーキテクチャー内の複数の分離された BI および分析クラスターと共有して、読み取りワークロードの分離とオプションでのコストのチャージバックを提供します。それぞれの分析クラスターは、コストパフォーマンス要件に応じてサイズを設定することができ、新しいワークロードを簡単にオンボーディングすることができます。

    ワークロードの分離と課金
  • グループ間のコラボレーション
  • グループ間のコラボレーション

    それぞれが個別の Amazo Redshift クラスターを維持する複数のビジネスグループ間でデータを共有し、より広範な分析とデータサイエンスのために連携します。それぞれの Amazon Redshift クラスターは、一部のデータのプロデューサーになることができますが、他のデータセットのコンシューマーになることもできます。

    グループ間のコラボレーション
  • サービスとしてのデータと分析
  • サービスとしてのデータと分析

    組織内のさまざまなグループ間で、あるいは組織外の外部関係者と、サービスとしてデータを共有します。

    サービスとしてのデータと分析
  • 開発の俊敏性
  • 開発の俊敏性

    スナップショットを作成してそれらを完全に復元することなく、開発、テスト、および本番環境間でデータを任意の粒度で共有できます。

    開発の俊敏性

お客様の導入事例

Warner Bros.

Warner Bros.

「Warner Bros Games では、複雑なデータモビリティインフラストラクチャを構築および維持して、単一のゲームクラスターおよび統合されたビジネス機能クラスター間でのデータ移動を管理しています。ただし、こうしたシステムの開発と保守は、貴重なチームリソースを独占し、敏捷性とスピードをもってデータを処理する能力を妨げる遅延をもたらします。Redshift のデータ共有機能を使用すると、Redshift クラスター間でのデータのコピー、移動、ロード用に構築したサブシステム全体を排除できます。これにより、すべてのビジネスチームが、適切なデータセットを活用して迅速かつ効率的に意思決定できるようになります。さらに、Redshift のデータ共有により、コンピューティングプロビジョニングを再設計して、こうした機能の SQL ワークロードを実行するために必要なリソースとより緊密に連携できるようになり、最終的にはよりシンプルなインフラストラクチャ操作が可能になります。」

Kurt Larson 氏、テクニカルディレクター、Warner Bros.分析

Yelp

Yelp

「データ共有機能により、複数の Redshift クラスターが RA3 クラスターとその管理対象ストレージにあるデータをシームレスに照会することができます。これにより、チームがデータを利用できるようになるまでの遅延に関する懸念がなくなり、データの重複やそれに伴う埋め戻しといった頭痛の種が減ります。これで、Redshift のデータを活用することにさらに多くの時間をかけ、データの調整ではなくより良いコラボレーションが可能になります。」

Steven Moy 氏、エンジニア、Yelp

Fannie Mae

Fannie Mae

「Fannie Mae では、多数のアプリケーションにまたがる数十もの Amazon Redshift クラスターを使用し、データウェアハウス管理に分散型アプローチを採用しました。各チームは独自のデータセットを管理しますが、アプリケーションが他のアプリケーションのデータセットを照会し、ローカルで利用可能なデータと結合することが必要になるユースケースがよくあります。現在、あるクラスターから別のクラスターにデータをアンロードして移動しているため、チームにデータへのタイムリーなアクセスを提供する際に遅延が発生します。アンロード操作でプロデューサークラスターのリソース消費が急増するという問題が発生しましたが、データ共有により、Amazon S3 へのこの中間的なアンロードをスキップできるため、時間を短縮し、消費量を削減できます。現在、多くのアプリケーションがデータセットを共有するためにアンロードを実行しており、そのようなすべてのプロセスを新しいデータ共有機能を活用するように変換する予定です。データ共有を使用すると、アプリケーションチーム間でデータをシームレスに共有できるようになり、ETL を実行しなくてもデータの共通ビューを提供できます。また、各アプリケーションの本番前、研究、本番の各環境間でのデータコピーを回避することもできます。データ共有により、俊敏性が向上し、Fannie Mae のように高度に分散した環境でも分析を拡張できる柔軟性が得られました。」

Amy Tseng 氏、エンタープライズデータベースマネージャー、Fannie Mae

home24

Home24

「共有ストレージにより、エンドユーザーがデータを利用できるようにするという重要なことに集中できました。データは、無数のストレージメディアやフォーマットに閉じ込められたり、単一の種類の SQL でしかアクセスできないのではなく、選択した API でアクセスできるようになりました。」

Marco Couperus 氏、技術管理者、home24

リソース

ブログ

ワークロードを分離するために Amazon Redshift クラスター間で Amazon Redshift データを安全に共有

ブログ

データ共有を使用した Amazon Redshift でのマルチテナントパターンの実装

動画

Amazon Redshift データ共有のユースケース

動画

AWS オンエア: Amazon Redshift データの共有と分離

動画

Amazon Redshift データ共有のマルチテナントパターン

Amazon Redshift の使用を開始する

Amazon Redshift 入門ガイド
入門ガイドを確認する

次の手順でサンプルデータをロードして Amazon Redshift での分析を開始してください。

詳細はこちら 
無料の AWS アカウントにサインアップ
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
Amazon Redshift ラボ
ラボで実践経験を積んでください

ヒントとテクニックを学んで、Amazon Redshift での経験からできるだけ多くのことを学んでください。

開始方法