Amazon Redshift データ共有を使用すると、Amazon Redshift が単一クラスターで提供する使いやすさ、パフォーマンス、コスト上の利点を、データを共有しながらマルチクラスターでのデプロイで拡張できます。データ共有により、データをコピーまたは移動することなく、Amazon Redshift クラスター全体で瞬時に詳細かつ高速なデータアクセスが可能になります。データ共有はデータへのライブアクセスを提供するため、データウェアハウスで更新されるときに、ユーザーは常に一貫性のある最新情報を確認することができます。同一または異なる AWS アカウント内およびリージョン間で Amazon Redshift クラスターとライブデータを安全に共有できます。

Amazon Redshift データ共有により、以下が可能になります。

  1. Amazon Redshift データウェアハウス間でデータを共有するシンプルで直接的な方法
  2. データのコピーや移動を伴わない、瞬時のきめ細かい高性能アクセス。
  3. すべてのコンシューマーにわたるデータのライブでトランザクションとして一貫性があるビュー。
  4. 組織内、組織間、および外部での安全で管理されたコラボレーション。
Amazon Redshift クロスアカウントのデータ共有が一般的に利用可能になりました。
 
Amazon Redshift クラスターでデータ共有を使用する際に追加費用は発生しません。
Amazon Redshift データ共有 (1:16)
Amazon Redshift RA3 マネージドストレージに基づいて構築されているこのデータ共有は、ストレージとコンピューティングを分離し、どちらも独立してスケールできるようにします。データ共有により、共有データにアクセスするワークロードが互いに分離されます。共有データにアクセスするクエリはコンシューマークラスターで実行され、プロデューサークラスターのパフォーマンスに影響を与えることなく Amazon Redshift が管理するストレージレイヤーから直接データを読み取ります。さまざまなデータアクセスパターンと SLA 要件を備えたワークロードをいくつでも迅速にオンボーディングできるようになり、リソースの競合を気にする必要がなくなりました。共有データにアクセスするワークロードは、ワークロード固有のコストパフォーマンス要件を満たす柔軟なコンピューティングリソースによりプロビジョニングでき、セルフサービス方式で必要に応じて個別にスケーリングできます。

仕組み

Amazon Redshift データ共有の仕組み

ユースケース

  • ワークロードの分離と課金
  • ワークロードの分離と課金

    ETL クラスターからのデータをハブスポークアーキテクチャー内の複数の分離された BI および分析クラスターと共有して、読み取りワークロードの分離とオプションでのコストのチャージバックを提供します。それぞれの分析クラスターは、コストパフォーマンス要件に応じてサイズを設定することができ、新しいワークロードを簡単にオンボーディングすることができます。

    ワークロードの分離と課金
  • グループ間のコラボレーション
  • グループ間のコラボレーション

    それぞれが個別の Amazo Redshift クラスターを維持する複数のビジネスグループ間でデータを共有し、より広範な分析とデータサイエンスのために連携します。それぞれの Amazon Redshift クラスターは、一部のデータのプロデューサーになることができますが、他のデータセットのコンシューマーになることもできます。

    グループ間のコラボレーション
  • サービスとしてのデータと分析
  • サービスとしてのデータと分析

    組織内のさまざまなグループ間で、あるいは組織外の外部関係者と、サービスとしてデータを共有します。

    サービスとしてのデータと分析
  • 開発の俊敏性
  • 開発の俊敏性

    スナップショットを作成してそれらを完全に復元することなく、開発、テスト、および本番環境間でデータを任意の粒度で共有できます。

    開発の俊敏性

お客様の導入事例

home24

FactSet

「FactSetのお客様の多くは、コスト削減、インフラストラクチャやベンダーの統合、重複するデータの排除を目的として、クラウドトランスフォーメーションやテクノロジーモダナイゼーションプログラムに取り組んでいます。FactSetは、進化するお客様のニーズに応えるため、AWS Redshift を含む多くの好ましいワークフロー環境にシームレスに統合できる柔軟なソリューションを提供しており、私たちのコンテンツやソリューションの採用と導入をターンキーで行うことができます。Redshift のデータ共有機能を活用することで、お客様の Redshift クラスター内で FactSet Standard DataFeed を即座に利用することができます。これにより、すべての ETL プロセスを FactSet にアウトソースすることができ、データの合理化、市場投入までの時間の短縮、データインテグリティの効率化、データディスカバリー、リンク、テストのプロセスの簡素化を実現しています。

Namita Jain 氏、プロダクトオーナー、クラウド & マネージドサービス部門

home24

Epsilon

「データ共有を導入する前は、Amazon Redshift を使ってお客様とデータを交換するプロセスは、効率的ではありませんでした。通常、週に 2 回、2 つの追加クラスターをスピンアップし、リストア、アンロード、コピー、スキーマのドロップ、権限の付与などを行っていました。データ共有では、ダウンタイムがほとんどあるいはまったくなく、お客様とデータを共有することができます。これまで時間がかかっていた作業を、10 個以下の SQL 文で安全に行うことができます。この機能のおかげで、柔軟性が増し、時間とコストが節約でき、お客様の満足度も向上しました」。

Samantha Corkery 氏、プリンシパルデータベースアドミニストレーター、Epsilon

Warner Bros.

Warner Bros.

「Warner Bros Games では、複雑なデータモビリティインフラストラクチャを構築および維持して、単一のゲームクラスターおよび統合されたビジネス機能クラスター間でのデータ移動を管理しています。ただし、こうしたシステムの開発と保守は、貴重なチームリソースを独占し、敏捷性とスピードをもってデータを処理する能力を妨げる遅延をもたらします。Redshift のデータ共有機能を使用すると、Redshift クラスター間でのデータのコピー、移動、ロード用に構築したサブシステム全体を排除できます。これにより、すべてのビジネスチームが、適切なデータセットを活用して迅速かつ効率的に意思決定できるようになります。さらに、Redshift のデータ共有により、コンピューティングプロビジョニングを再設計して、こうした機能の SQL ワークロードを実行するために必要なリソースとより緊密に連携できるようになり、最終的にはよりシンプルなインフラストラクチャ操作が可能になります。」

Kurt Larson 氏、テクニカルディレクター、Warner Bros.分析

Yelp

Yelp

「データ共有機能により、複数の Redshift クラスターが RA3 クラスターとその管理対象ストレージにあるデータをシームレスに照会することができます。これにより、チームがデータを利用できるようになるまでの遅延に関する懸念がなくなり、データの重複やそれに伴う埋め戻しといった頭痛の種が減ります。これで、Redshift のデータを活用することにさらに多くの時間をかけ、データの調整ではなくより良いコラボレーションが可能になります。」

Steven Moy 氏、エンジニア、Yelp

Fannie Mae

Fannie Mae

「Fannie Mae では、多数のアプリケーションにまたがる数十もの Amazon Redshift クラスターを使用し、データウェアハウス管理に分散型アプローチを採用しました。各チームは独自のデータセットを管理しますが、アプリケーションが他のアプリケーションのデータセットを照会し、ローカルで利用可能なデータと結合することが必要になるユースケースがよくあります。現在、あるクラスターから別のクラスターにデータをアンロードして移動しているため、チームにデータへのタイムリーなアクセスを提供する際に遅延が発生します。アンロード操作でプロデューサークラスターのリソース消費が急増するという問題が発生しましたが、データ共有により、Amazon S3 へのこの中間的なアンロードをスキップできるため、時間を短縮し、消費量を削減できます。現在、多くのアプリケーションがデータセットを共有するためにアンロードを実行しており、そのようなすべてのプロセスを新しいデータ共有機能を活用するように変換する予定です。データ共有を使用すると、アプリケーションチーム間でデータをシームレスに共有できるようになり、ETL を実行しなくてもデータの共通ビューを提供できます。また、各アプリケーションの本番前、研究、本番の各環境間でのデータコピーを回避することもできます。データ共有により、俊敏性が向上し、Fannie Mae のように高度に分散した環境でも分析を拡張できる柔軟性が得られました。」

Amy Tseng 氏、エンタープライズデータベースマネージャー、Fannie Mae

home24

Home24

「共有ストレージにより、エンドユーザーがデータを利用できるようにするという重要なことに集中できました。データは、無数のストレージメディアやフォーマットに閉じ込められたり、単一の種類の SQL でしかアクセスできないのではなく、選択した API でアクセスできるようになりました。」

Marco Couperus 氏、技術管理者、home24

リソース

ブログ

Amazon Redshift のクロスアカウントデータ共有

ブログ

ワークロードを分離するために Amazon Redshift クラスター間で Amazon Redshift データを安全に共有

ブログ

データ共有を使用した Amazon Redshift でのマルチテナントパターンの実装

動画

Amazon Redshift クロスアカウントデータ共有

動画

Amazon Redshift データ共有のユースケース

動画

AWS オンエア: Amazon Redshift データの共有と分離

動画

Amazon Redshift データ共有のマルチテナントパターン