Amazon Redshift を使用すると、データをロードすることなく、データウェアハウスのクエリをデータレイクにまで拡張できます。Redshift にローカルに保存されているペタバイト規模のデータに対して分析クエリを実行でき、Amazon S3 に保存されているエクサバイト規模のデータに対して分析クエリを直接実行できます。簡単にセットアップしてほとんどの管理作業を自動化でき、あらゆる規模で高速なパフォーマンスを実現できます。

主な特徴

高速のパフォーマンス

超並列処理: Amazon Redshift では、ギガバイトからエクサバイト規模のデータセットに対して高速にクエリを実行できます。Redshift では、列指向ストレージ、データ圧縮、ゾーンのマッピングが使用されているため、クエリ実行に必要な I/O の量が軽減されます。Redshift では、超並列処理 (MPP) データウェアハウスアーキテクチャが採用されており、SQL 操作の並列化と分散によって、利用可能なあらゆるリソースを活用します。基盤となるハードウェアはデータ処理のパフォーマンスを高める設計となっており、ローカル接続ストレージを使用して CPU とドライブの間のスループットを最大化するとともに、高帯域幅イーサメッシュネットワークを使用してノード間のスループットを最大化します。

機械学習: Amazon Redshift では機械学習が採用されており、ワークロードに応じた高いスループットを実現します。Redshift では、実行時に想定されるクエリを高度なアルゴリズムを用いて予測し、そのクエリを最適なキューに割り当てて高速処理を実現しています。例えば、ダッシュボードやレポートのように大規模な並列処理を必要とするクエリは、高速のキューに転送されて直ちに処理されます。

結果のキャッシュ: Amazon Redshift では、結果をキャッシュすることで、繰り返し実行されるクエリに対して 1 秒未満の応答時間を実現しています。同じクエリを繰り返し実行するダッシュボード、可視化ツール、ビジネスインテリジェンスツールは、これによってパフォーマンスが大幅に向上します。クエリを実行すると、Redshift ではキャッシュを検索し、以前の実行でキャッシュされている結果がないかを確認します。キャッシュされている結果が見つかり、データが変更されていないことがわかると、クエリを再度実行せずに、キャッシュされている結果を即座に返します。

セットアップ、デプロイ、管理が簡単

自動プロビジョニング: Amazon Redshift は、簡単にセットアップして運用できます。AWS コンソールで数回クリックするだけで、新しいデータウェアハウスをデプロイできます。インフラストラクチャのデプロイは、お客様に代わって Redshift が自動で行います。バックアップやレプリケーションといったほとんどの管理作業が自動化されているため、お客様は、管理作業ではなくデータ処理の作業に集中できます。その一方で、Redshift では、お客様が管理作業を行いたい場合のために、特定のワークロードをカスタマイズするためのオプションが用意されています。新しい機能は透過的にリリースされるため、あらかじめスケジュールを作成してアップグレードやパッチを適用する必要はありません。

自動バックアップ: Amazon Redshift では、データを Amazon S3 に自動的かつ継続的にバックアップします。また、災害対策のために、スナップショットを別リージョンの S3 に非同期でレプリケートできます。AWS マネジメントコンソールや Redshift API でシステムのスナップショットまたはユーザーのスナップショットを使用して、クラスターを復元できます。システムのメタデータが復元されるとすぐにクラスターを利用できるようになり、データがバックグラウンドでスプールされている間にクエリの実行を開始できます。

耐障害性: Amazon Redshift はデータウェアハウスクラスターの信頼性を向上させる各種機能を備えています。耐障害性を実現するために、クラスターの状態は常時モニタリングされており、障害があるドライブから自動的にデータが再度レプリケートされ、必要に応じてノードの交換が行われます。

サードパーティ製ツールの統合: データのロード、変換、可視化を行うための業界最先端のツールや専門技術を組み合わせることで、Amazon Redshift の機能を拡張できます。AWS の広範なパートナーは、Amazon Redshift と組み合わせて使用できることが証明されたソリューションを提供しています。 

高い費用対効果

初期費用なしの従量課金制: Amazon Redshift は最もコスト効率の高いデータウェアハウスで、お客様がプロビジョンしたリソース以外は料金が発生しません。コミットメントなしで 1 時間あたり 0.25 USD から開始でき、1 テラバイトあたり年額 250 USD まで規模を拡大できます。Redshift は、初期費用なしのオンデマンド料金体系を提供する唯一のクラウドデータウェアハウスです。リザーブドインスタンスの料金体系の場合、1 年契約または 3 年契約で最大 75% コストを節約できます。また、クエリ単位の料金体系の場合、Amazon S3 データレイクでスキャンされたデータ量に応じて料金が発生します。 詳細については、Amazon Redshift の料金表ページを参照してください。

ノードタイプを選択可能: データウェアハウジングのニーズに合わせて Redshift を最適化するために、2 つのノードタイプを選択することができます。Dense Compute (DC) ノードでは、きわめて高パフォーマンスのデータウェアハウスを作成するために、高速 CPU、大容量 RAM、SSD (Solid-State Disk) が使用されます。さらにスケールしたい場合、またはコストを削減したい場合は、コスト効率が高い Dense Storage (DS) ノードタイプに切り替えてください。このノードタイプでは、非常に低価格でより大規模なハードディスクドライブを使用します。クラスターのスケーリングやノードタイプの切り替えに必要なのは、API コール 1 回のみ、または AWS コンソールで数回クリックすることのみです。

素早くスケールしてニーズを満足

ペタバイト規模のデータウェアハウジング: Amazon Redshift は、お客様のニーズの変化に合わせてすばやく簡単にスケールすることができます。コンソールで数回クリックするのみで、または API コール 1 回のみで、データウェアハウスのノード数やノードタイプを簡単に変更でき、お客様のニーズの変化に合わせて簡単にスケールアップやスケールダウンができます。

エクサバイト規模のデータレイク分析: Redshift の機能の 1 つである Redshift Spectrum を使用すると、データのロードや変換を行うことなく、Amazon S3 にあるエクサバイト規模のデータに対してクエリを実行できます。可用性が高く、安全で、コスト効率が高いデータレイクとして S3 を使用し、オープンデータ形式で無制限にデータを保存できます。

無制限の並列処理: Redshift Spectrum では、Amazon S3 にある同じデータに対して複数のクエリの同時実行を可能にすることで、無制限の並列処理を実現しています。Redshift Spectrum では、クエリの複雑さやデータ量にかかわらず、並列化された何千ものノードに対してクエリを実行できるため、すばやく結果を得ることができます。

データレイクに対するクエリの実行

Amazon S3 データレイク: Amazon Redshift は、データをロードすることなく Amazon S3 データレイクに対してクエリを実行できる唯一のデータウェアハウスです。S3 に保存されているオープンファイル形式 (Avro、CSV、Grok、JSON、ORC、Parquet など) に対し、クエリを直接実行できます。そのため、エクサバイト規模の構造化および非構造化データを S3 に保持したまま、高度に構造化されて頻繁にアクセスされるデータを Redshift のローカルディスクに柔軟に保存でき、構造化データと非構造化データのいずれに対してもシームレスにクエリを実行できます。これにより、各データセットに対して個別にクエリを実行したときには取得できなかった独自のインサイトを得ることができます。

AWS の分析エコシステム: Amazon Redshift には、AWS の分析エコシステムがネイティブに組み込まれています。AWS Glue を使用すると、Redshift にデータを抽出、変換、ロード (ETL) することができます。Amazon Kinesis Data Firehose を使用すると、最も簡単な方法で Redshift にストリーミングデータをキャプチャ、変換、ロードでき、ほぼリアルタイムで分析を行えます。Amazon QuickSight を使用すると、レポートや可視化ツール、ダッシュボードを作成できます。 Amazon Redshift への移行を加速するため、AWS Database Migration Service (DMS) を 6 か月間無料で使用できます。詳細はこちら »

安全性

エンドツーエンドの暗号化: Amazon Redshift のいくつかのパラメータを設定するだけで、移動中のデータの保護には SSL、保管中のデータの保護にはハードウェアアクセラレーション対応の AES-256 暗号化が使用されるようになります。保存データの暗号化を有効化する場合、ディスクに書き込まれたすべてのデータはあらゆるバックアップと同じように暗号化されます。デフォルトでは、Amazon Redshift がキー管理を行います。

ネットワーク分離: Amazon Redshift では、データウェアハウスクラスターへのネットワークアクセスを制御するためのファイアウォールルールを設定できます。Amazon Redshift を Amazon VPC 内で実行し、データウェアハウスクラスターを独自の仮想ネットワーク内に隔離することができます。また、業界標準の暗号化 IPsec VPN を使用して、そのクラスターを既存の IT インフラストラクチャに接続することができます。

監査とコンプライアンス: Amazon Redshift は AWS CloudTrail と統合されているため、Redshift の API コールをすべて監査できます。Redshift での SQL 操作 (データベースへの接続試行、クエリ、変更) はすべてログに記録されます。このログにアクセスするには、システムテーブルに対する SQL クエリを使用するか、Amazon S3 上の安全な場所にログをダウンロードします。Amazon Redshift は、SOC1、SOC2、SOC3、および PCI DSS Level 1 の要件に準拠しています。詳細については、AWS クラウドコンプライアンスをご覧ください。

Amazon Redshift 料金の詳細

料金ページを見る
構築を始めましょう。
Amazon Redshift の使用を開始する
ご不明な点がおありですか?
お問い合わせ