Amazon Redshift は最も人気のある高速なクラウドデータウェアハウスです。Redshift はお客様のデータレイクと統合でき、他のどのデータウェアハウスよりも最大 3 倍速いパフォーマンスと、他のどのクラウドデータウェアハウスよりも最大 75% 低いコストを実現できます。

特徴と利点

AWS では毎年、お客様の導入事例やフィードバックに基づいて数百個の機能と製品の改善項目をリリースしています。 最新情報についてはこちらをご覧ください。

データレイクや AWS のサービスとの非常に緊密な統合

Amazon Redshift では、オープンフォーマットでデータをすばやく簡単に操作したり、AWS エコシステムに簡単に接続したりできます。

データレイクにクエリを実行し、データレイクとの間でデータをエクスポート: オープンフォーマットでデータのクエリとデータレイクへのデータの書き込みをいずれも簡単に行えるクラウドデータウェアハウスは他にありません。Parquet、ORC、JSON、Avro、CSV などのオープンファイルフォーマットに対してクエリを実行したり、使い慣れた ANSI SQL を使用して S3 でより直接的にクエリを実行したりできます。データをデータレイクにエクスポートする場合、SQL コードで Redshift の UNLOAD コマンドを使用し、ファイル形式として Parquet を指定するだけで、Redshift によって自動的にデータのフォーマットとデータの S3 への移動が行われます。これにより、高度に構造化されたアクセス頻度の高いデータを Redshift データウェアハウスに保存しながら、最大でエクサバイト規模の構造化データ、半構造化データ、非構造化データを S3 で維持できる柔軟性が生まれます。Redshift からデータレイクにデータをエクスポートすることで、Amazon AthenaAmazon EMRAmazon SageMaker などの AWS のサービスでデータをさらに分析できます。 

フェデレーテッドクエリ (プレビュー): Redshift の新しいフェデレーテッドクエリ機能を使用すれば、運営に関するリレーショナルデータベースにアクセスできます。1 つ以上の Amazon RDS データベースと Aurora PostgreSQL データベースに対してライブデータのクエリを実行することで、データを移動することなく、事業運営をエンドツーエンドで即座に可視化できます。Redshift データウェアハウスからのデータ、データレイクのデータ、運営に関するストアのデータを組み合わせて、より良いデータに基づく決定を実現できます。Redshift では、高度な最適化を使用してネットワーク上を移動するデータの量を減らし、大規模並列データ処理によって強化し、パフォーマンスの高いクエリを実現します。今すぐプレビューをお試しください

AWS の分析エコシステム: AWS の分析エコシステムとのネイティブ統合により、摩擦を生じさせることなく分析ワークフローをエンドツーエンドで簡単に処理できます。 例えば、AWS Lake Formation は、安全なデータレイクを数日で簡単にセットアップできるサービスです。AWS Glue を使用すると、Redshift にデータを抽出、変換、ロード (ETL) することができます。Amazon Kinesis Data Firehose を使用すると、最も簡単な方法で Redshift にストリーミングデータをキャプチャ、変換、ロードでき、ほぼリアルタイムで分析を行えます。Amazon EMR を使用すると、Hadoop/Spark を使用してデータを処理し、出力を Amazon Redshift にロードして BI や分析を行えます。Amazon QuickSight は、セッション単位の料金で利用できる初の BI サービスで、Redshift データに関するレポートやダッシュボードを作成することや、可視化することができます。Redshift を使用してデータを準備し、Amazon SageMaker で機械学習ワークロードを実行できます。AWS Schema Conversion ToolAWS Database Migration Service (DMS) を使用して、Amazon Redshift への移行を加速させることができます。また、Amazon Redshift は、セキュリティ、モニタリング、コンプライアンスを実現するために Amazon Key Management Service (KMS)Amazon Cloudwatch と緊密に統合されています。

最高のパフォーマンス

Amazon Redshift は高速で、業界をリードするパフォーマンス、柔軟性を得られます。

RA3 インスタンス: RA3 インスタンスでは、他のすべてのクラウドデータウェアハウスサービスの 3 倍のパフォーマンスを実現できます。これらの Amazon Redshift インスタンスでは、大量のコンピューティング性能を必要とし、パフォーマンスが重要なワークロードのスピードを最大限に高めると同時に、必要なインスタンスの数を指定することでストレージとは関係なく、コンピューティングの料金を個別に支払うという柔軟性を得られます。

効率的なストレージと高パフォーマンスのクエリ処理: Amazon Redshift では、ギガバイトからペタバイト規模のデータセットに対して高速にクエリを実行できます。列指向ストレージ、データ圧縮、ゾーンのマッピングによって、クエリ実行に必要な I/O の量が削減されます。また、Amazon Redshift では、LZO、Zstandard などの業界標準のエンコーディングだけでなく、数値と日付/時刻型向けの専用の圧縮エンコーディング AZ64 も提供しており、それによりストレージの節約とクエリパフォーマンスの最適化を実現できます。

マテリアライズドビュー (プレビュー): Amazon Redshift マテリアライズドビューでは、ダッシュボード作成、ビジネスインテリジェンス (BI) ツールからのクエリ、抽出、ロード、変換 (ELT) データ処理ジョブなどの分析ワークロードで今までよりも大幅に速いクエリパフォーマンスを達成できます。マテリアライズドビューを使用して中間結果をキャッシュすることで、実行速度の遅いクエリの速度を上げることができます。Amazon Redshift では、マテリアライズドビューを増分で効率的に維持できるため、低レイテンシーパフォーマンスの利点を利用し続けることができます。今すぐプレビューをお試しください

機械学習でスループットとパフォーマンスを最大化: Amazon Redshift の高度な機械学習機能により、変化するワークロードや同時実行ユーザーのアクティビティであっても高いスループットとパフォーマンスを実現できます。Amazon Redshift では、高度なアルゴリズムを使用して、受信したクエリの実行時間とリソース要件に基づいてクエリを予測および分類することで、パフォーマンスと同時実行を動的に管理すると同時に、ビジネスクリティカルなワークロードに優先順位を付けることができるようにします。ショートクエリアクセラレーション (SQA) では、ダッシュボードなどのアプリケーションから高速キューに短いクエリを送信し、大規模なクエリの後ろで長い間待機するのではなく、即座に処理されるようにします。自動ワークロード管理 (WLM) では、機械学習を使用してメモリと同時実行を動的に管理することで、クエリのスループットを最大限に高めます。また、数百件のクエリが送信されていても、最も重要なクエリを優先するように簡単に設定できるようになりました。Amazon Redshift はユーザーのワークロードを継続的に確認する自己学習システムでもあり、使用量の増加に応じてパフォーマンスを向上させる機会を特定したり、最適化をシームレスに適用したりします。また、Amazon Redshift のパフォーマンスをさらに高めるためにユーザーによる明示的な操作が必要な場合は、Redshift Advisor から推奨事項を提案します。 

結果のキャッシュ: Amazon Redshift では、結果をキャッシュすることで、繰り返し実行されるクエリに対して 1 秒未満の応答時間を実現しています。同じクエリを繰り返し実行するダッシュボード、可視化ツール、ビジネスインテリジェンスツールは、これによってパフォーマンスが大幅に向上します。クエリを実行すると、Amazon Redshift はキャッシュを検索し、以前の実行でキャッシュされた結果がないか確認します。キャッシュされている結果が見つかり、データが変更されていないことがわかると、クエリを再度実行せずに、キャッシュされている結果を即座に返します。

最もスケーラブル

データをスケールする場合でも、ユーザーをスケールする場合でも、Amazon Redshift は実質的に無制限です。 

ペタバイト規模のデータウェアハウジング: Amazon Redshift では、お客様のニーズの変化に合わせてすばやく簡単にスケールすることができます。コンソールで数回クリックするのみで、または API コール 1 回のみで、データウェアハウスのノード数やノードタイプを簡単に変更でき、お客様のニーズの変化に合わせて簡単にスケールアップやスケールダウンができます。マネージドストレージにより、容量が自動的に追加され、最大 8 PB の圧縮データのワークロードをサポートします。 

ペタバイト規模のデータレイク分析Redshift Spectrum 機能を使用して、データのロードや変換を行うことなく、Amazon S3 にあるペタバイト規模のデータに対してクエリを実行できます。可用性が高く、安全で、コスト効率が高いデータレイクとして S3 を使用し、オープンデータフォーマットで無制限にデータを保存できます。Amazon Redshift Spectrum では、クエリの複雑さやデータ量にかかわらず、並列化された何千ものノードに対してクエリを実行できるため、すばやく結果を得ることができます。 

無制限の並列処理: Amazon Redshift では、Amazon Redshift データウェアハウスのデータをクエリする場合でも、Amazon S3 データレイクを直接クエリする場合でも、数千の同時実行クエリがあったとしても一貫して高速のパフォーマンスが提供されます。Amazon Redshift の同時実行スケーリングでは、実質的に無制限の同時実行ユーザーと同時実行クエリをサポートし、同時実行数の増加に応じて数秒で一時的な容量を追加することで、安定したサービスレベルを維持します。 

最良の価値

Amazon Redshift をクラウドデータウェアハウスとして使用すると、コンピューティングとストレージの料金を個別に支払ったり、管理することでコストを予測したりできます。また、従量課金制にするのか、リザーブドインスタンスを契約して最大 75% 節約するのかを選択できます。

柔軟な料金オプション: Amazon Redshift は、最もコスト効率に優れたデータウェアハウスです。また、データウェアハウスの料金を支払う方法を最適化する方法を選択できます。コミットメントなしで 1 時間あたり 0.25 USD から開始でき、1 年間、1 テラバイトあたり 250 USD までスケールを拡大できます。Amazon Redshift は、初期費用なしのオンデマンド料金体系を提供する唯一のクラウドデータウェアハウスです。リザーブドインスタンスの料金体系の場合、1 年契約または 3 年契約で最大 75% コストを節約できます。また、クエリ単位の料金体系の場合、Amazon S3 データレイクでスキャンされたデータ量に応じて料金が発生します。Amazon Redshift の料金には、組み込みセキュリティ、データ圧縮、バックアップストレージ、データ転送が含まれています。データサイズの増加に伴い、RA3 インスタンスでマネージドストレージを使用して、1 か月あたり 0.024 USD/GB という高いコスト効率でデータを保存できます。

予測不可能なワークロードに対しても予測可能なコスト: Amazon Redshift を使用すると、各クラスターで 1 日あたり最大 1 時間の無料同時実行スケーリングクレジットが得られるため、コストへの影響を最小限に抑えつつ拡張できます。これらの無料クレジットは、97% のお客様の同時実行性に関するニーズを十分に満たすものです。これにより、分析需要が変動している期間でも、月ごとのコストを予測することができます。 

ワークロードにとって最良の価値を得られるノードタイプを選択: 3 つのインスタンスタイプの中から選んで、お客様のデータウェアハウジングのニーズに合わせて Amazon Redshift を最適化できます。

RA3 ノードでは、コンピューティングとは別にストレージをスケールできます。RA3 を使用すると、個別のストレージ階層にデータを保存する高パフォーマンスのデータウェアハウスを実現できます。必要なクエリのパフォーマンスに合わせてデータウェアハウスのサイズを決定するだけです。

Dense Compute (DC) ノードでは、高速 CPU、大容量 RAM、SSD (Solid-State Disk) を使用してきわめて高パフォーマンスのデータウェアハウスを作成できます。これは、データが 500 GB を超える場合に最適な選択肢です。

DS2 (Dense Storage) ノードでは、3 年契約のリザーブドインスタンスを購入すれば、ハードディスクドライブ (HDD) を使用して、低コストで大規模なデータウェアハウスを作成できます。こうすることで、ストレージを大量に必要とするワークロードにとって最もコスト効率に優れたノードタイプになります。DS2 クラスターで実行しているほとんどのお客様は、ワークロードを RA3 クラスターに移行して、DS2 と同じコストで 2 倍のパフォーマンスとストレージの増加を実現できます。
クラスターのスケーリングやノードタイプの切り替えに必要なのは、API 呼び出し 1 回のみ、または AWS コンソールで数回クリックすることのみです。 詳細については料金表ページを参照してください。

簡単な管理

Amazon Redshift では一般的なメンテナンスタスクが自動化されるため、データウェアハウスではなく、データインサイトに集中できます。

自動プロビジョニング: Amazon Redshift は、簡単にセットアップして運用できます。AWS コンソールで数回クリックするだけで、新しいデータウェアハウスをデプロイできます。インフラストラクチャのデプロイは、お客様に代わって Amazon Redshift によって自動的に行われます。バックアップ、レプリケーションなど、ほとんどの管理タスクが自動化されます。その一方で、お客様が管理作業を行いたい場合のために、特定のワークロードに合わせてカスタマイズするためのオプションが用意されています。新しい機能は透過的にリリースされるため、あらかじめスケジュールを作成してアップグレードやパッチを適用する必要はありません。

自動バックアップ: Amazon Redshift 内のデータは自動的に Amazon S3 にバックアップされます。Amazon Redshift では、災害対策のために別のリージョンにある S3 にスナップショットを非同期でレプリケートできます。AWS マネジメントコンソールや Redshift API でシステムのスナップショットまたはユーザーのスナップショットを使用して、クラスターを復元できます。システムのメタデータが復元されるとすぐにクラスターを利用できるようになり、データがバックグラウンドでスプールされている間にクエリの実行を開始できます。

耐障害性: データウェアハウスクラスターの信頼性を向上させる各種機能が用意されています。例えば、Amazon Redshift では、耐障害性を実現するために、クラスターの状態は常時モニタリングされており、障害があるドライブから自動的にデータが再度レプリケートされ、必要に応じてノードの交換が行われます。

柔軟なクエリ機能: Amazon Redshift では、コンソール内でクエリを実行したり、SQL クライアントツール、ライブラリ、またはビジネスインテリジェンスツールを接続したりできる柔軟性が提供されます。AWS コンソール上の Query Editor では、Amazon Redshift クラスター上で SQL クエリを実行し、クエリに隣接するクエリ結果とクエリ実行プラン (計算ノードで実行されたクエリ用) を表示するための強力なインターフェイスが提供されます。

ネイティブの空間データ処理: Amazon Redshift では、ネイティブの空間データ処理機能をサポートしています。この機能により、お客様は空間データを保存、取得、処理できるため、空間データを分析クエリに統合することでビジネスインサイトをシームレスに強化できます。Amazon Redshift では、ポリモーフィックのデータタイプである GEOMETRY を利用できます。このデータタイプでは、Point、Linestring、Polygon などの複数の幾何学的図形をサポートしています。また、Redshift には空間 SQL 関数が用意されており、幾何学的図形の構築、空間データのインポート、エクスポート、アクセス、処理を行うことができます。GEOMETRY 列を Redshift テーブルに追加し、空間データと非空間データにまたがる SQL クエリを作成できます。データレイクをシームレスにクエリする Redshift の機能により、外部テーブルを空間クエリに統合することで、空間処理をデータレイクに簡単に拡張できます。

サードパーティー製ツールとの統合: データのロード、変換、可視化を行うための業界最先端のツールや専門技術を組み合わせることで、Amazon Redshift の機能を拡張できるさまざまなオプションが用意されています。AWS の広範なパートナーは、Amazon Redshift と組み合わせて使用できることが証明されたソリューションを提供しています。

最高の安全性とコンプライアンス

AWS には、最も厳しい要件を満たすことができる包括的なセキュリティ機能が備わっているため、Amazon Redshift では、追加料金なしですぐにデータのセキュリティを確保できます。

エンドツーエンドの暗号化: Amazon Redshift のいくつかのパラメータを設定するだけで、移動中のデータの保護には SSL、保管中のデータの保護にはハードウェアアクセラレーション対応の AES-256 暗号化が使用されるようになります。保存データの暗号化を有効化する場合、ディスクに書き込まれたすべてのデータはあらゆるバックアップと同じように暗号化されます。デフォルトでは、Amazon Redshift でキー管理を行います。

ネットワーク分離: Amazon Redshift では、データウェアハウスクラスターへのネットワークアクセスを制御するためのファイアウォールルールを設定できます。Redshift を Amazon Virtual Private Cloud (VPC) の中で実行することもでき、このようにするとデータウェアハウスクラスターはお客様専用の仮想ネットワーク内に隔離されます。このクラスターをお客様の既存の IT インフラストラクチャに接続するには、業界標準の暗号化 IPsec VPN を使用します。

監査とコンプライアンス: Amazon Redshift は AWS CloudTrail と統合されているため、Redshift の API コールをすべて監査できます。Redshift での SQL 操作 (データウェアハウスへの接続試行、クエリ、変更) はすべてログに記録されます。このログにアクセスするには、システムテーブルに対する SQL クエリを使用するか、Amazon S3 上の安全な場所にログを保存します。Amazon Redshift は、SOC1、SOC2、SOC3、および PCI DSS Level 1 の要件に準拠しています。詳細については、AWS クラウドコンプライアンスをご覧ください。

きめ細かいアクセスコントロール: 行と列レベルのきめ細かいセキュリティコントロールによって、アクセス権を与えられたデータのみユーザーに表示されるようにすることができます。Amazon Redshift は AWS Lake Formation と統合されているため、Lake Formation の列レベルのアクセスコントロールは、データレイク内のデータに対する Redshift のクエリにも適用されます。

最新情報についてはこちらをご覧ください。

詳しい製品情報については、Amazon Redshift のドキュメントをご覧ください。

Amazon Redshift 料金の詳細

料金ページを見る
構築を始めましょう。
Amazon Redshift の使用を開始する
ご不明な点がおありですか?
お問い合わせ