Amazon Redshift は、最も高速で最も広く使用されているクラウドデータウェアハウスです。Redshift はデータレイクと統合されており、他のどのデータウェアハウスよりも最大 3 倍優れたコストパフォーマンスをもたらします。

特徴と利点

AWS では毎年、お客様の導入事例やフィードバックに基づいて数百個の機能と製品の改善項目をリリースしています。 最新情報についてはこちらをご覧ください。

データレイクや AWS のサービスとの非常に緊密な統合

Amazon Redshift では、オープンフォーマットでデータをすばやく簡単に操作したり、AWS エコシステムに簡単に統合および接続したりできます。

データレイクにクエリを実行し、データレイクとの間でデータをエクスポート: オープンフォーマットでデータのクエリとデータレイクへのデータの書き込みをいずれも簡単に行えるクラウドデータウェアハウスは他にありません。Parquet、ORC、JSON、Avro、CSV などのオープンファイルフォーマットに対してクエリを実行したり、使い慣れた ANSI SQL を使用して S3 でより直接的にクエリを実行したりできます。データをデータレイクにエクスポートする場合、SQL コードで Redshift の UNLOAD コマンドを使用し、ファイル形式として Parquet を指定するだけで、Redshift によって自動的にデータのフォーマットとデータの S3 への移動が行われます。これにより、高度に構造化されたアクセス頻度の高いデータを Redshift データウェアハウスに保存しながら、最大でエクサバイト規模の構造化データ、半構造化データ、非構造化データを S3 で維持できる柔軟性が生まれます。Redshift からデータレイクにデータをエクスポートすることで、Amazon AthenaAmazon EMRAmazon SageMaker などの AWS のサービスでデータをさらに分析できます。 

横串検索: Redshift の新しい横串検索機能を使用すれば、運営に関するリレーショナルデータベースにアクセスできます。1 つ以上の Amazon RDS データベースと Aurora PostgreSQL データベース、およびプレビュー中の RDS MySQL データベースと Aurora MySQL データベースに対してライブデータのクエリを実行することで、データを移動することなく、事業運営をエンドツーエンドで即座に可視化できます。Redshift データウェアハウスからのデータ、データレイクのデータ、運営に関するストアのデータを組み合わせて、より良いデータに基づく決定を実現できます。Redshift では、高度な最適化を使用してネットワーク上を移動するデータの量を減らし、大規模並列データ処理によって強化し、パフォーマンスの高いクエリを実現します。詳細

Redshift ML (プレビュー): Redshift ML は Amazon Redshift の新機能で、データアナリストやデータベースデベロッパーが SQL を使用して Amazon SageMaker モデルを簡単に作成、トレーニング、デプロイできるようにします。Amazon Redshift ML では、お客様は SQL ステートメントを使用して Amazon Redshift のデータで Amazon SageMaker モデルを作成およびトレーニングしてから、そのモデルを使って、直接クエリやレポートでチャーン検出やリスクスコアリングなどの予測を取得することができます。開始方法については、Redshift のドキュメントをご覧ください。詳細。 

AWS の分析エコシステム: AWS の分析エコシステムとのネイティブ統合により、摩擦を生じさせることなく分析ワークフローをエンドツーエンドで簡単に処理できます。 例えば、AWS Lake Formation は、安全なデータレイクを数日で簡単にセットアップできるサービスです。AWS Glue を使用すると、Redshift にデータを抽出、変換、ロード (ETL) することができます。Amazon Kinesis Data Firehose を使用すると、最も簡単な方法で Redshift にストリーミングデータをキャプチャ、変換、ロードでき、ほぼリアルタイムで分析を行えます。Amazon EMR を使用すると、Hadoop/Spark を使用してデータを処理し、出力を Amazon Redshift にロードして BI や分析を行えます。Amazon QuickSight は、セッション単位の料金で利用できる初の BI サービスで、Redshift データに関するレポートやダッシュボードを作成することや、可視化することができます。Redshift を使用してデータを準備し、Amazon SageMaker で機械学習ワークロードを実行できます。AWS Schema Conversion ToolAWS Database Migration Service (DMS) を使用して、Amazon Redshift への移行を加速させることができます。また、Amazon Redshift は、セキュリティ、モニタリング、コンプライアンスを実現するために Amazon Key Management Service (KMS)Amazon CloudWatch と緊密に統合されています。Lambda UDF を使用して、Redshift でユーザー定義関数を呼び出す場合と同じように、SQL クエリから Lambda 関数を呼び出すこともできます。Lambda UDF を記述して、AWS パートナーサービスと統合したり、Amazon DynamoDB や Amazon SageMaker などの他の一般的な AWS のサービスを利用したりできます。

Redshift パートナーコンソールの統合 (プレビュー): Redshift コンソールの選択したパートナーソリューションと統合することで、データのオンボーディングを加速し、貴重なビジネスインサイトを数分で作成することができます。これらのソリューションを使用すれば、Salesforce、Google Analytics、Facebook Ads、Slack、Jira、Splunk、Marketo などのアプリケーションからのデータを効率的かつ合理的な方法で Amazon Redshift データウェアハウスに取り込むことができます。また、これらの異なるデータセットを結合し、一緒に分析して、実用的な洞察を生み出すこともできます。

最高のパフォーマンス

Amazon Redshift は高速で、業界をリードするパフォーマンス、柔軟性を得られます。

RA3 インスタンス: RA3 インスタンスでは、他のすべてのクラウドデータウェアハウスサービスの最大 3 倍優れたコストパフォーマンスを実現できます。これらの Amazon Redshift インスタンスでは、大量のコンピューティング性能を必要とし、パフォーマンスが重要なワークロードのスピードを最大限に高めると同時に、必要なインスタンスの数を指定することでストレージとは関係なく、コンピューティングの料金を個別に支払うという柔軟性を得られます。詳細

Amazon Redshift 用 AQUA (Advanced Query Accelerator): 他のクラウドデータウェアハウスよりも最大 10 倍優れたクエリパフォーマンスを実現するハードウェアアクセラレーションキャッシュです。AQUA は一部のリージョンで RA3 16xl および 4xl のプレビューでご利用いただけ、2021 年 3 月に一般提供を開始します。詳細

効率的なストレージと高パフォーマンスのクエリ処理: Amazon Redshift では、ギガバイトからペタバイト規模のデータセットに対して高速にクエリを実行できます。列指向ストレージ、データ圧縮、ゾーンのマッピングによって、クエリ実行に必要な I/O の量が削減されます。また、Amazon Redshift では、LZO、Zstandard などの業界標準のエンコーディングだけでなく、数値と日付/時刻型向けの専用の圧縮エンコーディング AZ64 も提供しており、それによりストレージの節約とクエリパフォーマンスの最適化を実現できます。

マテリアライズドビュー: Amazon Redshift マテリアライズドビューでは、ダッシュボード作成、ビジネスインテリジェンス (BI) ツールからのクエリ、抽出、ロード、変換 (ELT) データ処理ジョブなど、反復的または予測可能な分析ワークロードで今までよりも大幅に速いクエリパフォーマンスを達成できます。マテリアライズドビューを使用して、外部テーブルを含む 1 つ以上の表を参照する SELECT ステートメントの事前計算結果を簡単に保管および管理できます。事前に計算された結果を再利用することで、マテリアライズドビューを参照する後続クエリは、はるかに高速に実行できます。Amazon Redshift では、マテリアライズドビューを増分で効率的に維持できるため、低レイテンシーパフォーマンスの利点を利用し続けることができます。詳細。 

機械学習でスループットとパフォーマンスを最大化: Amazon Redshift の高度な機械学習機能により、変化するワークロードや同時実行ユーザーのアクティビティであっても高いスループットとパフォーマンスを実現できます。Amazon Redshift では、高度なアルゴリズムを使用して、受信したクエリの実行時間とリソース要件に基づいてクエリを予測および分類することで、パフォーマンスと同時実行を動的に管理すると同時に、ビジネスクリティカルなワークロードに優先順位を付けることができるようにします。ショートクエリアクセラレーション (SQA) では、ダッシュボードなどのアプリケーションから高速キューに短いクエリを送信し、大規模なクエリの後ろで長い間待機するのではなく、即座に処理されるようにします。自動ワークロード管理 (WLM) では、機械学習を使用してメモリと同時実行を動的に管理することで、クエリのスループットを最大限に高めます。また、数百件のクエリが送信されていても、最も重要なクエリを優先するように簡単に設定できるようになりました。Amazon Redshift はユーザーのワークロードを継続的に確認する自己学習システムでもあり、使用量の増加に応じてパフォーマンスを向上させる機会を特定したり、最適化をシームレスに適用したりします。また、Amazon Redshift のパフォーマンスをさらに高めるためにユーザーによる明示的な操作が必要な場合は、Redshift Advisor から推奨事項を提案します。 

結果のキャッシュ: Amazon Redshift では、結果をキャッシュすることで、繰り返し実行されるクエリに対して 1 秒未満の応答時間を実現しています。同じクエリを繰り返し実行するダッシュボード、可視化ツール、ビジネスインテリジェンスツールは、これによってパフォーマンスが大幅に向上します。クエリを実行すると、Amazon Redshift はキャッシュを検索し、以前の実行でキャッシュされた結果がないか確認します。キャッシュされている結果が見つかり、データが変更されていないことがわかると、クエリを再度実行せずに、キャッシュされている結果を即座に返します。

最もスケーラブル

データをスケールする場合でも、ユーザーをスケールする場合でも、Amazon Redshift は実質的に無制限です。 

ペタバイト規模のデータウェアハウジング: Amazon Redshift では、お客様のニーズの変化に合わせてすばやく簡単にスケールすることができます。コンソールで数回クリックするのみで、または API コール 1 回のみで、データウェアハウスのノード数やノードタイプを簡単に変更でき、お客様のニーズの変化に合わせて簡単にスケールアップやスケールダウンができます。マネージドストレージにより、容量が自動的に追加され、最大 8 PB の圧縮データのワークロードをサポートします。 クラスターの管理の詳細をご覧ください。

ペタバイト規模のデータレイク分析Redshift Spectrum 機能を使用して、データのロードや変換を行うことなく、Amazon S3 にあるペタバイト規模のデータに対してクエリを実行できます。可用性が高く、安全で、コスト効率が高いデータレイクとして S3 を使用し、オープンデータフォーマットで無制限にデータを保存できます。Amazon Redshift Spectrum では、クエリの複雑さやデータ量にかかわらず、並列化された何千ものノードに対してクエリを実行できるため、すばやく結果を得ることができます。 

無制限の並列処理: Amazon Redshift では、Amazon Redshift データウェアハウスのデータをクエリする場合でも、Amazon S3 データレイクを直接クエリする場合でも、数千の同時実行クエリがあったとしても一貫して高速のパフォーマンスが提供されます。Amazon Redshift の同時実行スケーリングでは、実質的に無制限の同時実行ユーザーと同時実行クエリをサポートし、同時実行数の増加に応じて数秒で一時的な容量を追加することで、安定したサービスレベルを維持します。 

データ共有: Amazon Redshift データ共有では、Redshift クラスター間でライブデータを共有することにより、安全で簡単な方法でスケーリングできるようになります。データ共有は、Redshift クラスター内のデータに、データをコピーまたは移動することなく、瞬時に、きめ細かく、高性能にアクセスできるようにすることで、組織の俊敏性を向上させます。詳細

最良の価値

Amazon Redshift をクラウドデータウェアハウスとして使用すると、コンピューティングとストレージの料金を個別に支払ったり、クラスターの一時停止および再開を行えたり、管理することでコストを予測したりできます。また、従量課金制にするのか、リザーブドインスタンスを契約して最大 75% 節約するのかを選択できます。

柔軟な料金オプション: Amazon Redshift は、最もコスト効率に優れたデータウェアハウスです。また、データウェアハウスの料金を支払う方法を最適化する方法を選択できます。コミットメントなしで 1 時間あたり 0.25 USD から開始でき、1 年間、1 テラバイトあたり 1000 USD までスケールを拡大できます。Amazon Redshift は、初期費用なしのオンデマンド料金体系を提供する唯一のクラウドデータウェアハウスです。リザーブドインスタンスの料金体系の場合、1 年契約または 3 年契約で最大 75% コストを節約できます。また、クエリ単位の料金体系の場合、Amazon S3 データレイクでスキャンされたデータ量に応じて料金が発生します。Amazon Redshift の料金には、組み込みセキュリティ、データ圧縮、バックアップストレージ、データ転送が含まれています。データサイズの増加に伴い、RA3 インスタンスでマネージドストレージを使用して、1 か月あたり 0.024 USD/GB という高いコスト効率でデータを保存できます。

予測不可能なワークロードに対しても予測可能なコスト: Amazon Redshift を使用すると、各クラスターで 1 日あたり最大 1 時間の無料同時実行スケーリングクレジットが得られるため、コストへの影響を最小限に抑えつつ拡張できます。これらの無料クレジットは、97% のお客様の同時実行性に関するニーズを十分に満たすものです。これにより、分析需要が変動している期間でも、月ごとのコストを予測することができます。 

ワークロードにとって最良の価値を得られるノードタイプを選択: 3 つのインスタンスタイプの中から選んで、お客様のデータウェアハウジングのニーズに合わせて Amazon Redshift を最適化できます。

RA3 ノードでは、コンピューティングとは別にストレージをスケールできます。RA3 を使用すると、個別のストレージ階層にデータを保存する高パフォーマンスのデータウェアハウスを実現できます。必要なクエリのパフォーマンスに合わせてデータウェアハウスのサイズを決定するだけです。

Dense Compute (DC) ノードでは、高速 CPU、大容量 RAM、SSD (Solid-State Disk) を使用してきわめて高パフォーマンスのデータウェアハウスを作成できます。これは、データが 500 GB を超える場合に最適な選択肢です。

DS2 (Dense Storage) ノードでは、3 年間のリザーブドインスタンスを購入すると、ハードディスクドライブ (HDD) を使用して大規模なデータウェアハウスを低コストで作成できます。DS2 クラスターで実行しているほとんどのお客様は、ワークロードを RA3 クラスターに移行して、DS2 と同じコストで最大 2 倍のパフォーマンスとストレージの増加を実現できます。
クラスターのスケーリングやノードタイプの切り替えに必要なのは、API 呼び出し 1 回のみ、または AWS コンソールで数回クリックすることのみです。 詳細については料金表ページを参照してください。

簡単な管理

Amazon Redshift では一般的なメンテナンスタスクが自動化されるため、データウェアハウスではなく、データインサイトに集中できます。

自動プロビジョニング: Amazon Redshift は、簡単にセットアップして運用できます。AWS コンソールで数回クリックするだけで、新しいデータウェアハウスをデプロイできます。インフラストラクチャのデプロイは、お客様に代わって Amazon Redshift によって自動的に行われます。バックアップ、レプリケーションなど、ほとんどの管理タスクが自動化されます。その一方で、お客様が管理作業を行いたい場合のために、特定のワークロードに合わせてカスタマイズするためのオプションが用意されています。新しい機能は透過的にリリースされるため、あらかじめスケジュールを作成してアップグレードやパッチを適用する必要はありません。

自動バックアップ: Amazon Redshift 内のデータは自動的に Amazon S3 にバックアップされます。Amazon Redshift では、災害対策のために別のリージョンにある S3 にスナップショットを非同期でレプリケートできます。AWS マネジメントコンソールや Redshift API でシステムのスナップショットまたはユーザーのスナップショットを使用して、クラスターを復元できます。システムのメタデータが復元されるとすぐにクラスターを利用できるようになり、データがバックグラウンドでスプールされている間にクエリの実行を開始できます。

自動テーブルデザイン: Amazon Redshift は、ユーザーのワークロードを継続的に監視し、高度なアルゴリズムを使用して、データの物理レイアウトを改善してクエリの速度を最適化する方法を見つけます。自動テーブル最適化は、最適な並べ替えキーと分散キーを選択して、クラスターのワークロードのパフォーマンスを最適化します。Amazon Redshift が、キーを適用するとクラスターのパフォーマンスが向上すると判断した場合、管理者の介入を必要とせずに、テーブルが自動的に変更されます。追加機能の自動バキューム削除、自動テーブルソート、自動分析により、Redshift クラスターを手動でメンテナンスおよび調整する必要がなくなり、新しいクラスターと本番ワークロードで最高のパフォーマンスを得ることができます。 

耐障害性: データウェアハウスクラスターの信頼性を向上させる各種機能が用意されています。例えば、Amazon Redshift では、耐障害性を実現するために、クラスターの状態は常時モニタリングされており、障害があるドライブから自動的にデータが再度レプリケートされ、必要に応じてノードの交換が行われます。クラスターは、データの損失やアプリケーションの変更なしに、代替のアベイラビリティーゾーン (AZ) に再配置することもできます。

柔軟なクエリ機能: Amazon Redshift では、コンソール内でクエリを実行したり、SQL クライアントツール、ライブラリ、またはビジネスインテリジェンスツールを接続したりできる柔軟性が提供されます。AWS コンソール上の Query Editor では、Amazon Redshift クラスター上で SQL クエリを実行し、クエリに隣接するクエリ結果とクエリ実行プラン (コンピューティングノードで実行されたクエリ用) を表示するための強力なインターフェイスが提供されます。

Amazon Redshift と対話するためのシンプルな API: Amazon Redshift を使用すると、すべてのタイプの従来のクラウドネイティブでコンテナ化されたサーバーレスウェブサービスベースのアプリケーションと駆動型アプリケーションでデータに簡単にアクセスできます。Amazon Redshift Data API は、Python、Go、Java、Node.js、PHP、Ruby、C++ などの AWS SDK でサポートされているプログラミング言語とプラットフォームからのデータアクセス、取り込み、および出力を簡素化します。Data API を使用すれば、ドライバーを構成したり、データベース接続を管理したりする必要がなくなります。それらの管理を行う代わりに、ユーザーは Data API が提供する安全な API エンドポイントを呼び出すだけで、Amazon Redshift クラスターに SQL コマンドを実行することができます。データベース接続の管理とデータのバッファリングは Data API が行います。Data API は非同期であるため、後で結果を取得できます。クエリ結果は 24 時間保存されます。

高度な分析のネイティブサポート: Redshift は、NUMBER、VARCHAR、DATETIME などの標準のスカラーデータ型をサポートし、次の高度な分析処理のためにネイティブサポートを提供します。

空間データ処理: Amazon Redshift では、ポリモーフィックのデータタイプである GEOMETRY を利用できます。このデータタイプでは、Point、Linestring、Polygon などの複数の幾何学的図形をサポートしています。また、Redshift には空間 SQL 関数が用意されており、幾何学的図形の構築、空間データのインポート、エクスポート、アクセス、処理を行うことができます。GEOMETRY 列を Redshift テーブルに追加し、空間データと非空間データにまたがる SQL クエリを作成できます。この機能により、お客様は空間データを保存、取得、処理できるため、空間データを分析クエリに統合することでビジネスインサイトをシームレスに強化できます。データレイクをシームレスにクエリする Redshift の機能により、外部テーブルを空間クエリに統合することで、空間処理をデータレイクに簡単に拡張できます。詳細については、こちらのドキュメントを参照してください。

HyperLogLog スケッチ: HyperLogLog は、データセット内にある個別の値の概数を効率的に推定する新しいアルゴリズムです。HLL スケッチは、データセット内の個別の値に関する情報をカプセル化するコンストラクトです。HLL スケッチは、大規模なデータセットの近似カーディナリティを計算するクエリに対して大幅なパフォーマンスメリットを実現するために使用することができ、平均的な相対エラーは 0.01~0.6% です。Redshift は、HyperLogLog スケッチを生成、永続化、および組み合わせるために、第一級データ型の HLLSKETCH と関連する SQL 関数を提供します。Amazon Redshift の HyperLogLog 機能はバイアス補正手法を使用し、少ないメモリフットプリントで優れた正確性を提供します。詳細については、こちらのドキュメントを参照してください。

DATE と TIME データ型: Amazon Redshift は、データ/時刻データをネイティブに保存および処理するために、複数のデータ型 DATE、TIME、TIMETZ、TIMESTAMP、および TIMESTAMPTZ を提供しています。TIME および TIMESTAMP タイプは、タイムゾーン情報なしで時刻データを格納しますが、TIMETZ および TIMESTAMPTZ タイプは、タイムゾーン情報を含む時刻データを格納します。さまざまな日付/時刻の SQL 関数を使用して、Redshift クエリの日付と時刻の値を処理することができます。詳細については、こちらのドキュメントを参照してください。

半構造化データ処理: Amazon Redshift SUPER データ型 (プレビュー) は、半構造化データを Redshift テーブルにネイティブに保存し、PartiQL クエリ言語を使用して半構造化データをシームレスに処理します。SUPER データ型は本質的にスキーマレスで、Redshift スカラー値、ネストされた配列、およびネストされた構造体を含む可能性のあるネストされた値の保存を可能にします。PartiQL は SQL の拡張機能で、オブジェクトと配列のナビゲーション、配列のネスト解除、動的型付け、スキーマレスセマンティクスなどの強力なクエリ機能を提供します。これにより、従来の構造化 SQL データと半構造化 SUPER データを組み合わせて、優れたパフォーマンス、柔軟性、および使いやすさを備えた高度な分析を実現できます。詳細については、こちらのドキュメントを参照してください。

サードパーティー製ツールとの統合: データのロード、変換、可視化を行うための業界最先端のツールや専門技術を組み合わせることで、Amazon Redshift の機能を拡張できるさまざまなオプションが用意されています。AWS の広範なパートナーは、Amazon Redshift と組み合わせて使用できることが証明されたソリューションを提供しています。

最高の安全性とコンプライアンス

AWS には、最も厳しい要件を満たすことができる包括的なセキュリティ機能が備わっているため、Amazon Redshift では、追加料金なしですぐにデータのセキュリティを確保できます。

エンドツーエンドの暗号化: Amazon Redshift のいくつかのパラメータを設定するだけで、移動中のデータの保護には SSL、保管中のデータの保護にはハードウェアアクセラレーション対応の AES-256 暗号化が使用されるようになります。保存データの暗号化を有効化する場合、ディスクに書き込まれたすべてのデータはあらゆるバックアップと同じように暗号化されます。デフォルトでは、Amazon Redshift でキー管理を行います。

ネットワーク分離: Amazon Redshift では、データウェアハウスクラスターへのネットワークアクセスを制御するためのファイアウォールルールを設定できます。Redshift を Amazon Virtual Private Cloud (VPC) の中で実行することもでき、このようにするとデータウェアハウスクラスターはお客様専用の仮想ネットワーク内に隔離されます。このクラスターをお客様の既存の IT インフラストラクチャに接続するには、業界標準の暗号化 IPsec VPN を使用します。

監査とコンプライアンス: Amazon Redshift は AWS CloudTrail と統合されているため、Redshift の API コールをすべて監査できます。Redshift での SQL 操作 (データウェアハウスへの接続試行、クエリ、変更) はすべてログに記録されます。このログにアクセスするには、システムテーブルに対する SQL クエリを使用するか、Amazon S3 上の安全な場所にログを保存します。Amazon Redshift は、SOC1、SOC2、SOC3、および PCI DSS Level 1 の要件に準拠しています。詳細については、AWS クラウドコンプライアンスをご覧ください。

トークン化: Amazon Lambda ユーザー定義関数 (UDF) を使用すると、AWS Lambda 関数を Amazon Redshift の UDF として使用し、Redshift SQL クエリから呼び出すことができます。この機能を使用すると、SQL クエリのカスタム拡張機能を記述して、他のサービスやサードパーティ製品との密接な統合を実現できます。Lambda UDF を記述して、Protegrity などのベンダーと統合することにより、外部トークン化、データマスキング、データの識別または匿名化を有効にし、さらにクエリ時にユーザーの権限とグループに基づいて機密データを保護または保護解除できます。 

きめ細かいアクセスコントロール: 行と列レベルのきめ細かいセキュリティコントロールによって、アクセス権を与えられたデータのみユーザーに表示されるようにすることができます。Amazon Redshift は AWS Lake Formation と統合されているため、Lake Formation の列レベルのアクセスコントロールは、データレイク内のデータに対する Redshift のクエリにも適用されます。

最新情報についてはこちらをご覧ください。

詳しい製品情報については、Amazon Redshift のドキュメントをご覧ください。

Amazon Redshift 料金の詳細

料金ページを見る
構築を始めましょう。
Amazon Redshift の使用を開始する
ご不明な点がおありですか?
お問い合わせ