AWS クラウド
AWS クラウド
無料トライアルを開始

Amazon Redshift は高速で完全マネージド型のデータウェアハウスです。標準 SQL および既存のビジネスインテリジェンス (BI) ツールを使用して、すべてのデータをシンプルかつコスト効率よく分析できます。洗練されたクエリ最適化、列指向ストレージ、高パフォーマンスのローカルディスク、および超並列クエリ実行を使用して、ペタバイト単位の構造化データに対して複雑な分析クエリを実行できます。 ほとんどの結果は数秒で返されます。 Amazon Redshift を使用して、1 時間あたりわずか 0.25 USD で、コミットメントなしの小規模から始めて、年間 1 テラバイトあたり 1,000 USD の費用でペタバイト規模にスケールアウトできます。コストは従来のソリューションの 1/10 未満です。

Amazon Redshift には、Amazon S3 のエクサバイト単位の非構造化データに対して SQL クエリを直接実行できる Redshift Spectrum も含まれています。ロードや変換は不要で、Avro、CSV、Grok、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile、TSV などのオープンデータフォーマットを使用できます。Redshift Spectrum は、取得中のデータに基づいて自動的にクエリのコンピューティング性能をスケーリングし、Amazon S3 に対するクエリがデータセットのサイズに関係なく高速で実行されるようにします。Redshift Spectrum の詳細についてはこちらをご確認ください »

専門家に質問して詳細を確認するには、こちらの Tech Talk にご参加ください: Amazon Redshift Spectrum、AWS Glue、Amazon QuickSight を使用したサーバーレス分析今すぐ登録>>

高速、安定したパフォーマンス

高速

Amazon Redshift は、I/O 効率を向上させる列指向ストレージテクノロジーの使用、および複数ノード間のクエリの並列化により、高速のクエリパフォーマンスを実現します。 データロードの速度はクラスターのサイズによって直線的にスケールされます。その際、Amazon S3、Amazon DynamoDB、Amazon EMR、Amazon Kinesis、および SSH 対応のホストに統合されます。

高いスケーラビリティ

安価

使用料金は従量課金制です。 ユーザー数も分析の実行回数にも制限はありません。年間 1 テラバイトあたりわずか 1,000 USD。ウェアハウスソリューションのコストを従来の 1/10 に抑えることができます。 ほとんどのお客様の場合、データサイズは圧縮後に 3~4 倍削減され、非圧縮の 1 テラバイトあたり年間 250~333 USD のコスト削減が実現しています。

高速、安定したパフォーマンス

拡張可能

Redshift Spectrum により、現在お使いのものと同じ SQL 構文および BI ツールを使用して、Amazon Redshift のローカルディスクに保存されているペタバイト単位のデータに対するクエリの実行と同様に簡単に、Amazon S3 のエクサバイト単位のデータに対してクエリを実行できます。高度に構造化された、頻繁にアクセスされるデータを Redshift のローカルディスクに保存し、膨大な量の非構造化データを Amazon S3 の "データレイク" に保持して、これらの間でシームレスにクエリを行うことができます。

柔軟性

シンプル

Amazon Redshift なら、データウェアハウスの管理、モニタリング、スケーリングなど、一般的な管理作業の大半を簡単に自動化できます。こうした多大な時間と労力を要する作業を自動化することで、お客様はデータの解析とビジネスに専念できます。

高いスケーラビリティ

スケーラブル

パフォーマンスや容量のニーズの変化に合わせて、コンソールで数回クリックするか簡単な API コールを行うだけで、クラスターのサイズを簡単に変更できます。

柔軟性

安全

セキュリティは初めから組み込まれています。保管中や移動中のデータを、ハードウェアアクセラレーション対応の AES-256 および SSL を使用して暗号化できます。Amazon VPC を使用してクラスターを隔離することや、キーの管理に AWS Key Management Service (KMS) およびハードウェアセキュリティモジュール (HSM) を使用することもできます。

イベントドリブンプログラミング

互換性

Amazon Redshift は標準 SQL に対応し、コンソールからダウンロード可能なカスタムの JDBC ドライバや ODBC ドライバが用意されているので、幅広い使い慣れた SQL クライアントを使用できます。また、標準的な PostgreSQL JDBC や ODBC ドライバを使用することも可能です。

データウェアハウスへの最適化

Amazon Redshift は 100 ギガバイトから 1 エクサバイト超のデータセットで高いクエリ性能を実現するため、さまざまな革新的技術を駆使しています。 ペタバイト規模のローカルデータの場合、列指向ストレージ、データ圧縮、ゾーンのマッピング使用されているため、クエリ実行に必要な I/O の量が削減されます。 Amazon Redshift には超並列処理 (MPP) アーキテクチャーが採用されており、SQL 操作の並列化と分散化によって、すべてのリソースがフルに活用されます。 ハードウェアはデータ処理のパフォーマンスを高める設計となっており、ローカル接続ストレージを使用して CPU とドライブの間のスループットを最大化するとともに、10 ギガビットイーサメッシュネットワークを使用してノード間のスループットを最大化します。 Amazon S3 のエクサバイト規模のデータの場合、Amazon Redshift はスキャンされるデータの量を最小化するのに最適なクエリ計画を生成し、自動的にスケーリングする Redshift Spectrum インスタンスのプールにクエリの実行を委任して、データサイズに関係なくクエリが高速で実行されるようにします。

ペタバイト規模

コンソールで数回クリックするか、シンプルな API コールを行うだけで、データウェアハウスのノードの数や種類を簡単に変更して、1 ペタバイト以上の圧縮ユーザーデータに対応するようスケールアップできます。Dense Storage(DS)ノードでは、ハードディスクドライブ(HDD)が使用されており、きわめて大規模なデータウェアハウスを低コストで作成できます。Dense Compute(DC)ノードでは、きわめて高パフォーマンスのデータウェアハウスを作成できるように、高速 CPU、大容量 RAM、および SSD(Solid-State Disk)が使用されます。Amazon Redshift では、サイズを変更する際も、新しいクラスターが完全にプロビジョニングされて使用できるようになるまで、読み取り専用モードでデータウェアハウスに対しクエリを実行し続けることができます。

Amazon S3 "データレイク" に対するクエリの実行

Redshift Spectrum により、ローディングや ETL を必要とせずに、Amazon S3 のエクサバイト単位の非構造化データに対してクエリを実行できます。 クエリを発行すると、クエリはクエリ計画を生成および最適化する Amazon Redshift SQL エンドポイントに移動します。 Amazon Redshift はどのデータがローカルでどのデータが Amazon S3 にあるかを特定し、読み込む必要がある Amazon S3 データの量を最小化する計画を生成して、リソースプールから Amazon Redshift Spectrum の作業者に Amazon S3 からデータの読み込みと処理を要求し、その他の処理については Amazon Redshift クラスターに結果を戻します。

前払い料金なし

プロビジョニングしたリソース分に対してのみお支払いいただきます。前払いや長期契約がないオンデマンド料金や、通常料金よりお得なリザーブドインスタンス料金を選択できます。オンデマンドの最低料金は、0.25 USD/時間(160 GB DC1.Large ノード 1 つあたり)または 0.85 USD/時間(2 TB DS1.XLarge ノード 1 つあたり)です。一部前払いリザーブドインスタンスを利用すると、実質的な料金は DC1.Large ノード 1 つあたり 0.10 USD/時間(5,500 USD/TB/年)、DS2.XLarge ノード 1 つあたり 0.228 USD/時間(999 USD/TB/年)まで下がります。Redshift Spectrum のクエリの価格は、S3 からスキャンされた 1TB あたり 5 USD です。 詳細については、Amazon Redshift 料金ページをご覧ください。

耐障害性

Amazon Redshift はデータウェアハウスクラスターの信頼性を向上させる各種機能をいくつか備えています。ノードに書き込まれたデータはすべてクラスター内の別ノードへ自動的に複製され、全データは常時 Amazon S3 にバックアップされます。クラスターの状態は常時モニタリングされており、障害があるドライブから自動的にデータを再度複製し、必要に応じてノードの交換が行われます。

自動バックアップ

Amazon Redshift により、新しいデータは Amazon S3 に自動的かつ継続的にバックアップされます。スナップショットはユーザーの指定に基づき 1~35 日間保存されます。いつでもユーザー独自のスナップショットを取ることもできます。このスナップショットはユーザーが明示的に削除するまで保存されます。また、災害対策用に、スナップショットを別リージョンの S3 に非同期でレプリケートすることもできます。クラスターを削除すると、システムのスナップショットは削除されますが、ユーザーのスナップショットはユーザーが明示的に削除するまで利用できます。

短時間での復元

システムのスナップショットまたはユーザーのスナップショットを使用し、AWS マネジメントコンソールまたは Amazon Redshift API からクラスターを復元できます。システムのメタデータが復元されるとすぐにクラスターを利用できるようになり、データがバックグラウンドでスプールされている間にクエリの実行を開始できます。

暗号化

Amazon Redshift のいくつかのパラメータを設定するだけで、移動中のデータの保護には SSL、保管中のデータの保護にはハードウェアアクセラレーション対応の AES-256 暗号化が使用されるようになります。保管中のデータの暗号化を有効にする場合は、ディスクに書き込まれるすべてのデータに加えて、バックアップも暗号化されます。デフォルトでは、キーの管理は Amazon Redshift によって行われますが、お客様が所有するハードウェアセキュリティモジュール (HSM)、AWS CloudHSM、または AWS Key Management Service を使用してキーを管理することもできます。

ネットワークの隔離

Amazon Redshift はユーザーが設定するファイアウォールのルールを使用して、データウェアハウスクラスターへのネットワークアクセスを制御します。Amazon Redshift を Amazon VPC の中で実行することもでき、このようにするとデータウェアハウスクラスターはお客様専用の仮想ネットワーク内に隔離されます。このクラスターをお客様の既存の IT インフラストラクチャに接続するには、業界標準の暗号化 IPsec VPN を使用します。

監査とコンプライアンス

Amazon Redshift は AWS CloudTrail と統合されているため、Redshift の API 呼び出しをすべて監査できるようになります。また、Amazon Redshift での SQL 操作(たとえば、データベースに対する接続試行、クエリ、変更)はすべてログに記録されます。このログにアクセスするには、システムテーブルに対する SQL クエリを使用するか、Amazon S3 上の安全な場所にログをダウンロードします。Amazon Redshift は、SOC1、SOC2、SOC3、および PCI DSS Level 1 の要件に準拠しています。詳細については、AWS クラウドコンプライアンスをご覧ください。

Amazon Redshift のさまざまな業界や企業規模にわたるお客様の導入事例については、customer success ページをご覧ください。

440x220_APN-Blog

Amazon Redshift Spectrum を使用すると、データウェアハウスのローカルディスクに保存されたデータから、Amazon S3 の「データレイク」内にある膨大な量のデータのクエリまで、データのロードや変換なしで、Amazon Redshift の分析能力を拡張できます。このブログ記事では、Amazon Redshift Spectrum の 10 の重要なベストプラクティスが、いくつかの異なる機能ごとに分類してまとめられています。

記事全文を読む »

Amazon Redshift Spectrum を使用すると、Amazon Redshift ユーザーは、Amazon S3 に保存されているデータを簡単にクエリできます。Redshift Spectrum では、ソースデータをネイティブフォーマット (Avro、CSV、Grok、ORC、Parquet、RCFile、RegexSerDe、SequenceFile、TextFile、TSV など) のままで直接操作できます。データのロードや変換は必要ではありません。

記事全文を読む »

Amazon Redshift の技術と柔軟性を活用しながらデータをそのままの状態で処理するために、Amazon Redshift Spectrum が投入されました。Spectrum を使用して、データをロードしたり他のデータを準備したりすることなく、Amazon Simple Storage Service (S3) に保存されているデータに複雑なクエリを実行できます。

記事全文を読む »

列指向圧縮は Amazon Redshift の重要なテクノロジーです。 列指向圧縮は、ノードのストレージ容量の増加による顧客のコスト削減、および SQL リクエストの処理に必要な I/O の削減によるパフォーマンス向上に役立ちます。 I/O 効率の向上は、データウェアハウスにとって非常に重要です。 昨年は、I/O の拡張によってクエリのスループットが 2 倍になりました。 最近 Amazon Redshift に追加された新しい圧縮の改善について説明しましょう。

記事全文を読む »

Amazon Redshift に関連するブログ記事すべてのリストについては、blog posts ページをご覧ください。

Amazon Redshift を無料でお試しください。 DC1.Large を 1 か月あたり 750 時間、2 か月間無料でご利用いただけます。AWS アカウントを作成して Amazon Redshift コンソールにサインインすれば、無料トライアルを始めることができます。Amazon Redshift クラスターを起動し、ノードタイプに合わせて DC1.Large を選択してください。概念実証や評価のサポートをリクエストするには、ここをクリックしてください。

 

今すぐ始める