Amazon Redshift は高速で完全マネージド型、ペタバイト規模のデータウェアハウスです。お客様は、シンプルかつ費用対効果の高い方法で、すべてのデータを既存のビジネスインテリジェンスツールで分析できます。1 時間あたりわずか 0.25 USD で、コミットメントなしの小規模から始めて、年間 1 テラバイトあたり 1,000 USD にスケールできます。費用は従来のソリューションの 10 分の 1 です。通常、3 倍の圧縮によって、非圧縮のテラバイトあたり年間 333 USD までコストを削減できます。


Amazon Redshift を無料でお試しください

まずは無料で始める »
またはコンソールにサインイン

DC1.Large を 1 か月あたり 750 時間、2 か月間無料でご利用いただけます。トライアルを開始する方法は次のとおりです。

AWS アカウントを作成し、Amazon Redshift コンソールにサインインします

Amazon Redshift クラスターを起動し、ノードタイプに合わせて DC1.Large を選択します

パートナー無料トライアルを使用して、無料でデータをレポートし、取り込みます。

日本担当チームへお問い合わせ »

User Defined Functions for Amazon Redshift | 2015 年 9 月 11 日 | AWS

Understanding Interleaved Sorting – Part 2 | 2015 年 8 月 27 日 | Chartio



Amazon Redshift では、クエリパフォーマンスを高速化するために列指向ストレージ技術が採用されており、複数のノードにまたがるクエリの I/O 効率と並列度が向上しています。Amazon Redshift にはカスタムの JDBC および ODBC ドライバが用意されているため、既存のさまざまな SQL クライアントをそのまま使用できます。これらのドライバは、コンソールの [Connect Client] タブからダウンロードできます。また、標準的な PostgreSQL JDBC および ODBC ドライバを使用することも可能です。データロードの速度はクラスターのサイズに応じて拡大し、Amazon S3Amazon DynamoDBAmazon Elastic MapReduceAmazon Kinesis や、任意の SSH 対応ホストとの統合が可能です。

Amazon Redshift のデータウェアハウスのアーキテクチャにより、クラウドデータウェアハウスのプロビジョニング、コンフィギュレーション、モニタリングに関わる共通の管理タスクの多くを自動化することが可能です。Amazon S3 へのバックアップは継続的であり、増分だけが自動的にバックアップされます。復元も高速で、数分後にはクエリを開始できるようになり、これと並行してデータを戻す処理がバックグラウンドで実行されます。複数リージョンにまたがる災害復旧を可能にする設定も、数クリックで完了です。

セキュリティは初めから組み込まれています。保管中や移動中のデータを、ハードウェアアクセラレーション対応の AES-256 および SSL を使用して暗号化できます。Amazon VPC を使用してクラスターを隔離することや、キーの管理に AWS Key Management Service (KMS) およびハードウェアセキュリティモジュール(HSM)を使用することもできます。クラスターに対する API 呼び出し、接続試行、クエリ、変更はすべてログに記録され、監査可能です。AWS CloudTrail を使用して Redshift の API 呼び出しを監査できます。

Amazon Redshift にはさまざまな革新的技術が使用されており、データセットのサイズが 100 ギガバイト程度か 1 ペタバイトを超えるかにかかわらず、きわめて高いクエリパフォーマンスを実現しています。列指向ストレージ、データ圧縮、ゾーンのマッピングが使用されているため、クエリ実行に必要な I/O の量が削減されます。Amazon Redshift には超並列処理(MPP)アーキテクチャーが採用されており、SQL 操作の並列化と分散化によって、すべてのリソースがフルに活用されます。ハードウェアはデータ処理のパフォーマンスを高める設計となっており、ローカル接続ストレージを使用して CPU とドライブの間のスループットを最大化するとともに、10 ギガビットイーサメッシュネットワークを使用してノード間のスループットを最大化します。

パフォーマンスや容量のニーズが変化したときも、AWS マネジメントコンソールで数回クリックするか単純な API 呼び出しを 1 回実行するだけで、データウェアハウスのノードの数やタイプを簡単に変更できます。Dense Storage(DS)ノードでは、ハードディスクドライブ(HDD)が使用されており、きわめて大規模なデータウェアハウスを低コストで作成できます。Dense Compute(DC)ノードでは、きわめて高パフォーマンスのデータウェアハウスを作成できるように、高速 CPU、大容量 RAM、および SSD(Solid-State Disk)が使用されます。Amazon Redshift ならば、最初は 160 GB の DC1.Large ノード 1 つだけを使用して、ここから圧縮済みユーザーデータが 1 ペタバイトを超える規模まで 16 TB DS2.8XLarge ノードを使用して拡張することも可能です。サイズ変更中は、既存クラスターが読み込み専用モードになり、選択されたサイズの新しいクラスターがプロビジョニングされ、その後で旧クラスターから新規クラスターへのデータのコピーが並列で行われます。新規クラスターのプロビジョニング中も、旧クラスターでクエリを実行させておけます。データが新規クラスターにコピーされると、クエリはその新規クラスターに自動的にリダイレクトされ、旧クラスターが削除されます。

プロビジョニングしたリソース分に対してのみお支払いいただきます。前払いや長期契約がないオンデマンド料金や、通常料金よりお得なリザーブドインスタンス料金を選択できます。オンデマンドの最低料金は、0.25 USD/時間(160 GB DC1.Large ノード 1 つあたり)または 0.85 USD/時間(2 TB DS1.XLarge ノード 1 つあたり)です。一部前払いリザーブドインスタンスを利用すると、実質的な料金は DC1.Large ノード 1 つあたり 0.10 USD/時間(5,500 USD/TB/年)、DS2.XLarge ノード 1 つあたり 0.228 USD/時間(999 USD/TB/年)まで下がります。詳細については、Amazon Redshift の料金表ページを参照してください。

AWS マネジメントコンソールを数回クリックするか、単に API を呼び出すことで、サイズ、基底ノードタイプ、セキュリティプロファイルを指定してクラスターを作成できます。Amazon Redshift がノードのプロビジョニング、ノード間の接続設定、クラスターの保護を行います。データウェアハウスが起動し、直ちに実行中になります。

Amazon Redshift は、クラスターの状態のモニタリングやバックアップの取得、パッチの適用、アップグレードにいたるまで、データウェアハウスの管理、モニタリング、スケーリングに必要なすべての作業を制御します。パフォーマンスや容量に対するニーズの変化に合わせ、クラスターのサイズを簡単に変更できます。こうした多大な時間と労力を要する作業を自動化することで、お客様はデータの解析とビジネスに専念できます。

Amazon Redshift はデータウェアハウスクラスターの信頼性を向上させる各種機能をいくつか備えています。ノードに書き込まれたデータはすべて、同じクラスター内の別ノードに自動的に複製され、すべてのデータが継続的に Amazon S3 にバックアップされます。クラスターの状態は常時モニタリングされており、障害があるドライブから自動的にデータを再度複製し、必要に応じてノードの交換が行われます。

Amazon Redshift の自動スナップショット機能は、クラスター上の新規データを Amazon S3 に常時バックアップします。スナップショットは継続的で、増分のみが含まれ、自動的に作成されます。スナップショットの保持期間は、ユーザーが 1 日から 35 日の間で指定します。お客様が独自のスナップショットを取ることも、いつでも可能です。このスナップショットでは、既存のシステムスナップショットすべてが活用され、お客様が明示的に削除するまでスナップショットを保持できます。また、災害復旧用に、スナップショットを別リージョンの S3 に非同期で複製することもできます。クラスターを削除すると、システムのスナップショットは削除されますが、ユーザーのスナップショットは明示的に削除されるまで利用できます。

システムのスナップショットまたはユーザーのスナップショットを使用し、AWS マネジメントコンソールまたは Amazon Redshift API からクラスターを復元できます。システムのメタデータが復元されるとすぐにクラスターを利用できるようになり、データがバックグラウンドでスプールされている間にクエリの実行を開始できます。

Amazon Redshift のいくつかのパラメータを設定するだけで、移動中のデータの保護には SSL、保管中のデータの保護にはハードウェアアクセラレーション対応の AES-256 暗号化が使用されるようになります。保管中のデータの暗号化を有効にする場合は、ディスクに書き込まれるすべてのデータに加えて、バックアップも暗号化されます。デフォルトでは、キーの管理は Amazon Redshift によって行われますが、お客様が所有するハードウェアセキュリティモジュール(HSM)、AWS CloudHSM、または AWS Key Management Service を使用してキーを管理することもできます。

Amazon Redshift はユーザーが設定するファイアウォールのルールを使用して、データウェアハウスクラスターへのネットワークアクセスを制御します。Amazon Redshift を Amazon Virtual Private Cloud (Amazon VPC) の中で実行することもでき、このようにするとデータウェアハウスクラスターはお客様専用の仮想ネットワーク内に隔離されます。このクラスターをお客様の既存の IT インフラストラクチャに接続するには、業界標準の暗号化 IPsec VPN を使用します。

Amazon Redshift は AWS CloudTrail と統合されているため、Redshift の API 呼び出しをすべて監査できるようになります。また、Amazon Redshift での SQL 操作(たとえば、データベースに対する接続試行、クエリ、変更)はすべてログに記録されます。このログにアクセスするには、システムテーブルに対する SQL クエリを使用するか、Amazon S3 上の安全な場所にログをダウンロードします。Amazon Redshift は、SOC1、SOC2、SOC3、および PCI DSS Level 1 の要件に準拠しています。詳細については、AWS コンプライアンスのページをご覧ください。

Amazon Redshift は SQL データウェアハウスソリューションであり、業界標準の ODBC と JDBC 接続を使用します。コンソールの [Connect Client] タブからは、カスタムの JDBC および ODBC ドライバをダウンロードできます。多くのソフトウェアベンダーから、各社の製品と Amazon Redshift の組み合わせが認定されているため、現在お使いのツールを引き続きご使用いただけます。詳細については、Amazon Redshift パートナーページをご覧ください。

Amazon Redshift は AWS の他のサービスと統合されており、内蔵のコマンドを使用して Amazon S3Amazon DynamoDB、または EC2 上やオンプレミスのサーバー(SSH を使用)からのデータを各ノードへ並列でロードできます。AWS Data PipelineAmazon Kinesis、および AWS Lambda は、データターゲットとして Amazon Redshift と統合されます。また、Amazon Redshift へのストリーミングデータのロードには、Amazon Kinesis Firehose を使用することもできます。