プロジェクトを開始する

7 ステップ  |  60 分

Q: データウェアハウスとは何ですか?

データ分析はあらゆる場面で必要になっています。仕事の管理やステークホルダーへの進捗状況報告にはレポートやダッシュボードが不可欠ですし、意思決定のためにはアドホック分析を実行します。このようなレポート、ダッシュボード、BI ツールは、いずれもデータウェアハウスによって支えられています。データウェアハウスには I/O を最小化するよう効率よくデータが保存され、何百人、何千人というユーザーにクエリの結果を高速で同時に提供できます。トランザクションデータベースとは異なり、データウェアハウスのアーキテクチャとストレージはクエリとデータロードパフォーマンスの高速化に特化しています。データソースを随時追加して強力な分析と情報を得るために、データウェアハウスは高度にスケーラブルであることも必要です。最後に、お客様の既存のスキルを活用できるよう、データウェアハウスはサードパーティー製ビジネスインテリジェンスツールや SQL クライアントとシームレスに統合でき、標準 SQL に対応している必要があります。

Q: データウェアハウスを AWS で運用するメリットは何ですか?

AWS のデータウェアハウスソリューションである Amazon Redshift は高速で使いやすい、フルマネージドサービスです。インフラストラクチャのプロビジョンと、バックアップ、レプリケーション、パッチ適用といった管理タスクは自動化されています。サードパーティー製 BI ツールや ETL ツールともシームレスに統合されているため、わずか数分で最初のレポートを作成できます。また、ロードや分析できるデータの量には制限がありません。データが増加しても、高額なシステムアップグレードやパフォーマンスの低下に悩まされる必要がありません。Amazon Redshift では列指向ストレージといくつかの最適化技術によって、どのスケールにおいても高速性が保たれています。また、Amazon Redshift は従量制料金であり、コスト効率にも優れています。結論として、ユーザー数と分析回数に上限のないデータ分析を、テラバイトあたり年間 1,000 USD で実施できます。 

Q: Amazon Redshift とは何ですか?

Amazon Redshift は高速で完全マネージド型、ペタバイト規模のデータウェアハウスです。お客様は、シンプルかつ費用対効果の高い方法で、すべてのデータを既存のビジネスインテリジェンスツールで分析できます。1 時間あたりわずか 0.25 USD で、コミットメントなしの小規模から始めて、年間 1 テラバイトあたり 1,000 USD にスケールできます。費用は従来のソリューションの 10 分の 1 です。通常、3 倍の圧縮によって、非圧縮のテラバイトあたり年間 333 USD までコストを削減できます。

Q: 従来のデータウェアハウスや分析型のデータベースと比較し、Amazon Redshift ではどの程度のパフォーマンスが実現しますか?

Amazon Redshift はさまざまな革新的技術を駆使し、データウェアハウスや分析の処理において、従来のデータベースよりも最大で 10 倍のパフォーマンスを達成します。

  • 列指向データストレージ: Amazon Redshift はデータを一続きの行で保存せずに、データを列で整理します。行ベースのシステムはトランザクション処理には向いていますが、大型のデータセットに対する集計クエリが頻繁に実行されるデータウェアハウスや分析には、列ベースのシステムが最適です。クエリに含まれた列だけが処理され、列指向データはシーケンス方式でストレージメディアに格納されるため、列ベースのシステムに必要な I/O は非常に少なくなり、クエリのパフォーマンスが劇的に改善されます。
  • 高度な圧縮: 列指向のデータストアは類似データがシーケンス方式でディスクに格納されるため、行ベースのデータストアに比べてはるかに圧縮率が高くなります。Amazon Redshift には複数の圧縮技術が採用されており、多くの場合、従来のリレーショナルデータストアに比べて非常に効果的な圧縮が実現できます。さらに、Amazon Redshift ではインデックスやマテリアライズドビューが必要ないことから、使用するスペースは従来のリレーショナルデータベースシステムに比べて小さくなります。データを空のテーブルにロードすると、Amazon Redshift によりデータが自動的にサンプリングされ、最も適切な圧縮方式が選択されます。
  • 超並列処理 (MPP): Amazon Redshift では、データとクエリの負荷がすべてのノードに自動的に分散されます。データウェアハウスにノードを簡単に追加でき、データウェアハウスの増大に合わせてクエリの高速なパフォーマンスを維持できます。

Q: 実行中のデータウェアハウスクラスターにはどのようにアクセスすればよいですか?

データウェアハウスクラスターが利用可能になると、そのエンドポイントと JDBC および ODBC 接続文字列を、AWS マネジメントコンソールまたは Redshift API を使用して取得することができます。お好みのデータベースツール、プログラミング言語、ビジネスインテリジェンス(BI)ツールでこの接続文字列を使用できます。実行中のデータウェアハウスクラスターに対するネットワークリクエストの承認が必要になります。詳細な説明については、入門ガイドを参照してください。

Q: Amazon Redshift にはよく利用されるビジネスインテリジェンスソフトウェアパッケージや ETL ツールと互換性がありますか?

Amazon Redshift では業界標準の SQL が使用されており、標準の JDBC や ODBC ドライバを使用してアクセスされます。コンソールの [Connect Client] タブからは、Amazon Redshift のカスタムの JDBC および ODBC ドライバをダウンロードできます。一般的な BI および ETL ベンダーと統合できることが確認できており、該当するベンダーの多くは、データのロードと分析を開始できるように、無料トライアルを提供しています。また、AWS Marketplace でも、Amazon Redshift と連携するように設計されたソリューションを数分でデプロイおよび設定できます。

Q: Amazon Redshift の使用を開始するにはどのようにすればよいですか?

Amazon Redshift は無料で試用できます。Amazon Redshift クラスターを一度も作成したことがない場合は、2 か月間にわたって DC1.Large ノードの無料トライアルを利用できます。1 か月あたり 750 時間無料で使用できます。これは、160 GB の圧縮 SSD ストレージのある 1 つの DC1.Large ノードを連続して実行するのに十分な時間です。また、複数ノードのあるクラスターを構築して大規模データセットのテストも行えますが、これを行うと、無料時間の消費が早くなります。2 か月間の無料トライアル期間が終了したとき、または 1 か月以内に 750 時間を超えたとき、クラスターをシャットダウンすれば料金は請求されません。または、標準のオンデマンド料金で実行を継続することもできます。

プロジェクトを開始する