プロジェクトを開始する

5 ステップ  |  60 分

Analyze_Big_Data_HERO-ART_SM

Amazon EMR は、高速かつ簡単に、費用対効果に優れた方法で Apache Hadoop と Spark を実行して、大量のデータを処理できるマネージド型サービスです。また、Amazon EMR では、Presto、Hive、Pig、HBase などの強力で実績のある Hadoop ツールをサポートしています。このプロジェクトでは、完全に動作する Hadoop クラスターをデプロイして、わずか数分でログデータを分析できます。まず Amazon EMR クラスターを起動してから、HiveQL スクリプトを使用して Amazon S3 バケットに保存されているサンプルログデータを処理します。HiveQL は SQL のようなスクリプト言語で、データウェアハウスや分析に使用します。類似の設定を使用して、ユーザー独自のログファイルを分析できます。

aws-project_analyze-big-data_diagram
プロジェクトを開始する

以下のような内容を実行します。

Amazon EMR を使用して完全に動作する Hadoop クラスターを起動する

Amazon S3 に保存されているサンプルログデータ用にスキーマを定義し、テーブルを作成する

HiveQL スクリプトを使用してデータを分析し、結果を書き込み Amazon S3 に戻す。

コンピュータに結果をダウンロードし、確認する

開始する前に以下の準備が必要です。

AWS アカウント: ウェブサイトをホスティングするリソースのプロビジョニングを開始するには、AWS アカウントが必要です。AWS にサインアップする

IT の経験: このプロジェクトを完了するために、Hadoop の使用経験があることが推奨されますが、必須ではありません。

AWS の使用経験: このプロジェクトを完了するために、Amazon S3 および Amazon EC2 キーペアの基本的な知識をお持ちであることが推奨されますが、必須ではありません。

請求額の見積もり:

プロジェクトの完了に必要な費用: このプロジェクトを完了するために必要になると予想される費用は 1.05 USD です。この費用は、お客様が AWS 無料利用枠を利用でき、推奨される構成にそって作業し、プロジェクト完了後 1 時間以内にリソースすべてを終了させることを前提に算出しています。ユースケースには、請求に影響する別の設定が必要になる可能性があります。簡易見積りツールを使用すると、お客様のニーズに合わせて費用を見積もることができます。

月請求額の見積もり: このプロジェクトに必要な合計費用は、使用状況と構成によって異なります。このガイドで推奨されるデフォルトの構成を使用した場合、このプロジェクトの一般的な費用は 769 USD/月になります。AWS の料金は、個々のサービスそれぞれの使用量に基づいて決まります。各サービスの使用量の総計によって毎月の請求額が決まります。各サービスの内容と請求に与える影響については、下にある各タブをご覧ください。使用するサービスとそのコストの詳細な分析については、使用するサービスとコストを参照してください。


AWS のビッグデータソリューションの詳細について参照し、オンラインセミナーにご登録ください。

Amazon EMR の特徴、利点、および主なユースケースの詳細について参照してください。

AWS の利用を開始するためにさらにリソースが必要ですか。詳細は開始方法についてのリソースセンターをご覧ください。