Amazon Elastic MapReduce (Amazon EMR) は、大量のデータを迅速、容易に、かつコスト効果よく処理するためのウェブサービスです。

Amazon EMR は、ビッグデータ処理を簡略化し、動的にスケーラブルな Amazon EC2 インスタンス間の莫大な量のデータを処理し、配信するための、簡単、迅速、費用対効果が高い、マネージド型 Hadoop フレームワークを提供します。また、Apache Spark や Presto などの一般的な他のフレームワークを Amazon EMR で実行することや、Amazon S3 や Amazon DynamoDB などの他の AWS データストア内でデータを操作することができます。

Amazon EMR は、ログの分析、ウェブインデックス、データウェアハウジング、機械学習、財務分析、科学シミュレーション、生物情報科学研究を含む、お客様のビッグデータを確実かつ安全に処理します。

Amazon EMR のご紹介(日本語字幕) (3:06)

thumb-S6Ja55n-o0M-3

拡大イメージを見る

Amazon EMR リリース速度

Amazon EMR リリース速度

Amazon EMR のバージョニングリリースにより、EMR cluster で Apache Hadoop および Spark エコシステムのアプリケーションを含む最新のオープンソースプロジェクトを簡単に選択して使用できます。ソフトウェアは Amazon EMR によってインストールおよび設定されるので、管理タスクに費やす時間を短縮してデータの値を増やすことに集中できます。


使用が簡単

Amazon EMR クラスターは数分で起動できます。ノードのプロビジョニング、クラスターのセットアップ、Hadoop の設定、クラスターのチューニングなど、わずらわしい作業は不要です。Amazon EMR がこのような作業を行いますので、お客様は分析に専念できます。

低コスト

Amazon EMR の料金体系は予想がしやすくシンプル: 使用するインスタンスの時間ごとに 1 時間単位で料金を支払います。10 ノードの Hadoop クラスターの運用をわずか 0.15 USD/時間で開始できます。Amazon EMR は Amazon EC2 のスポットインスタンスとリザーブドインスタンスをネイティブサポートしているため、基盤となるインスタンスのコストを 50~80% 節約することもできます。

伸縮自在性

Amazon EMR は、コンピューティングインスタンスを 1 つでも数百、数千でもプロビジョニングできるため、あらゆる規模のデータ処理に対応します。インスタンス数は簡単に増減でき、お支払いは使った分のみの従量料金制です。

信頼性

クラスターの調整やモニタリングにかかる労力も削減できます。Amazon EMR にはクラウド用の調整された Hadoop があり、クラスターをモニタリングして失敗したタスクを再試行し、自動的にパフォーマンスの低いインスタンスを置き換えます。

安全性

Amazon EMR は Amazon EC2 インスタンスへのネットワークアクセスを制御するファイアウォールの各種設定を自動的に構成します。また、お客様が定義する論理的に隔離されたネットワークである Amazon Virtual Private Cloud(VPC)内にクラスターを起動することも可能です。Amazon S3 に保存されたオブジェクトの場合、AWS Key Management Service またはカスタマー管理型のキーを使用して Amazon S3 サーバー側の暗号化または Amazon S3 クライアント側の暗号化と EMRFS を使用できます。

安全性

お客様がクラスターのすべてを制御することができます。お客様は各インスタンスへのルートアクセス権限を持ち、簡単にその他のアプリケーションを追加し、クラスターごとに設定をカスタマイズできます。また Amazon EMR は、複数の Hadoop ディストリビューションとアプリケーションをサポートしています。

Amazon EMR はクリックストリームデータを分析して、ユーザーを区分したりユーザーの好みを理解したりする目的にも使用できます。広告主もクリックストリームや宣伝のインプレッションログを分析することで、より効果的な宣伝の配信に活用できます。

Razorfish による EMR を使ったクリックストリームの分析事例の詳細 »

Amazon EMR では、膨大な量のゲノミクスデータや、その他の大量の科学データセットをすばやく効率的に処理することもできます。研究者は AWS で無料でホストされているゲノミクスデータにアクセスできます。

1000 Genomes プロジェクトと AWS に関する記事を読む »

Amazon EMR はウェブやモバイルアプリケーションで生成されたログの処理にも使用できます。Amazon EMR は、ペタバイト級の非構造化データや半構造化データからアプリケーションやユーザーに関する有益な洞察を得るのに役立ちます。

Yelp が EMR を使用して主なウェブサイト機能を推進した方法 »

サンプルクラスターを起動してみましょう。ここをクリックして入門ガイドのチュートリアルをご覧ください。チュートリアルでは、サンプルテキストファイルの単語の頻度をカウントするクラスターを作成します。数分でクラスターが稼働します。