プロジェクトを開始する

5 ステップ  |  60 分

Analyze_Big_Data_HERO-ART_SM

Q: Amazon EMR とは何ですか?

Amazon EMR は、自由にカスタマイズ可能なクラスターで Apache Spark、Presto、HBase、Hive などの一般的なビッグデータフレームワークの最新バージョンを実行できるマネージド型 Hadoop サービスです。Amazon EMR では、クラスターの設定と、クラスターにインストールするソフトウェアを完全に制御できます。

Q: Amazon EMR でできることは何ですか?

Amazon EMR を使用すると、量の大小にかかわらず、必要なキャパシティーを使用して Hadoop や Spark などの一般的なオープンソースのフレームワークを即座にプロビジョニングし、データ集約型のタスクを実行できます。一般的なユースケースには、ウェブインデックス作成、データマイニング、ログファイル分析、ETL (抽出、変換、ロード)、機械学習、財務分析、科学シミュレーション、生物情報科学研究などがあります。Amazon EMR により、データを集中的に高速処理または分析することができます。時間のかかる Hadoop クラスターのセットアップ、管理、調節や、それらが備える計算能力についての心配は要りません。

Amazon EMR は、大量のデータを迅速で効率的に処理する必要のある問題に最適です。このウェブサービスのインターフェイスにより、処理ワークフローを構築し、実行中のクラスターの進行度をプログラムで監視できます。また、AWS マネジメントコンソールのシンプルなウェブインターフェイスを使用して、クラスターを起動し、処理のための集中的なコンピューティングをモニタリングできます。

Q: このプロジェクトを使用して独自のログを分析できますか?

はい。独自のデータログを Amazon S3 バケットにアップロードし、類似のクラスターを使用して独自のデータに対してクエリを実行できます。ただし、このプロジェクトは本番環境での使用は想定していないことに注意してください。

Q: Amazon S3 へのデータの格納はどのように行えばよいですか?
AWS マネジメントコンソールを使用すると、バケットの作成、オブジェクトのアップロード、アクセス制御の設定を簡単で安全に実行できます。Amazon S3 の入門ガイドでは、Amazon S3 で AWS マネジメントコンソールの使用を開始する方法について説明しています。

また、Amazon S3 はその他の AWS のさまざまなサービスやサードパーティのコネクタとも統合されており、クラウドとのデータのやり取りがサポートされます。クラウドデータ移行ツールの詳細を参照してください

Q: データはどれくらい安全ですか?

Amazon S3 はデフォルトでセキュリティに保護されています。バケットとオブジェクトの所有者のみが、自分がもともと作成した Amazon S3 のリソースへアクセスすることができます。Amazon S3 はユーザー認証をサポートし、データへのアクセスをコントロールしています。HTTPS プロトコルを使用して、SSL エンドポイント経由で Amazon S3 にデータを安全にアップロードまたはダウンロードできます。IAM ユーザーや IAM ロールなどの AWS Identity and Access Management (IAM) ツールを使用してアクセスとアクセス権限を制御できます。例えば、特定のユーザーに対してクラスターへの読み取りを許可するが書き込みのアクセス権は与えない、ということが可能になります。また、Amazon EMR のセキュリティ設定を使用して、Amazon S3 暗号化への対応など、保管中および転送中の暗号化に関するさまざまなオプションを設定できます。クラスターへのアクセス制御Amazon EMR 暗号化の詳細について参照してください。

プロジェクトを開始する