Amazon EMR

Amazon EMR の Apache HBase

Q: 統合

ここをクリックしてください。

EMR での Apache HBase を使用すべき理由

Amazon EMR は Apache HBase をネイティブにサポートしているため、数十億行、数百万列にスケールできるテーブルにリアルタイムでアクセスできます。Amazon EMR は、オープンソースの Apache HBase (分散システム上の列指向データストア) の利点と、Amazon EMR の耐久性、パフォーマンス、統合、ツール機能を兼ね備えています。書き込みと読み取りの一貫性が強く、数ミリ秒以内にペタバイト単位のデータで結果をクエリできるため、金融サービス、アドテック、ウェブ分析、時系列データを使用したアプリケーションにおけるミッションクリティカルなワークロードを強化できます。既存の Apache HBase アプリケーションは、コードを変更することなく Amazon EMR で動作します。詳細については、「 Apache HBase on Amazon EMR」をご覧ください。

特徴と利点

HFile) を Amazon S3 に永続化します。

、クラスターのハードウェアをカスタマイズしてコストとパフォーマンスを最適化できます。

ここをクリックしてください。

のデータストアとして使用できます。Amazon S3 をデータストアとして使用し、クラスターのストレージノードとコンピューティングノードを分けることには、オンクラスターの HDFS と比較していくつかの利点があります。HDFS データストレージの代わりにコンピューティングの必要に合わせてクラスターのサイズを設定することでコストを節約し、S3 ストレージの持つ可用性と耐久性を手に入れ、基盤となるストレージに影響を与えることなくコンピューティングノードをスケールすることが可能になります。また、コスト節減のためにクラスターを削除することや必要なときにすばやく回復することも可能です。別の Amazon EC2 アベイラビリティーゾーンにリードレプリカクラスターを作成し、プライマリクラスターと同じデータへの読み取り専用アクセスを設定すれば、プライマリクラスターが利用できなくなった場合でもデータへのアクセスを中断させずにすみます。