- 分析
- Amazon EMR
- EMR 上的 Apache HBase
Amazon EMR 上的 Apache HBase
為什麼選擇 EMR 上的 Apache HBase?
Amazon EMR 原生支援 Apache HBase,讓您能夠即時存取可擴展至數十億資料列和數百萬資料欄的資料表。Amazon EMR 將開放原始碼 Apache HBase (分散式系統上以資料欄為導向資料儲存) 的優勢與 Amazon EMR 的耐久性、效能、整合和工具功能相結合。您可以獲得高度一致的寫入和讀取,並且在幾毫秒內即可查詢 PB 級資料的結果,以使用時間序列資料來為金融服務、廣告技術、Web 分析和應用程式的任務關鍵型工作負載提供支援。您現有的 Apache HBase 應用程式會在 Amazon EMR 上運作,而無需任何程式碼變更。進一步了解 Amazon EMR 上的 Apache HBase。
功能與優勢
。
Amazon EBS 磁碟區,因此您可以自訂叢集的硬體,以最佳化成本和效能。
解有關亞馬遜 EMR 功能的更多詳細信息。
亞馬遜 S3 作為 Apache HBase 的資料存放區。使用 Amazon S3 做為資料存放區來區隔您的叢集儲存和運算節點,可透過叢集上的 HDFS 提供多種好處。您可以針對運算需求而不是 HDFS 資料儲存體調整叢集大小以節省費用、獲得 S3 儲存的可用性和耐久性、在不影響基本儲存的情況下擴展運算節點,還可以終止叢集以節省成本並快速恢復。您也可以在另一個 Amazon EC2 可用區域建立並設定僅供讀取複本叢集,以提供和主叢集一樣的資料唯讀存取權,確保即使在主叢集無法使用的情況下也能不中斷地存取資料。
使用 HBase 與 EMR 的客戶成功案例
Monster 客戶成功案例
Monster 使用 Amazon EMR 上的 Apache HBase 來存放點擊流和廣告行銷活動資料,並使用 Apache Hive 執行 SQL 查詢。