跳至主要内容

Amazon EMR

Amazon EMR 上的 Apache HBase

为什么选择 EMR 上的 Apache HBase?

Amazon EMR 原生支持 Apache HBase,让您可以实时访问可扩展到数十亿行和数百万列的表。Amazon EMR 将开源 Apache HBase(分布式系统上面向列的数据存储)的优势与 Amazon EMR 的耐用性、性能、集成和工具功能相结合。您可以获得高度一致的写入和读取,并且可以在几毫秒内查询 PB 级数据的结果,以使用时间序列数据为金融服务、广告技术、网络分析和应用程序中的任务关键型工作负载提供支持。您现有的 Apache HBase 应用程序无需更改任何代码,即可在 Amazon EMR 上运行。详细了解 Apache HBase on Amazon EMR

功能和益处

    到亚马逊 S3 中。

    和 Amazon EBS 卷,因此您可以自定义集群的硬件以优化成本和性能。

    了解有关亚马逊 EMR 功能的更多详细信息。

    e 的数据存储。使用 Amazon S3 作为数据存储可将集群的存储和计算节点分隔开来,从而提供多种优势(相比在集群上使用 HDFS)。您可以通过针对计算要求调整集群大小而非使用 HDFS 数据存储来节省成本、获享 S3 存储的可用性和持久性、在不影响底层存储的情况下扩展计算节点,以及终止集群来节省成本并快速将其还原。您还能在其他 Amazon EC2 可用区创建和配置只读副本集群,允许其以只读方式访问面向主集群的数据,从而确保在主集群不可用时能够继续访问数据。

利用 HBase 和 EMR 取得成功的客户案例

FINRA 客户成功案例

FINRA 使用 Amazon EMR 在 Amazon S3 上运行 Apache HBase,以快速访问数万亿条交易记录并节省超过 60% 的成本。

Missing alt text value

Monster 客户成功案例

Monster 使用 Apache HBase on Amazon EMR 来存储点击流和广告活动数据,并使用 Apache Hive 运行 SQL 查询。

Missing alt text value