Amazon EMR 上的 Apache HBase

为什么选择 EMR 上的 Apache HBase？

Amazon EMR 原生支持 Apache HBase，让您可以实时访问可扩展到数十亿行和数百万列的表。Amazon EMR 将开源 Apache HBase（分布式系统上面向列的数据存储）的优势与 Amazon EMR 的耐用性、性能、集成和工具功能相结合。您可以获得高度一致的写入和读取，并且可以在几毫秒内查询 PB 级数据的结果，以使用时间序列数据为金融服务、广告技术、网络分析和应用程序中的任务关键型工作负载提供支持。您现有的 Apache HBase 应用程序无需更改任何代码，即可在 Amazon EMR 上运行。详细了解 Apache HBase on Amazon EMR。

功能和益处

到亚马逊 S3 中。

和 Amazon EBS 卷，因此您可以自定义集群的硬件以优化成本和性能。

了解有关亚马逊 EMR 功能的更多详细信息。

e 的数据存储。使用 Amazon S3 作为数据存储可将集群的存储和计算节点分隔开来，从而提供多种优势（相比在集群上使用 HDFS）。您可以通过针对计算要求调整集群大小而非使用 HDFS 数据存储来节省成本、获享 S3 存储的可用性和持久性、在不影响底层存储的情况下扩展计算节点，以及终止集群来节省成本并快速将其还原。您还能在其他 Amazon EC2 可用区创建和配置只读副本集群，允许其以只读方式访问面向主集群的数据，从而确保在主集群不可用时能够继续访问数据。