亚马逊AWS官方博客
迁移到 Amazon EMR上基于 Amazon S3 的 Apache Hbase:指导和最佳实践
这篇博文提供了有关如何从 Apache HBase on HDFS 迁移到在 Amazon EMR 上使用 基于Amazon S3的Apache Hbase的指导和最佳实践。
在 Amazon EMR 上使用 Amazon S3 上的 Apache HBase
Amazon EMR 5.2.0及更高版本允许您运行基于 Amazon S3的 Apache HBase。通过将 Amazon S3 用作 Apache HBase 的数据存储,您可以分离集群的存储节点和计算节点。这让您可以根据计算需求调整集群大小,从而节省成本。您不必为存储在HDFS集群上带有3副本的整个数据集而付费。
许多客户已在享受运行 Amazon S3 上的 Apache HBase 来存储数据的优势。这些优势包括更低廉的成本、更好的数据持久性和更有效的可扩展性。美国金融业监管局 (FINRA) 等客户已通过迁移到基于Amazon S3 的 Apache HBase 架构将成本降低了 60%。他们还通过将存储与计算解耦并将 Amazon S3 用作存储层获得众多运营优势。
关于迁移到在 Amazon EMR 上使用 Amazon S3 上的 Apache HBase 的白皮书
本白皮书将指引您完成迁移的各个阶段。它还能帮助您确定何时选择在 Amazon EMR 上基于 Amazon S3的 Apache HBase、规划平台安全性、调优 Apache HBase 和 EMRFS 以支持您的应用程序服务级别协议、确定迁移和恢复数据的选项,以及管理生产环境中的集群。
有关更多信息,请参阅迁移到在 Amazon EMR 上使用 Amazon S3 上的 Apache HBase
其他阅读资源
如果您认为这篇文章有用,请务必查看使用 Amazon S3 上的 Apache HBase 设置只读副本集群,以及从 HDFS 迁移到 Amazon S3 上的 Apache HBase 的技巧。
关于作者
Francisco Oliveira 是 AWS 专业服务部的一位高级大数据工程师。他专注于使用开源技术和 AWS 构建大数据解决方案。在业余时间,他喜欢尝试新的运动、旅行和探索国家公园。