Amazon EMR 上的 Apache Hadoop

为什么选择 EMR 上的 Apache Hadoop?

Apache™ Hadoop® 是一个开源软件项目,可用于高效地处理大数据集。利用 Hadoop,您可以将商用硬件组成集群以便并行分析海量数据集,而不必使用一台大型计算机处理和存储数据。

Hadoop 生态系统中具有大量应用程序和执行引擎,提供了多种可满足您的分析工作负载需求的工具。 借助 Amazon EMR,您可以轻松创建和管理由 Amazon EC2 实例组成的配置完整的弹性集群,这些实例运行 Hadoop 及 Hadoop 生态系统中的其他应用程序。

Hadoop 生态系统中的应用程序和框架

Open all

Hadoop:基本组件

Open all

在 Amazon EMR 上使用 Hadoop 的优势

Open all

Hadoop 与大数据有何关联?

Hadoop 高度可扩展,因而通常用于处理大数据工作负载。为了提升 Hadoop 集群的处理能力,可添加更多具备所需 CPU 和内存资源的服务器来满足您的需求。

Hadoop 具备出色的耐用性和可用性级别,同时仍能并行处理计算分析工作负载。处理能力高度可用、持久耐用且具备出色的可扩展性,这让 Hadoop 成为了适合用于处理大数据工作负载的绝佳方案。您可以使用 Amazon EMR 在几分钟内创建和配置一个运行 Hadoop 的 Amazon EC2 实例集群,然后开始从数据中获取价值。

使用案例

Apache 和 Hadoop 是 Apache Software Foundation 的商标。