Amazon EMR 上的 Apache Hadoop

為什麼選擇 EMR 上的 Apache Hadoop?

Apache™ Hadoop® 是一個開放原始碼軟體專案,可用於有效率地處理大型資料集。Hadoop 不使用單一大型電腦來處理和存放資料,而是將商用硬體結合成叢集,以平行方式分析大量資料集。

Hadoop 生態系統提供能滿足您分析工作負載需求的各種應用程式和執行引擎。 針對執行 Hadoop 及 Hadoop 生態系統中其他應用程式的 Amazon EC2 執行個體,Amazon EMR 可讓您輕鬆建立和管理這些執行個體完全設定好的彈性叢集。

Hadoop 生態系統中的應用程式和框架

Open all

Hadoop:基本元件

Open all

Amazon EMR 上 Hadoop 的優點

Open all

Hadoop 與大數據之間的關係為何?

Hadoop 可大規模擴展,所以常用來處理大數據工作負載。若要增加 Hadoop 叢集的處理能力,可新增更多具有所需 CPU 和記憶體資源的伺服器來滿足您的需求。

Hadoop 提供高等級的耐久性和可用性,同時仍然能夠平行處理運算分析工作負載。處理結合了可用性、耐久性和可擴展性,讓 Hadoop 非常適合用於大數據工作負載。您可以使用 Amazon EMR 在短時間內建立和設定執行 Hadoop 的 Amazon EC2 執行個體叢集,然後開始從您的資料衍生值。

使用案例

Apache 與 Hadoop 是 Apache Software Foundation 的商標。