開始使用專案

5 個步驟  |  60 分鐘

Analyze_Big_Data_HERO-ART_SM

Amazon EMR 是一項受管服務,利用快速、簡單、經濟實惠的方式執行 Apache Hadoop 和 Spark 來處理非常大量的資料。Amazon EMR 也支援各種強大、經過驗證的 Hadoop 工具,如 Presto、Hive、Pig、HBase 等等。在這個專案中,您將部署一個功能完整的 Hadoop 叢集,在幾分鐘內就可完成分析日誌資料。首先,啟動一個 Amazon EMR 叢集,然後使用 HiveQL 指令碼來處理存放在 Amazon S3 儲存貯體中的範例日誌資料。HiveQL 是類似 SQL 的指令碼語言,用於資料倉儲和分析。接著您可使用類似的設定來分析自己的日誌檔案。

aws-project_analyze-big-data_diagram
開始使用專案

您可以完成哪些工作:

使用 Amazon EMR 啟動功能完整的 Hadoop 叢集

為存放在 Amazon S3 中的範例日誌資料定義結構描述並建立一個表格

使用 HiveQL 指令碼分析資料,然後將結果寫回到 Amazon S3。

在電腦上下載和檢視結果

開始之前您需要準備什麼:

AWS 帳戶:您需要有 AWS 帳戶才能開始佈建用來託管網站的資源。 註冊使用 AWS

IT 經驗:雖然不是必要的,但建議具備使用 Hadoop 的經驗,這有助於完成此專案。

AWS 經驗:雖然不是必要的,但建議具備 Amazon S3 和 Amazon EC2 金鑰對的基本知識,這有助於完成此專案。

帳單估算:

完成專案的成本:完成這個專案的預計成本是 1.05 USD。這個成本假設您在 AWS 免費方案的限制範圍內、使用建議的組態,而且在建立資源之後 1 個小時內終止專案使用的所有資源。您的使用案例可能需要不同的組態,因此會影響您的帳單。使用每月成本簡易計算器,根據您的需要預估成本。

每月帳單估算:這個專案的總成本會依使用量和組態設定而有所不同。使用本指南中建議的預設組態,此專案的成本一般會是每月 769 USD。AWS 是依每個個別服務的用量決定定價。依據每個服務的合併總用量產生每月帳單。探索以下標籤,了解每個服務的用途以及該服務如何影響您的帳單。若要查看使用的服務明細及相關的成本,請參閱使用的服務和成本


進一步了解 AWS 上的大數據解決方案,以及註冊網路研討會。

進一步了解 Amazon EMR 的功能、優點及重要使用案例。

需要更多資源以開始使用 AWS?請瀏覽資源中心入門以進一步了解。