Amazon EMR

輕鬆地執行和擴展 Apache Spark、Hive、Presto 和其他大數據工作負載

加速執行大數據應用程式及 PB 級資料分析,內部部署解決方案的成本則可減少一半以上。

使用最新的開源架構建置應用程式,並提供在自訂 Amazon EC2 叢集、Amazon EKSAWS OutpostsAmazon EMR Serverless 上執行的選項。

透過 Spark、Hive 和 Presto 的效能優化和開源 API 相容版本,獲得洞察的時間最多可縮短 2 倍。

使用 EMR Notebooks 和 EMR Studio 中熟悉的開源工具輕鬆開發、視覺化和調試您的應用程式。

運作方式

Amazon EMR 是一個雲大數據平台,用於使用開源分析框架(例如 Apache SparkApache HivePresto)運行大規模分佈式數據處理作業、交互式 SQL 查詢和機器學習 (ML) 應用程式。

Amazon EMR 的運作方式
 按一下以放大
EMR Serverless 簡介 (2:02)
隆重推出 Amazon EMR Serverless
Amazon EMR Serverless 是 Amazon EMR 中的一個新選項,它讓資料工程師和分析師能夠以輕鬆且具成本效益的方式,在無須調整、操作、最佳化、保護或管理叢集的情況下,便能執行 Apache Spark、Hive 或 Presto 等使用開放原始碼大數據架構所建置的應用程式。
隆重推出 Amazon EMR Serverless
Amazon EMR Serverless 是 Amazon EMR 中的一個新選項,它讓資料工程師和分析師能夠以輕鬆且具成本效益的方式,在無須調整、操作、最佳化、保護或管理叢集的情況下,便能執行 Apache Spark、Hive 或 Presto 等使用開放原始碼大數據架構所建置的應用程式。EMR Serverless 可按您的應用程式需求向上或向下擴展運算和記憶體資源,而您只需為應用程式使用的資源付費。

使用案例

執行大數據分析

使用統計演算法和預測模型執行大規模資料處理和假設分析,以發現隱藏的模式、相關性、市場趨勢和客戶偏好。

建置可擴展的 Data Pipeline

從各種來源擷取資料、大規模處理,然後提供給應用程式和使用者兩者使用。

處理即時資料串流

即時分析串流資料來源的事件,以建立長期執行、高可用性和容錯的串流 Data Pipeline。

加速資料科學和機器學習 (ML) 採用

使用開源機器學習 (ML) 架構,例如:Apache Spark MLlib、TensorFlow 與 Apache MXNet 來分析資料。連接到 Amazon SageMaker Studio 以進行大規模模型訓練、分析和報告。

如何開始使用

了解 Amazon EMR 的運作方式

進一步了解佈建叢集、擴展資源、配置高可用性等等。

探索 Amazon EMR 的特色 »

探索 Amazon EMR 的定價

按秒付費,可選擇在 Amazon EC2、Amazon EKS、AWS Outposts 或 Amazon EMR Serverless 上執行 EMR 叢集。

進一步了解 Amazon EMR 定價 »

開始使用 Amazon EMR

了解使用 EMR 處理即時串流、大規模機器學習等等。

觀賞 Amazon EMR 教學課程 »

探索更多 AWS 服務