EC2 上的 Amazon EMR 透過選擇智慧型子網路改善叢集推動體驗

張貼日期: 2024年9月10日

即日起,EC2 上的 Amazon EMR 透過增強的子網路選擇,為執行個體機群叢集提供改善的可靠性和叢集啟動體驗。有了此功能,EC2 上的 EMR 可減少由於 IP 位址短缺引起的叢集啟動失敗。

Amazon EMR 是雲端大數據平台,用於使用開放原始碼架構 (如 Apache SparkApache HivePresto) 來進行資料處理、互動式分析和機器學習。以前,EMR 叢集的子網路選擇僅考慮核心執行個體機群的可用 IP 位址。Amazon EMR 現在於叢集啟動時採用子網路篩選,並選取其中一個具有足夠可用 IP 位址的子網路,以成功啟動所有執行個體機群。如果 EMR 找不到具有足夠 IP 位址的子網路來啟動整個叢集,則會優先處理至少可以啟動核心和主要執行個體機群的子網路。在這種情況下,EMR 也會發布 CloudWatch 警告事件以通知使用者。如果無法使用任何設定的子網路來佈建核心和主要機群,EMR 將無法啟動叢集,並提供嚴重錯誤事件。這些 CloudWatch 事件可讓您監控叢集,並根據需要採取補救措施。

使用分配策略啟動 EMR 執行個體機群叢集時,客戶將從所有 EMR 5.12.1 及更新版本上的此功能受益。您不需要進一步採取任何行動。這項功能已在所有 AWS 區域中推出,包括提供 EC2 上 Amazon EMR 的 AWS GovCloud (美國) 區域。若要進一步了解,請參閱這裡的文件。