AWS Resilience Hub

準備和保護您的應用程式免受中斷

AWS Resilience Hub 的優勢

持續驗證和追蹤應用程式恢復能力以減少中斷
評估恢復能力目標 (復原時間目標和復原點目標)。
在生產中發生問題之前識別並予以解決。
最佳化業務連續性,同時降低復原成本。

運作方式

AWS Resilience Hub 是 AWS Console 中央位置,供您管理與改進 AWS 上應用程式的恢復能力狀況。AWS Resilience Hub 讓您可以定義恢復能力目標、比照這些目標來評估您的恢復能力狀況,並依據 AWS Well-Architected Framework 實作改進建議。在 AWS Resilience Hub 中,您還可以建立和執行 AWS Fault Injection Service (AWS FIS) 實驗,模擬現實生活中的應用程式中斷,以協助您更好地理解相依性並揭示潛在的弱點。

AWS Resilience Hub 為您提供所需的服務和工具,以便在一個地方持續地增強您的恢復能力狀況。

功能

將您的應用程式描述為資源集合,例如 CloudFormation 堆疊、Terraform 狀態檔案、AppRegistry 應用程式或資源群組,或者,定義在 Amazon EKS 上進行管理之 Kubernetes 工作負載的應用程式。也可以使用資源集合和 Amazon EKS 叢集來描述應用程式。
定義應用程式的恢復能力政策。這些政策包括應用程式、基礎設施、可用區域和區域中斷的 RTO 與 RPO 目標。

AWS Resilience Hub 的評估使用 AWS Well-Architected Framework 中的最佳實務來分析應用程式的元件並揭示潛在的恢復能力弱點。這些弱點可能是由不完整的基礎設施設定、錯誤組態或需要額外組態改進的情況引發的。

AWS Resilience Hub 提供可行的建議以提高恢復能力。恢復能力評估還產生程式碼片段,協助您建立復原程序作為應用程式的 AWS Systems Manager 文件,該文件稱為標準操作程序 (SOP)。AWS Resilience Hub 會產生推薦的 Amazon CloudWatch 監控和警示清單,以協助操作員在部署後快速識別應用程式恢復能力狀況的任何變化。

在更新應用程式和 SOP 以納入恢復能力評估的建議後,您可以使用 AWS Resilience Hub 測試並驗證應用程式是否能夠滿足其恢復能力目標,然後才將其發佈到生產環境中。AWS Resilience Hub 與混沌工程服務 AWS Fault Injection Simulator (FIS) 整合,以提供真實世界故障的故障注入類比,以驗證應用程式是否在定義的恢復能力目標內復原。這可能包括網路錯誤或資料庫的開啟連接過多。AWS Resilience Hub 還提供 API,因此您可以將其恢復能力評估和測試整合至 CI/CD 管道中,以進行持續的恢復能力驗證。將恢復能力驗證整合至 CI/CD 管道中有助於確保對應用程式底層基礎設施的變更不會損害恢復能力。

使用案例

使用實際故障的故障注入模擬來協助驗證復原標準操作程序 (SOP) 和警示的有效性。

提供可行的建議以提高恢復能力並協助您建立復原程序。

在計劃內和計劃外停機期間對活動進行稽核追蹤,協助滿足合規和監管要求。

客戶

Pearson 標誌

「使用 AWS Resilience Hub,我們可以看到應用程式的作用...並問自己:這是一個任務關鍵型應用程式,還是可以停用一段時間而不影響我們的營運? AWS Resilience Hub 至關重要,因為我們能夠輸入值並非常快速地了解哪些應用程式對 Pearson 實際上很重要。」


– Pearson 基礎設施和營運資深 SRE 經理 Ronnie Kendrick

Pearson 利用 AWS Resilience Hub 來改善應用程式恢復能力

「ADL Digital Labs (ADL) 誕生於 2017 年,如今它是推動拉丁美洲金融服務產業數位產品的最佳平台之一。ADL 認識到為客戶提供高度可靠的解決方案的重要性,因此採用 AWS Resilience Hub,以驗證和追蹤其應用程式的韌性狀態,同時掌握政策合規性和可用性目標。將 AWS Resilience Hub 整合到業務持續性架構中,讓 ADL 能夠驗證八個交易渠道的恢復能力和業務持續性狀態,為哥倫比亞四大金融實體的約 400 萬個客戶提供服務。– Aval Digital Labs 架構主管 Alexander Chaparro


探索更多 AWS 服務