Amazon DevOps Guru

使用機器學習 (ML) 技術的雲端作業服務,改善應用程式可用性

Amazon DevOps Guru 是一項機器學習 (ML) 驅動型服務,旨在輕鬆改善應用程式的運作效能與可用性。DevOps Guru 有助於偵測偏離正常營運模式的行為,因此您可以在營運問題影響客戶之前很久就發現它們。

DevOps Guru 使用基於 Amazon.com 和 AWS 多年卓越營運經驗的機器學習 (ML) 模型來識別異常的應用程式行為 (例如,延遲增加、錯誤率、資源限制等),同時協助揭示可能導致潛在停機或服務中斷的關鍵問題。DevOps Guru 識別出關鍵問題時,會自動傳送提醒並提供相關異常的摘要、可能的根本原因以及問題發生時間和地點的內容。如果可能,DevOps Guru 還會協助提供有關如何修復問題的建議。

藉助一鍵式部署,DevOps Guru 自動從您的 AWS 應用程式中擷取營運資料,並提供一個儀表板來視覺化展示營運資料中的問題。您可以首先為 AWS 帳戶中的所有資源、AWS CloudFormation 堆疊中的資源或按 AWS 標籤分組的資源啟用 DevOps Guru,無需手動設定或具備機器學習 (ML) 專業知識。

免費的 7,200 AWS resource hours free

分別用於資源群組 A 和 B

使用 AWS 免費方案的 3 個月中的每個月

優勢

偵測問題

自動偵測營運問題

Amazon DevOps Guru 使用機器學習 (ML) 自動收集和分析資料,例如偏離正常營運模式的應用程式指標、日誌、事件和行為。 該服務旨在自動偵測和提醒營運問題和風險,例如即將發生的資源耗盡、可能導致停機的程式碼和組態變更、記憶體洩漏、過少佈建的運算容量以及資料庫輸入/輸出 (I/O) 過度使用。

解決問題

藉助使用機器學習 (ML) 的洞察資料快速解決問題

Amazon DevOps Guru 透過關聯異常行為和營運事件來幫助縮短識別和解決問題根本原因的時間。發生問題時,DevOps Guru 旨在透過相關異常摘要和有關問題的內容資訊生成洞察資料。如果可能,它會提供可行的修復建議。

擴展

輕鬆擴展並保持可用性

Amazon DevOps Guru 節省了手動更新靜態規則和警示所涉及的時間和精力,這樣就可以有效地監控複雜且不斷演變的應用程式。遷移或採用新的 AWS 服務時,DevOps Guru 會自動分析其指標、日誌和事件。然後,它產生洞察資料,幫助您輕鬆適應不斷變化的行為和不斷演變的系統架構。

減少雜訊

減少雜訊和降低警示疲勞


Amazon DevOps Guru 透過使用預先訓練的機器學習 (ML) 模型關聯和分組相關異常並顯示最關鍵的警示,協助開發人員和 IT 操作人員減少警示雜訊並克服警示疲勞。DevOps Guru 可以減少管理多個監控工具和警示的工作需求,這意味著人員可以專注於問題的根本原因和修復方式。

運作方式

DevOps Guru 的運作方式
取得營運洞察資料


使用 Amazon DevOps Guru 取得營運洞察資料

使用案例

提升營運效能和可用性

在營運事件發生之前有效預防Amazon DevOps Guru 旨在揭示隨時間推移會影響應用程式可靠性的中等和低嚴重性問題清單,例如達到自動擴展群組的限制、延遲模式的變更或 API 呼叫量增加。

動態探索新的資源和指標

隨著您的應用程式不斷發展並加入新的支援資源,Amazon DevOps Guru 旨在了解每個新指標的模式,並透過提早警告營運問題向您發出提醒。不再更新或修復配置不當的警示 — DevOps Guru 從這些資源中擷取指標並自動對其進行分類。

減少平均復原時間

藉助 DevOps Guru 提供的營運洞察資料,快速診斷和修復 AWS 資源 (包括關聯式資料庫) 的問題,例如資源的過度使用或某些 SQL 查詢的不當行為。這些洞察資料使用有關受影響資源和相關異常的資訊來減少平均復原時間 (MTTR),並使用日誌和相關事件等內容資料提供建議。

主動式資源管理

藉助 DevOps Guru,您可以確定記憶體、CPU 和磁碟空間等可耗盡資源何時會超過佈建的容量。DevOps Guru 持續擷取和分析您在 AWS 上執行的資源和應用程式,並透過在儀表板中建立低雜訊通知來幫助您避免即將發生的停機。

客戶

HCL Technologies
「我們一直在探尋如何減少團隊在解決營運問題上花費的時間,目前我們使用 Amazon DevOps Guru 並利用其基於機器學習 (ML) 的洞察資料來協助快速識別、關聯和修復營運問題。藉助 Amazon DevOps Guru 提供的洞察資料,我們的團隊現在可以快速找到問題,而無需從頭開始嘗試找出問題的根源。IT 團隊顯著降低了 MTTR,並且節省了數小時解決問題的時間 — 同時確保我們的客戶盡可能得到最佳的最終使用者體驗。」

DevOps 資深技術總監 Anchal Gupta - HCL

Thomson Reuters
「客戶體驗和滿意度是我們的首要任務。收到多個提醒和監控事件來源時,篩選雜訊以識別影響客戶的事件可能具有挑戰性且耗時。藉助 Amazon DevOps Guru,我們能夠利用其基於機器學習 (ML) 的洞察資料提供清晰的行動路徑,以降低 (在許多情況下消除) 問題對客戶造成的影響。Amazon DevOps Guru 與 PagerDuty 的整合還提供了一條直接路徑,可以在正確的時間快速高效地向正確的人員提供建議,我們預計因此可顯著減少營運停機時間。」

基礎設施託管產品組合總監 Steve Thoennes - Thomson Reuters

605.tv
「我們需要監控十幾個 AWS 帳戶和數以萬計的資源。即使使用基礎設施即程式碼並為這些服務建立動態提醒,也很難管理和關聯指標以快速解決問題。藉助 Amazon DevOps Guru,我們可確信收到的是準確的提醒和通知,它們來自跨多個服務關聯的採用機器學習 (ML) 的指標。只需幾分鐘即可實作 Amazon DevOps Guru 整合,而與數千個 AWS CloudFormation 堆疊整合也是輕而易舉的事情。Amazon DevOps Guru 提供的洞察資料有助於我們專注於基礎設施藍圖。」

DevOps 總監 Jared Williams - 605.tv

合作夥伴

Atlassian
「Atlassian 很高興我們的客戶使用 Amazon DevOps Guru 實作 AIOps 策略來管理其雲端應用程式的營運效能。藉助全新的 Opsgenie 和 Jira Service Management 整合,當 Amazon DevOps Guru 發現潛在問題並使用機器學習 (ML) 根據事件的嚴重性對其進行優先順序排序時,適當的團隊就會收到通知。這種整合可確保每個團隊都可以快速回應、使用機器學習 (ML) 支援的建議解決問題,並從每個事件中學習經驗。」

Opsgenie 產品主管 Emel Dogrusoz - Atlassian

了解如何透過將 Amazon DevOps Guru 與 Atlassian Opsgenie 整合,直接向待命團隊提供營運洞察資料
PagerDuty
「PagerDuty 透過與 Amazon DevOps Guru 的全新整合,進一步深化了我們與 AWS 的合作關係。PagerDuty 的數位營運管理平台旨在推動向 DevOps 文化的轉變,我們很高興透過這種整合繼續履行這一承諾。利用 DevOps Guru 的機器學習 (ML) 功能,PagerDuty 為我們的共同客戶提供了更多根據訊號即時採取動作的能力。透過 PagerDuty 對 Amazon Simple Notification Service (SNS) 的擷取,AWS 客戶可以在營運問題成為影響客戶的中斷之前對其採取即時動作。」

產品高級副總裁 Jonathan Rende - PagerDuty

進一步了解透過 PagerDuty 和 Amazon DevOps Guru 為您的待命團隊提供機器學習 (ML) 支援的營運洞察資料

部落格和文章

devops guru 1a

新發佈 - Amazon DevOps Guru 協助標識應用程式錯誤和修正方法

2020 年 12 月

Harunobu Kameda

閱讀部落格 »

devops guru 2

使用 AWS CloudFormation StackSets 跨多個帳戶和區域輕鬆設定 Amazon DevOps Guru

2020 年 12 月

Nikunj Vaidya 與 Nuatu Tseggai

閱讀部落格 »

devops guru reinvent thumbnail

AWS re:Invent 2020:使用 Amazon DevOps Guru 透過機器學習 (ML) 支援的洞察資料提高應用程式可用性

2020 年 12 月

Jacob Sullivan

觀賞網路研討會 »

devops guru 4

Amazon DevOps Guru 由預訓練的機器學習 (ML) 模型提供支援,這些模型針對卓越營運進行編碼

2020 年 2 月

Caner Turkmen、Ravi Turlapati 與 Tim Januschowski

閱讀部落格 »

自動執行程式碼審查

自動執行程式碼審查
透過 Amazon CodeGuru 更快、更早地發現程式碼問題

Amazon DevOps Guru 功能
查看產品功能

輕鬆提高應用程式的營運效能和可用性

進一步了解 
註冊免費帳戶
註冊免費帳戶

立即存取 AWS 免費方案。 

註冊 
開始在主控台進行建置
開始在主控台進行建置

開始在 AWS 管理主控台使用 Amazon DevOps Guru 建置。

登入