跳至主要內容

Amazon CloudWatch

AI 營運

善用 AI 快速識別、診斷並修復營運問題

概觀

善用 AWS 為全球數百萬客戶提供雲端服務 19 年來,所累積並精進的豐富營運經驗。我們已運用 AI 和機器學習 (ML) 來協助增強、加速和自動化您的雲端營運程序。AIOps 讓您能輕鬆觀察工作負載、加速營運故障排除,並採取行動解決與修復營運問題,進而縮短平均復原時間 (MTTR)。 

在很短的時間內找到問題發生的根本原因

從 AWS 管理主控台的任何位置開始營運調查。您可以設定 Amazon CloudWatch 在警示觸發時立即開始調查,或從 Amazon Q 聊天中建立調查。CloudWatch 會在調查時與您並肩合作,協助您識別應用程式中的異常狀況,並針對問題的根本原因提出假設。

啟動 CloudWatch 調查互動式示範

Missing alt text value

使用修復建議快速解決問題

Amazon CloudWatch 透過顯示相關的 AWS Systems Manager Automation 執行手冊、AWS re:Post 文章和文件,針對常見 AWS 問題建議修復動作。執行此執行手冊以解決問題,讓關鍵業務應用程式能快速恢復全面運作。

在文件中閱讀關於 Amazon CloudWatch 調查的資訊

Missing alt text value

持續改善營運態勢

Amazon CloudWatch 利用 AI 在數分鐘內建立全面的事件後分析報告。事件報告可協助您更妥善地識別模式、實作預防措施,並透過結構化的事件後分析持續改善營運態勢。自動收集並關聯關鍵營運遙測、服務組態和調查結果,以產生推動營運改善的詳細報告。  

在文件中了解自動事件分析與報告

Missing alt text value

賦能各種經驗層級的操作人員

Amazon CloudWatch 分擔了故障排除過程中的繁重工作,因此您無需成為所有應用程式資源的專家。在營運調查期間,CloudWatch 會過濾成千上萬個資料點,以發現服務之間的關係並了解它們如何協同運作。分析調查結果後,CloudWatch 會向您展示問題根本原因的潛在假設,並引導您解決問題。

檢視調查範例

Missing alt text value

自動偵測異常與模式

Amazon CloudWatch 使用進階機器學習 (ML) 自動建立基準並偵測遙測資料中的異常,免除手動篩選指標與日誌的需求。收到關於峰值或異常模式的警示,以便在問題擴大前加以解決。CloudWatch 會醒目提示重複出現的模式和關鍵值 (例如嚴重性層級),協助您快速鎖定相關日誌或比較隨時間變化的行為,以便更快發現問題。

在文件中閱讀關於 CloudWatch 異常偵測的資訊

Missing alt text value

使用自然語言查詢遙測資料

從遙測中擷取洞察,無需學習複雜的查詢語言。您無需撰寫複雜的查詢,只需使用淺顯易懂的英文提問,例如「Show me the 10 slowest AWS Lambda requests in the last 24 hours」(顯示過去 24 小時內最慢的 10 個 AWS Lambda 請求),Amazon CloudWatch 便會自動產生正確語法。使用 CloudWatch Logs Insights 中的自然語言摘要功能,您可以從查詢結果產生摘要,協助快速識別問題並從日誌資料中獲得可採取行動的洞察。

在文件中閱讀如何使用自然語言查詢自然語言摘要

Missing alt text value

客戶

Cedar Gate Technologies

醫療保健技術供應商 Cedar Gate Technologies 現在使用 Amazon CloudWatch 加速調查並迅速解決問題,能在約 30 分鐘內找出營運問題的根本原因 (相較於之前的兩小時),讓客戶能持續為病患提供優質照護。

Missing alt text value

Amazon Kindle

Amazon Kindle 支援工程師在使用 Amazon CloudWatch 進行調查時,問題解決速度提高了 65-80%,協助他們更快速地滿足客戶需求,提供最佳使用者體驗。 

Missing alt text value

Amazon Music

Amazon Music 開發人員使用 Amazon CloudWatch 作為全天候助理,自動化調查並識別跨問題的趨勢,協助他們在待命輪班期間更快速地行動。早期的使用情況顯示,Amazon Music 可將解決問題的速度加快一倍,因此聽眾可以繼續聆聽自己喜歡的歌曲。

Missing alt text value

SmugMug

相片管理平台 SmugMug 將使用 Amazon CloudWatch 自動分析系統中的指標、日誌和營運事件,使其能在 20 分鐘內診斷出大多數問題,速度提升高達 50%。這透過減少手動日誌搜尋提高了營運效率,讓團隊能花更少時間和資源管理問題,將更多時間用於建置平台,協助攝影師拓展數位店面。

Missing alt text value