什麼是應用程式效能監控 (APM)?

應用程式效能監控 (APM) 是指使用軟體工具和遙測資料,來監控業務關鍵型應用程式效能的程序。企業想要確保自身維持預期的服務水準,讓客戶獲得良好的應用程式體驗。其使用 APM 工具來交付即時資料和應用程式效能的深入見解。然後,IT 團隊、DevOps 和網站可靠性工程師能夠快速找出應用程式問題並進行疑難排解。

為什麼應用程式效能監控很重要?

有效的應用程式效能監控 (APM) 是企業取得成功不可或缺的一部分。它有助於確保您的數位服務平穩執行,停機時間降至最低,並確保您的客戶始終獲得積極的體驗。 

應用程式效能監控為企業提供了諸多優勢。

客戶滿意度

APM 是一種有效的工具,可用於查明應用程式中出現問題的位置。它還重點關注數位客戶旅程中的常見問題。因此,您可以識別為最終使用者帶來最大價值的領域,藉此來改善客戶體驗。APM 還可以有效地確定變更是否有益。例如,如果企業引入新的客戶服務機器人,APM 指標可衡量有多少客戶使用該機器人解決了他們的查詢。

快速診斷

僅僅幾分鐘的停機時間就會造成經濟損失,並導致客戶旅程失敗。APM 可快速診斷應用程式效能問題,並將 IT 團隊直接指向問題所在。這種快速診斷可將停機時間降至最低。技術團隊有更多時間來開發新的應用程式,而不是修復現有的應用程式。 

降低營運成本

IT 團隊使用各種 APM 工具,來確定保持應用程式最佳效能所需的資源、基礎設施和運算能力。這可將營運成本降至最低。

有效的產品開發

應用程式效能監控工具可成為產品開發程序的一部分。您可以在測試或實際環境中實作 APM,並使用各種 APM 工具來監控和分析合成流量、發現限制,並識別錯誤。開發團隊可在應用程式上線之前,充分利用可行的洞察,並修復以前只有在啟動後才會變得明顯的錯誤。

業務協作

您可以跨業務部門共用指標和分析,從而改善溝通、打破孤島、提高員工敬業度,以及提高生產力。

應用程式效能監控會追蹤哪些指標?

應用程式效能監控 (APM) 會追蹤如下所示常見指標。

CPU 使用率

APM 解決方案可監控 CPU 指標,例如 CPU 使用率和記憶體需求。這可確保應用程式獲得充分運作所需的運算資源。

回應時間

回應時間對企業而言很重要,因為使用者希望能夠立即存取服務。APM 解決方案根據可接受的回應時間基準效能進行衡量,並在回應時間低於閾值時提醒您。

錯誤率

APM 軟體會監控應用程式,以記錄和報告錯誤率。一個錯誤範例是 Web 查詢逾時或資料庫查詢失敗。當錯誤率超過預先定義的參數時,APM 會發出提醒,例如,當最近 50 個請求中有 5% 導致錯誤時。

交易追蹤

APM 中的交易追蹤可讓您準確了解應用程式中執行的單一交易。交易追蹤中擷取的資訊包括可用函數呼叫、外部呼叫和資料庫呼叫。它會從頭到尾監控交易請求。

執行個體

APM 解決方案可監控並報告應用程式正在執行的伺服器或應用程式執行個體數量。它可以提醒您擴展或縮減規模以滿足使用者需求。

請求

APM 軟體會監控應用程式收到多少使用者請求。透過監控流量,該軟體可在發現任何異常狀況時傳送提醒。例如,它可以提醒您請求非預期增加、來自同一使用者的大量請求,或請求異常低。

運作時間

運作時間對於提供線上服務的企業來說至關重要。許多服務水準協議 (SLA) 僅允許在預定期間內有一個百分點的停機時間。APM 會監控應用程式可用性,並將水準與服務供應商和客戶商定的水準作比較。

應用程式效能監控有哪些使用案例?

下面給出了應用程式效能監控 (APM) 的一些使用案例。

真實使用者監控

真實使用者監控或最終使用者體驗監控是對使用者資料的收集和分析,以建立對應用程式效能水準的理解。藉由建立可接受效能的基準,您可以準確預測應用程式何時會遇到問題。例如,如果客戶在嘗試結帳時遇到問題的數量超過閾值,則 APM 會向相關團隊傳送提醒。

您可以採用兩種方式來執行使用者監控:    

  • 綜合監控可模擬使用者行為,以在應用程式發佈到生產環境之前捕獲問題
  • 無代理程式監控則無需在受監控應用程式上安裝軟體代理程式,即可分析網路流量

使用者定義的交易分析

您可以使用 APM 解決方案,重新建立常見使用者與應用程式的互動。這樣做,您可以更好地了解數位服務出現問題的條件。IT 團隊通常藉助使用者定義的交易分析,來對應用程式進行疑難排解,並修復常見的使用者問題。

元件監控

元件監控或應用程式元件深度監控,會全面追蹤整個 IT 基礎設施。監控並分析應用程式的完整效能。受監控資源包括記憶體用量、伺服器、CPU 使用率和網路元件。

基礎設施監控

您可以使用 APM 工具從 IT 基礎設施收集資料,例如伺服器 (伺服器監控)、容器 (容器監控)、資料庫 (資料庫監控)、虛擬機器 (VM 監控) 和其他後端系統。這樣做是為了偵測效能問題,並找出應用程式錯誤的根本原因。

閱讀有關基礎架構即服務 (IaaS) 的內容 »

分析

有效的 APM 提供用於分析的資料,企業可以使用這些資料來修復或改善其應用程式。一些 APM 工具使用人工智慧和機器學習 (AI/ML) 演算法來進行預測性分析,診斷錯誤的根本原因,並將複雜的應用程式效能問題連結起來。

閱讀有關 AWS 上的機器學習的內容 »

SLA 監控

服務水準協議 (SLA) 對於 IT 服務供應商與客戶之間的合約至關重要。其規定了雙方同意的所需服務水準。APM 可監控 SLA 框架中的效能指標,這有助於供應商確保其滿足預期。此外,它還會重點關注供應商有可能低於 SLA 中所述標準的領域。

應用程式效能監控與可檢視性之間有何不同?

現代應用程式具有複雜的架構,其需要的不僅僅是應用程式效能監控 (APM) 來排解問題。可檢視性將整個 IT 堆疊的資訊彙集到一個中央平台,在該平台上可採取高階商業智慧和洞察。APM 是可檢視性的一個子集。雖然 APM 提供了指標的彙總檢視,但可檢視性使用其他幾種工具 (如分散式追蹤),來全面了解應用程式行為。

閱讀有關 AWS 可檢視性的內容 »

如何為您的組織選擇合適的應用程式效能監控解決方案?

在將應用程式效能監控 (APM) 平台及其工具套件整合至您的 IT 環境之前,需要考慮諸多因素。

買入

確保您的團隊了解引入 APM 背後的基本原理和個人利益。您需要找到您的團隊熟悉的、適合現有系統和程序的解決方案。

特色

有許多可用的 APM 工具。確保您引入的 APM 平台具有您的應用程式適用的正確工具,並且支援您的程式設計語言。

成本需求

引入 APM 可能需要大量運算資源,尤其是當您計劃要監控多個應用程式時。確保擁有必要的運算資源預算,以及 APM 本身的成本。

擁有權

考慮誰將監督和擁有您的 APM。哪些團隊將負責維護和管理?

AWS 如何協助您監控應用程式效能?

Amazon CloudWatch 是一項監控和可檢視性服務,可讓您持續追蹤最終使用者的數位體驗。它還可追蹤您在 AWS 上執行的應用程式,即 Amazon Elastic Compute Cloud (Amazon EC2)、容器和無伺服器上以及內部部署。從前端到基礎設施,CloudWatch 在效能堆疊的每一層收集資料。

您可以使用 Amazon CloudWatch ServiceLens 來識別應用程式中的效能瓶頸,並使用相關的指標、日誌和追蹤來將其隔離。CloudWatch ServiceLens 整合 CloudWatch 與 AWS X-Ray,以提供應用程式的綜合檢視。這樣,您就可以查明效能瓶頸,並且更有效地識別受影響的使用者。

以下是您可以使用 CloudWatch 執行的操作範例:

  • 針對服務水準協議 (SLA) 和服務水準目標 (SLO) 端點和 UI 工作流程監控設定提醒
  • 近乎即時地收集有關應用程式效能的用戶端資料
  • 實驗整個應用程式堆疊中的功能,根據效能和業務指標進行衡量,並安全地啟動功能

立即建立免費的 AWS 帳戶,開始在 AWS 上使用應用程式效能監控 (APM)。

應用程式效能監控後續步驟

查看額外的產品相關資源
AWS 上的免費開發人員工具服務 
註冊免費帳戶

立即存取 AWS 免費方案。

註冊 
開始在主控台進行建置

開始在 AWS 管理主控台進行建置。

登入