Amazon DevOps Guru 功能

整合多个来源的运营数据

Amazon DevOps Guru 持续分析并整合多个来源的运营数据流,例如 Amazon CloudWatch 指标、AWS Config、AWS CloudFormation 和 AWS X-Ray,并为您提供一个单一控制台控制面板,用于搜索和可视化运营数据中的异常,从而减少使用多种工具的需要。这个委派的管理员可以对企业内所有账户中的洞察执行查看、排序和筛选操作,以生成所有受监控应用程序运行状况的组织范围视图,无需进行任何其他自定义操作。

DevOps Guru 控制面板
Amazon DevOps Guru 控制面板

通过采用机器学习(ML)技术的洞察节省时间

Amazon DevOps Guru 通过利用采用机器学习(ML)技术的建议,提高了应用程序的可用性,且通过更少的人工操作即可更快地纠正操作问题。它持续摄取和分析指标、日志、事件和跟踪,从而为应用程序行为建立正常的边界。然后,DevOps Guru 寻找与正常行为的偏差,并聚合异常,以基于应用程序中的组件关系创建操作见解。操作见解包括关于哪些组件受到影响的信息、相关异常的识别以及关于如何使用上下文数据(如 AWS CloudTrail 事件)进行补救的建议。

Amazon DevOps Guru Insight Detail
Amazon DevOps Guru 见解详细信息
Amazon DevOps Guru Insight Detail – Graphed Anomalies Tab
Amazon DevOps Guru 见解详细信息 – 图形异常选项卡
Amazon DevOps Guru Insight Detail- Relevant events
Amazon DevOps Guru 见解详细信息 - 相关事件
Amazon DevOps Guru Insight Detail- Recommendations
Amazon DevOps Guru 见解详细信息 - 建议

自动配置警报

开发人员和操作人员可以启用 Amazon DevOps Guru 来为其应用程序配置和设置警报。随着应用程序的发展和您采用新的服务,DevOps Guru 会自动识别新的资源并提取相关的指标和日志。然后,当发生偏离正常操作模式的情况时,它会发出警报,无需对规则和警报进行任何手动更新。

以最低的噪声检测最重要的问题

Amazon DevOps Guru 利用操作普遍可用的应用程序(如 Amazon.com)的多年经验,并使用经过内部 AWS 操作数据训练的机器学习(ML)模型,为影响应用程序的关键问题提供准确的操作洞察。

Amazon DevOps Guru Insights
Amazon DevOps Guru 见解

一键式部署,不需要部署和管理额外的软件

只需在 AWS 管理控制台中单击一下或通过一个 API 调用,您就可以为单个账户启用 Amazon DevOps Guru。Amazon DevOps Guru 还通过 AWS Organizations 集成支持多账户洞察可见性。启用后,Amazon DevOps Guru 可使用机器学习(ML)自动收集和分析应用程序指标、日志、事件,以及与正常操作模式偏离的行为等数据。无需部署或管理其他服务。

与 AWS 服务和第三方工具集成

Amazon DevOps Guru 与 Amazon CloudWatch、AWS Config、AWS CloudFormation 和 AWS X-Ray 原生集成,以发现并跟踪应用程序组件之间的连接和依赖关系。DevOps Guru 还与 AWS Systems Manager 和 Amazon EventBridge 集成。通过与 AWS Systems Manager 集成,您能够为 DevOps Guru 生成的每个见解在 OpsCenter 中自动接收 OpsItem。这样一来,您可以利用 OpsCenter 功能进一步查看、调查并更快地解决操作问题。 通过与 Amazon EventBridge 的集成,您可以设置路由规则以确定发送通知的对象,使用预定义的 DevOps Guru 模式仅发送通知或触发与该模式匹配的操作(例如,仅发送“新洞察已打开”),或创建自定义模式以发送通知。DevOps Guru 还与来自 PagerDuty 和 Atlassian 的第三方事故管理工具集成,这两个提供商能够从 DevOps Guru 中摄取 SNS 通知,因此您可以在他们的平台内自动管理事故。

DevOps Guru 设置
Amazon DevOps Guru 设置页面