Amazon DevOps Guru

提高应用程序可用性的采用机器学习技术的云运营服务

Amazon DevOps Guru 是一种采用机器学习 (ML) 技术的服务,可用于轻松提高应用程序的操作性能和可用性。DevOps Guru 检测偏离正常操作模式的行为,这样您就可以在操作问题影响您的客户之前及早地识别出它们。

DevOps Guru 利用经过 Amazon.com 多年经验和 AWS 卓越运营训练的机器学习模型来识别异常的操作行为(例如延迟、错误率、资源限制增加等)并显示可能导致潜在停机或服务中断的关键问题。当 DevOps Guru 识别出一个关键问题时,它会自动发送警报,并提供相关异常的摘要、可能的根本原因以及关于问题发生时间和地点的上下文。在可能的情况下,DevOps Guru 还会提供如何修复问题的建议。

DevOps Guru 从您的 AWS 应用程序中自动提取操作数据,并提供单一控制面板来可视化您的操作数据问题。您可以通过从您的 CloudFormation 堆栈或 AWS 账户中选择覆盖范围来开始使用 DevOps Guru,以提高应用程序可用性和可靠性,无需人工步骤或机器学习专业知识。

7200 AWS 资源小时免费

资源组 A 和 B 均可享

可每月接收,为期 3 个月,通过 AWS 免费套餐使用

优势

2_icon_2_resolve_issues

自动检测操作问题

使用机器学习,Amazon DevOps Guru 可自动收集和分析应用程序指标、日志和事件等数据,以及与正常操作模式偏离的行为。它将自动检测并对操作问题和风险发出警报,例如即将发生的资源耗尽、可能导致停机、内存泄漏、计算容量预置不足和数据库 I/O 过度使用的代码和配置更改。

2_icon_1_auto_detect

利用采用机器学习技术支持的见解快速解决问题

Amazon DevOps Guru 通过将异常行为和操作事件关联起来,帮助减少识别和解决问题根本原因的时间。当问题发生时,DevOps Guru 会生成包含相关异常摘要、问题的上下文信息的见解,并在可能的情况下提供可操作的修复建议。

2_icon_3_easily_scale

轻松扩展并维护可用性

Amazon DevOps Guru 为您节省了手动更新静态规则和警报所涉及的时间和精力,从而使您可以有效地监控复杂且不断发展的应用程序。当您迁移或采用新的 AWS 服务时,DevOps Guru 会自动分析它们的指标、日志和事件。然后,它将生成见解,以帮助您轻松适应变化的行为和不断发展的系统架构。

2_icon_4_reduce_noise

减少噪声和警报疲劳


AmazonDevOps Guru 可通过使用预先训练好的机器学习模型来关联和对相关的异常进行分组,并显示最关键的警报,从而帮助开发人员和 IT 操作人员减少警报噪音、克服警报疲劳。使用 DevOps Guru,您可以减少管理多个监控工具和警报的需要,这意味着您可以专注于问题的根本原因和修复措施。

工作原理

Amazon-DevOps-Guru_Diagram-V1_news
4_promo_icon


利用 Amazon DevOps Guru 获取操作见解

使用案例

改善运营绩效和可用性

使用 Amazon DevOps Guru,您可以在操作事故发生前预防它们发生。DevOps Guru 将显现出可能不重要的中等和低严重程度发现结果,但如果放任不管,它会随着时间的推移而影响应用程序的可靠性。例如,DevOps Guru 将通知您已达到 Auto Scaling 组的限制、延迟模式发生更改或 API 调用量增加,以便您可以在这些问题变得危急之前解决它们。

动态发现新资源和指标

随着应用程序的发展和新的支持资源的添加,DevOps Guru 会为每个新指标学习模式,并向您发出关于操作问题的早期警告。您不再需要更新或修复错误配置的警报,因为 DevOps Guru 会从这些资源中提取指标并自动对它们进行分类。 

减少平均恢复时间 (MTTR)

通过利用 DevOps Guru 的操作见解,您可以快速诊断和修复问题。这些见解可以帮助您使用有关受影响的资源、相关异常的相关信息来减少停机时间,并提供关于如何使用上下文数据(如日志和相关事件)修复停机的建议。

积极的资源管理

使用 DevOps Guru,您可以确定内存、CPU 和磁盘空间等可消耗资源何时将超过预置的容量。DevOps Guru 持续地提取和分析在 AWS 上运行的资源和应用程序,并通过在控制面板中创建一个低噪音通知来帮助您避免即将发生的停机。

客户

SmugMug
“我们一直在寻找方法来减少团队花在解决操作问题上的时间,我们现在在使用 Amazon DevOps Guru,并利用其由 ML 提供支持的见解来帮助我们快速识别、关联和修复操作问题。利用 Amazon DevOps Guru 提供的见解,我们的团队现在可以快速找到问题,而不必从头开始寻找问题的根本原因。我们的 IT 团队已经显著降低了我们的平均恢复时间 (MTTR),他们节省了数小时的解决问题时间,同时确保我们的客户能获得最好的最终用户体验。”

- Anchal Gupta
DevOps 高级技术主管

Thomson Reuters
“客户体验和满意度是我们的头等大事。当接收到多个警报和监视事件源时,通过筛选噪声来识别影响客户的事件可能是一项具有挑战且耗时的工作。使用 Amazon DevOps Guru,我们能够利用其由 ML 提供支持的见解,提供清晰的行动路径,以减少——在很多情况下消除——问题对我们客户产生的影响。Amazon DevOps Guru 与 PagerDuty 的集成还提供了一条在正确的时间向正确的人快速高效地提供建议的直接路径,我们预计结果将显著减少操作停机时间。”

- Steve Thoennes
基础设施托管产品组合总监

605
“我们有十几个 AWS 账户和数万个资源需要监控。即使使用基础设施即代码服务并为这些服务创建动态警报,也很难管理和关联指标以快速解决问题。有了 Amazon DevOps Guru,我们相信,我们从跨多个服务关联的机器学习支持的指标中收到的警报和通知都是准确的。集成 Amazon DevOps Guru 只需要几分钟的时间,与数千个 AWS CloudFormation 堆栈集成是一件轻而易举的事情。Amazon DevOps Guru 提供了帮助我们专注于基础设施路线图的见解。”

- Jared Williams
DevOps 总监

合作伙伴

Atlassian
“Atlassian 很高兴客户在使用 Amazon DevOps Guru 来实施 AIOps 策略,以管理他们的云应用程序的操作性能。通过新的 Opsgenie 和 Jira Service Management 集成,当 Amazon DevOps Guru 发现一个潜在问题时,会立即通知适当的团队,并使用机器学习 (ML) 根据事件的严重程度对其进行优先级排序。这种集成确保每个团队都可以快速作出响应,使用 ML 支持的建议进行解决,并从每次事件中获得学习。”

- Emel Dogrusoz
Opsgenie 产品主管

了解如何通过集成 Amazon DevOps Guru 与 Atlassian Opsgenie 直接向待命团队提供运维见解。
PagerDuty
“PagerDuty 正在通过与 Amazon DevOps Guru 的新集成,进一步深化与 AWS 的合作关系。PagerDuty 的数字运营管理平台的建立是为了推动向 DevOps 文化的转变,我们很高兴能够通过这次集成继续兑现这一承诺。利用 DevOps Guru 的机器学习能力,PagerDuty 为我们的联合客户提供了更多的实时信号转行动功能。通过 PagerDuty 对 Amazon DevOps Guru 的 Amazon SNS 的提取,AWS 客户可以在操作问题变成影响客户的中断之前实时对其采取行动。”

- Jonathan Rende
产品 SVP

详细了解如何通过 PagerDuty 和 Amazon DevOps Guru 向您的待命团队提供由机器学习提供支持的运维见解

博客文章 >>

devops guru 1a

新的 Amazon DevOps Guru 有助于标识应用程序错误和修复

2020 年 12 月

Harunobu Kameda

阅读博客

devops guru 2

使用 AWS CloudFormation StackSets 轻松配置多个账户和区域中的 Amazon DevOps Guru

2020 年 12 月

Nikunj Vaidya 和 Nuatu Tseggai

阅读博客

devops guru reinvent thumbnail

Amazon Web Services re:Invent 2020:通过使用 Amazon DevOps Guru 的、由机器学习提供支持的见解提高应用程序可用性

2020 年 12 月

Jacob Sullivan

观看网络研讨会

devops guru 4

Amazon DevOps Guru 由可对运维卓越性进行编码的经过预先训练的机器学习模型提供支持。

2020 年 2 月

Caner Turkmen、Ravi Turlapati 和 Tim Januschowski

阅读博客

7_bottom_promo_icon

自动执行代码审查
通过 Amazon CodeGuru 更快、更早地发现代码问题

Standard Product Icons (Features) Squid Ink
查看产品功能

轻松提高应用程序的操作性能和可用性

了解更多 
Sign up for a free account
注册免费账户

立即享受 AWS 免费套餐。 

注册 
Standard Product Icons (Start Building) Squid Ink
开始在控制台中构建

在 AWS 管理控制台中,使用 Amazon DevOps Guru 开始构建。

登录