发布于: May 4, 2021

今天,我们宣布全面推出 (GA) Amazon DevOps Guru – 这是采用机器学习 (ML) 技术的一种服务,为您提供了一种更简单的方法来测量和改进应用程序的操作性能和可用性,并减少昂贵的停机时间。

Amazon DevOps Guru 应用得益于 Amazon.com 和 AWS 多年卓越运营经验的机器学习,自动收集和分析应用程序指标、日志、事件和跟踪等数据,从而识别偏离正常操作模式的行为(例如,计算容量预置不足、数据库 I/O 过度利用、内存泄漏等等)。当 Amazon DevOps Guru 识别出可能导致潜在停机或服务中断的异常应用程序行为(例如,延迟、错误率、资源约束等增加)时,它将通过 Amazon Simple Notification Service (SNS) 以及诸如 Atlassian Opsgenie 和 PagerDuty 之类的合作伙伴集成,向开发人员发出问题详细信息提醒,如所涉及的资源、问题时间线、相关事件等等。然后,DevOps Guru 会提供问题的潜在影响和可能原因,并提供有针对性的修复建议,从而减少解决问题所需的时间,所有这些都不需要手动设置或具备机器学习专业知识。

作为本次发布的一部分,我们将引入附加功能来帮助您提高应用程序的可用性。Amazon DevOps Guru 现在包括对 CloudWatch Agent Container Insights 的支持,并增强了对 EC2、EKS 和 ECS 的覆盖。我们还将推出经过改进的控制面板体验,除了现有的 CloudFormation Stacks 视图之外,您还可以基于资源查看系统运行状况摘要。

Amazon DevOps Guru 现已在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)、欧洲(法兰克福)、欧洲(斯德哥尔摩)、亚太地区(新加坡)、亚太地区(悉尼)以及亚太地区(东京)区域推出,未来数月将在更多区域推出。

您可以通过从 CloudFormation 堆栈或 AWS 账户中选择覆盖范围来开始使用 Amazon DevOps Guru。要了解更多信息,请访问 DevOps Guru 产品页面文档页面,或将问题发布到 Amazon DevOps Guru 论坛

您可以在使用 DevOps Guru Cost Estimator 为您的 AWS 账户或单个 CloudFormation 堆栈启用 DevOps Guru 之前或之后估算成本。