跳至主要内容

AWS DevOps Agent

AWS DevOps Agent(预览版)

借助解决和主动预防事件的前沿代理,推动卓越运营

为何选择 AWS DevOps Agent?

AWS DevOps Agent 是一款前沿代理,可解决并主动预防事件,持续提高可靠性和性能。AWS DevOps Agent 像经验丰富的 DevOps 工程师一样调查事件并确定运营改进:通过学习您的资源及其关系,使用您的可观测性工具、运行手册、代码存储库和 CI/CD 管道,同时关联所有这些资源的遥测、代码和部署数据,以了解应用程序资源之间的关系,包括多云和混合环境中的应用程序。DevOps Agent 利用对运营和工作负载的深入了解,缩短解决问题的平均时间(MTTR),同时推动卓越运营。

优势

AWS DevOps Agent 是您全天候待命的自主值班工程师。无论是在凌晨 2 点还是在高峰时段,该代理都会在警报触发时立即启动调查,以快速将应用程序恢复至最佳性能状态。AWS DevOps Agent 全天候自主处理事件,提供根本原因分析及解决方案。其利用对应用程序资源及关系的理解,快速掌握依赖关系和交互。AWS DevOps Agent 通过首选的通信渠道(如 Slack、ServiceNow 和 PagerDuty)自动路由观察结果、调查发现及缓解步骤,从而简化事件响应。

AWS DevOps Agent 分析历史事件的模式,提供切实可行的建议,从而强化四大关键领域:可观测性、基础设施优化、部署管道增强以及应用程序弹性。例如,在基础设施优化领域,如果遇到意外流量激增的情况,AWS DevOps Agent 可能会建议为 EKS 集群启用 Kubernetes Horizontal Pod Autoscaler(HPA),以实现更优的流量分配。

AWS DevOps Agent 通过安全地集成工作流程、可观测性工具、运行手册、代码存储库和 CI/CD 管道,使您能够访问运营数据中尚未开发的见解。AWS DevOps Agent 提供与可观测性工具(如 Amazon CloudWatch、Dynatrace、Datadog、New Relic 和 Splunk)以及代码存储库和 CI/CD 管道(如 GitHub 和 GitLab)的内置集成。您可以通过连接自有 MCP 服务器,将 AWS DevOps Agent 的集成能力扩展至其内置功能之外,从而实现与更多工具的集成,例如您组织的自定义工具、专业平台或专有工单系统。 

客户

澳大利亚联邦银行

澳大利亚联邦银行是澳大利亚领先的综合金融服务提供商之一,为超过 1700 万客户提供服务。该银行的云基础小组管理着超过 1700 个 AWS 账户,并为数千名工程师提供集中式云操作服务。对下一代内部平台进行原型设计时,该团队复制复杂的网络和身份管理问题,以测试 AWS DevOps Agent。经验丰富的 DevOps 工程师可能需要数小时才能确定这些类型的问题,而代理 15 分钟内即可查找到根本原因。“AWS DevOps Agent 如同经验丰富的 DevOps 工程师般思考与行动,助力我们的工程师构建更快速、更具弹性的银行基础设施,旨在为客户提供更出色的体验。这不仅关乎缩短问题解决时间,还关系到维持客户对我们的信任。”

“AWS DevOps Agent 与现有的企业工具(包括 ServiceNow、Splunk 以及自定义 MCP 服务器)无缝集成,使其对我们的运营更具价值。对于 CBA 而言,这将带来重大机遇。我们正在探索如何将其扩展至所有平台团队,并帮助每位内部客户充分利用这些功能。通过 Grafana 和 Prometheus 与我们现有 SLO 进行集成的能力,使其对我们的运营更具价值。AWS DevOps Agent 正助力我们为数百万澳大利亚人构建更具弹性、更高效的银行基础设施。”

澳大利亚联邦银行云服务主管 Jason Sandery

Missing alt text value

西部州长大学

“在 WGU,约 20 万学生依赖全天候在线学习,因此系统的可靠性对其学业成就至关重要。为更好地服务学生,我们已在生产环境中实施集成 Dynatrace 的 AWS DevOps Agent,初步成效显著。如果第三方 API 依赖关系、网络问题或应用程序级错误导致性能问题,Dynatrace 会立即检测到这些问题,而 AWS DevOps Agent 将自主分析整个技术堆栈,精准定位根本原因。

该服务为我们的基础设施提供全面的可观测性,通过统一解决方案让我们能够洞察外部服务依赖关系、网络性能和应用程序行为。对于一所致力于提供无障碍教育的大学而言,这种更深入的见解和更快速的问题解决能力意味着学习体验不会中断。过去需要我们团队手动在多个系统间关联数据的工作,如今已实现自动化处理,这使得精益的 IT 团队能够专注于战略性举措,而非耗费精力在故障排查上。随着我们扩大规模,为更多学生提供服务,这种增强的可观测性确保我们保持学生成功所必需的可靠性。”

Nate Cummings, Sr.西部州长大学基础设施总监

Missing alt text value

Deriv

“Deriv 是全球最大的在线经纪商之一,为全球超过 300 万交易者提供服务。Deriv 在其屡获殊荣的直观交易平台上提供丰富的交易类型,涵盖热门市场上的 300 多种资产。在 Deriv,我们凭借技术创新铸就 25 年的辉煌历程,如今更在全公司范围内践行人工智能优先的战略方针。随着我们持续推进这一转型,AWS DevOps Agent 标志着我们管理基础设施方式的自然演进。AWS DevOps Agent 的智能自动化能力将助力我们的团队实现从被动事件响应到主动系统优化的转变,这在需要跨多个监管辖区维护全天候交易服务的复杂场景中尤为重要。上下文智能功能将使我们的工程团队能够快速评估系统关系和依赖性,从而缩短影响客户交易的问题的平均解决时间。与现有 AWS 和第三方工具链的无缝集成,以及 AWS DevOps Agent 学习我们的运营模式的能力,都符合我们使用人工智能提升工程效率和提供卓越客户体验的理念。”

Deriv 工程高级经理 Najib Huq

Missing alt text value

Dhan.co

“Dhan 是领先的股票、期权、期货及大宗商品在线交易平台,为超过 120 万活跃客户提供服务,每日处理交易量逾 900 万笔。对于我们这样的受监管交易平台而言,保持高可用性至关重要。我们期待 AWS DevOps Agent 的自动化分析和上下文相关建议能帮助我们的团队确保服务交付的一致性。该代理在遵守合规标准的同时,能够从我们运营模式中学习的能力,将在我们延长交易时段(从市场开盘到深夜交易时段)展现出特别的价值。我们预计 AWS DevOps Agent 将增强我们维护可靠交易基础设施的能力,并满足严格的金融服务要求。AWS DevOps Agent 与我们现有的监控堆栈集成后,将帮助我们整合多个系统的警报并简化我们的运营流程。”


Dhan(Raise Holdings)联合创始人兼首席技术官 Alok Pandey

Missing alt text value

皇家墨尔本理工大学

“事实证明,AWS DevOps Agent 会成为皇家墨尔本理工大学实现零接触工程的变革性工具。作为一所享誉全球的知名学府,我们为超过 105000 名学生及 12000 名教职员工与研究人员提供服务,不断拓展云创新的界限。AWS DevOps Agent 的卓越之处在于其能够对整个登录区拓扑进行推理,将工作负载、网络和管理账户之间的关系理解为紧密关联的生态系统。我们已通过测试和观察,该工具能在数分钟内剖析复杂的部署问题,识别出通常需要跨多个团队进行大量人工排查的网络通信问题和依赖冲突。这种级别的智能自动化将使我们的故障排除周期从 4-7 小时缩短至 30 分钟以内。我们正在此处构建主动、智能且日益自主的云运营未来。”

皇家墨尔本理工大学云工程高级经理 Ken Mirvis

Missing alt text value

使用案例

事件响应及解决

AWS DevOps Agent 自主对事件进行分类处理,并引导团队快速解决问题。 AWS DevOps Agent 与可观测性工具、代码存储库和 CI/CD 管道集成,以关联和分析遥测、代码和部署数据,同时共享其假设、观察结果与调查发现。通过系统性调查,AWS DevOps Agent 可识别整个环境中由系统变更、输入异常、资源限制、组件故障及依赖关系问题而引发的问题的根本原因。

自动化事件协调

您可以使用交互式聊天发起并引导调查。AWS DevOps Agent 如同您运营团队的一员,直接在 ServiceNow 和 Slack 等协作工具中工作,共享调查发现并协调响应措施。有需要时,可直接从调查中创建 AWS Support 案例,为 AWS Support 专家提供即时上下文信息,从而加快问题解决速度。

预防未来运营事件

AWS DevOps Agent 分析历史事件的模式,提供切实可行的建议,从而强化四大关键领域:可观测性、基础设施优化、部署管道增强以及应用程序弹性。 

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。