发布于: May 19, 2022

Incident Manager 是 AWS Systems Manager 的一项功能,宣布扩展对 Runbook 自动化的支持,从而加速事故诊断和解决。AWS Systems Manager 是 AWS 应用程序和资源的运营中心,帮助您自动化响应流程,从而快速诊断和修复运营问题。客户现在可以构建自动在相关资源上运行修复操作的事故 Runbook,例如在联系待命工程师之前为接近容量的 DynamoDB 表开启自动扩缩。客户还可以直接从 Incident Manager 控制台调用其他 Runbook,从而帮助更快速地解决事故。

当发生事故时,Incident Manager 现在可以填充 CloudWatch 告警和 EventBridge 事件中指定的 Runbook 参数值,例如事故 ID 或 AWS 资源。这赋能客户自动化 AWS Systems Manager Automation 文档中的其他诊断或迁移操作。Incident Manager 控制台跟踪 Runbook 进度和其他 Runbook 执行,从而使您的响应有条不紊。

要开始使用,请从 AWS 管理控制台选择 Incident Manager 或导航到 AWS Systems Manager。要详细了解 Incident Manager 中的 Runbook 自动化,请阅读我们的文档或者按照教程操作。