发布于: Sep 15, 2022

今天,Amazon Web Services (AWS) 宣布正式推出 AWS 事故检测和响应,让 AWS Enterprise Support 客户能够为选择的工作负载进行主动式监控和事故管理。AWS 事故检测和响应旨在帮助您改进操作、提高工作负载弹性并加速从严重事故恢复。AWS 事故检测和响应利用 AWS 团队在内部使用且 AWS Managed Services (AMS) 在外部使用的经验证的运作、增强监控和事故管理功能。

要建立强大的基础来安全操作云中的工作负载,关键是拥有可观察的环境来跟踪正确的工作负载指标。AWS 事故检测和响应首先会审核工作负载的可靠性和卓越运营。AWS 专家会协助您明确关键指标和警报,让您更清楚地了解您的工作负载的应用程序和基础设施分层,从而能在事故期间轻松发现问题并划定优先级。AWS 事故管理工程师会持续监控您的工作负载,检测严重事故,并让合适的 AWS 专家与您通话,以加速工作负载恢复。所有事故均采用最高级别的严重性和上报来管理,AWS 将持续参与直到事故得到解决。在之前的事故中学到的经验可以帮助改进响应计划和工作负载架构,推动持续改进循环,进而提升工作负载弹性。

AWS 事故检测和响应英语版可用于在下列区域托管的工作负载:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、美国西部(北加利福尼亚)、加拿大(中部)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、欧洲地区(巴黎)、欧洲地区(斯德哥尔摩)、亚太地区(孟买)、亚太地区(东京)、亚太地区(新加坡)、亚太地区(首尔)、亚太地区(悉尼)、南美洲(圣保罗)。

AWS 事故检测和响应可供 AWS Enterprise Support 客户使用(需要额外收费),同时可供拥有 AWS Enterprise Support 的 AWS Managed Services 客户使用。有关更多信息,请访问 AWS 事故检测和响应网页