发布于: Nov 8, 2021

您现在可以创建并运行 AWS Fault Injection Simulator (FIS) 实验,以检查 Amazon CloudWatch 告警的状态,并运行 AWS Systems Manager (SSM) Automations。您现在还可以运行新的 FIS 实验操作,使用预先配置的 SSM Agent 文档将输入/输出、网络黑洞和丢包故障注入 Amazon EC2 实例。无论是在测试环境还是在生产环境中,都很难预测应用程序在真实环境下将对压力有何反应,因此将告警检查和自动运行手册集成到 FIS 实验中可以帮助您在注入中断事件(如网络问题、实例终止、API 节流或其他故障条件)时更加从容。

首先,新的 CloudWatch 操作允许您断言 CloudWatch 告警的状态,作为 FIS 实验工作流的一部分。然后,当实验运行时,该操作将验证告警是否处于预期状态:是 OK、ALARM 还是 INSUFFICIENT_DATA。例如,您可以使用该操作来检查前一个操作(如网络延迟注入)的影响是否已经生效,然后再继续进行实验中的下一个操作(如 EC2 实例重新启动)。

接下来,您现在可以在 FIS 实验中执行 AWS Systems Manager Automation 运行手册AWS Systems Manager Automation 允许您构建和运行自动化以执行各种常见任务,例如创建和删除 EC2 AMI 或 CloudFormation 模板、删除 S3 存储桶、运行 AWS Step Function 状态机、调用 AWS Lambda 函数、创建标签、启动 EC2 实例或发出 AWS API 请求。通过配置可以从 FIS 实验中触发的自动化运行手册,您可以更轻松、安全、可重复地重新创建更接近真实世界条件的复杂故障条件。

最后,现在还提供有多种全新和更新的 SSM Agent 文档,可以作为故障注入操作来运行,包括:一种 IO 压力操作;一种网络黑洞操作,用于丢弃给定协议和端口的入站或出站流量;一种网络延迟操作,通过给定的网络接口向或从指定的源(如 IP 地址/数据块、域或 AWS 服务,包括 S3 和 DynamoDB)添加延迟和/或抖动;以及两种网络丢包操作,可以将丢包故障注入给定接口和(可选)源。这些 SSM 文档可以为运行 Amazon Linux 和 Ubuntu 的 EC2 实例预先配置。

您可以在 AWS 管理控制台中或使用 AWS SDK 开启创建和运行故障注入实验,这些新功能现均即日起可用。所有 AWS 商业区域均提供 AWS FIS。