如何阻止 AWS OpsWorks Stacks 意外重新启动正常运行的实例？

2 分钟阅读

即使我的 Amazon Elastic Compute Cloud (Amazon EC2) 实例通过了 Amazon EC2 运行状况检查，AWS OpsWorks Stacks 也会重新启动这些实例。为什么会出现这种情况，我要如何阻止？

简短描述

如果 OpsWorks Stacks 自动修复功能已激活，并且该服务确定其管理的实例出现故障，则会出现以下某种情况：

如果实例由 Amazon Elastic Block Store (Amazon EBS) 提供支持，那么 OpsWorks Stacks API 会停止出现故障的实例并重新启动。
如果实例由 Amazon EC2 实例存储提供支持，那么实例将被终止。然后，当 OpsWorks Stacks 再次启动实例时会重新创建实例。
如果实例在 OpsWorks Stacks 中注册并且在本地部署，则实例的状态将更改为连接中断，但不会重新启动。

要防止 OpsWorks Stacks 自动修复它管理的实例，请首先按照本文中的故障排查步骤进行操作。如果问题仍然存在，您也可以在 OpsWorks Stacks 层的常规设置中关闭自动修复功能。

有关更多信息，请参阅 AWS OpsWorks 调试和故障排查指南中的实例意外重新启动。

如果 Amazon EC2 实例失去与 OpsWorks Stacks 服务的连接，那么 OpsWorks Stacks 会将该实例视为出现故障。

要确认您的 Amazon EC2 实例是否可以访问互联网，请进行以下操作：

当没有足够的实例级别资源来允许 OpsWorks 代理发送 Keepalive 信号时，OpsWorks Stacks 会将实例视为出现故障。

要查看实例的指标，请按照使用 Amazon CloudWatch 来监控堆栈中的说明进行操作。

要设置警报以便在实例的 CPU、内存或网络流量负载较高时提醒您，请参阅创建 Amazon CloudWatch 警报。

**注意：**如果您在运行 AWS Command Line Interface (AWS CLI) 命令时收到错误消息，请确保您使用的是最新版本的 AWS CLI。

如果在 Amazon EC2 控制台中停止了 OpsWorks Stacks 托管的实例，那么 OpsWorks Stacks 会停止接收来自 OpsWorks 代理的 Keepalive 信号。然后，OpsWorks Stacks 会将实例视为出现故障。

要确认您的实例是否在 Amazon EC2 控制台中停止，请尝试在 OpsWorks Stacks 控制台中停止实例。如果实例处于 stop_failed 状态，并且您收到内部错误消息，则表示实例已在 Amazon EC2 控制台中停止。

当实例在 Amazon EC2 控制台中停止之后，要在 OpsWorks Stacks 中停止该实例，请运行 AWS CLI stop-instance 命令。

**重要提示：**stop-instance 命令必须包含此使用案例的 --force 参数。

OpsWorks Stacks 仅支持 IMDSv1，不支持 IMDSv2。如果 OpsWorks Stacks 托管的实例使用 IMDSv2，那么 OpsWorks Stacks 会将实例视为出现故障。

要检查您的实例使用的元数据服务并在需要时重新配置实例，请参阅配置实例元数据选项。