为什么我的 EC2 Windows 实例停机,并且存在系统状态检查失败或状态检查 0/2?

上次更新时间:2021 年 6 月 22 日

我的 Amazon Elastic Compute Cloud (Amazon EC2) Windows 实例突然停机,无法再访问了。一项或两项系统状态检查失败。发生了什么情况,如何解决此问题?

简短描述

Amazon Web Services (AWS) 使用两种状态检查监控每个 EC2 实例的运行状况。如果状态检查失败,则 EC2 实例将无法访问。

系统状态检查失败指示您的实例在其上运行的 AWS 系统存在问题。当底层主机的问题影响生产时,您可以停止后再启动该实例,以从当前底层主机迁移。

解决方法

EC2 资源是特定于区域的。检查 AWS Service Health Dashboard,了解您的实例所在的 AWS 区域内的服务中断。查看中断和状态更新,以确认该问题是否位于 AWS 端。

如果没有中断,则执行以下步骤:

警告:停止实例之前,您需要注意以下事项:

  • 如果您没有使用弹性 IP 地址,则当您停止实例时,将会释放公有 IP 地址。
  • 如果此实例具有实例存储卷,当实例停止时,卷上的任何数据都将丢失。
  • 如果实例关闭行为设置为 Terminate(终止),则实例停止时将会终止。
  • 如果实例属于 Auto Scaling 组,请先从 Auto Scaling 组分离该实例。在您停止并启动实例后,重新将该实例附加到 Auto Scaling 组。

如需了解更多信息,见停止和启动您的实例以及如何重启 Amazon EC2 Auto Scaling 组中的实例?

1.    停止该实例。

注意:如果实例卡在停止状态,则使用 Amazon EC2 控制台或 AWS Command Line Interface (AWS CLI) 强制停止实例。此操作最长可能需要 10 分钟。有关更多信息,请参阅排查实例的停止问题

如果在运行 AWS CLI 命令时收到错误,请确保您使用的是最新版本的 AWS CLI

2.    启动实例。在大多数情况下,实例在运行状况良好的新底层主机服务器上启动。

注意:您可以为 EC2 Windows 实例配置自动恢复。有关更多信息,请参阅以下内容:

如何使用 CloudWatch 警报和 SNS 监控 EC2 实例的自动恢复?

如何设置 CloudWatch 告警以自动恢复我的 EC2 实例?