Mon instance EC2 Linux a échoué à son contrôle de statut du système. Comment puis-je résoudre ce problème ?

Date de la dernière mise à jour : 02/06/2020

Mon instance Amazon Elastic Compute Cloud (Amazon EC2) a échoué à son contrôle de statut du système et n'est plus accessible. Comment résoudre les problèmes de contrôle de statut du système ?

Courte description

Les échecs de contrôle de statut du système indiquent qu'il y a un problème avec le matériel hébergeant votre instance EC2.

Solution

L'instance doit être migrée vers un nouvel hôte sain en arrêtant et en redémarrant l'instance. Vous pouvez attendre qu'Amazon EC2 procède à l'arrêt et au redémarrage de votre instance. Vous pouvez également arrêter et redémarrer manuellement l'instance pour la migrer vers un nouvel hôte sain.

Remarque : un arrêt suivi d'un redémarrage n'est pas équivalent à une réinitialisation. Un redémarrage est nécessaire pour transférer l'instance sur le matériel fonctionnant correctement.

Avertissement : avant d'arrêter et de démarrer votre instance, assurez-vous de bien comprendre les informations suivantes :

  • Les données de stockage d'instance sont perdues lorsque vous arrêtez et démarrez une instance. Les données sont perdues lorsque vous arrêtez l'instance si votre instance est basée sur le stockage d'instance ou dispose de volumes de stockage d'instance contenant des données. Pour plus d'informations, consultez la sectionIdentification du type de dispositif racine de votre instance.
  • L'arrêt de l'instance peut mettre fin à l'instance si votre instance fait partie d'un groupe Auto Scaling d'Amazon EC2. Votre instance peut faire partie d'un groupe Auto Scaling d'AWS si vous l'avez lancée avec Amazon EMR, AWS CloudFormation ou AWS Elastic Beanstalk. Dans ce cas, la mise hors service dépend des paramètres de protection des instances définis pour votre groupe Auto Scaling. Si votre instance fait partie d'un groupe Auto Scaling, supprimez-la temporairement du groupe avant d'exécuter les étapes de résolution.
  • L'arrêt et le redémarrage de l'instance entraînent la modification de son adresse IP publique. Il est recommandé d'utiliser une adresse IP Elastic, et non publique pour l'acheminement du trafic externe vers votre instance. Si vous utilisez Route 53, il peut être nécessaire de mettre à jour les enregistrements DNS Route 53 lorsque l'adresse IP publique change.
  • Si le comportement d'arrêt de l'instance est défini sur Résilier, l'instance sera résiliée en l'arrêtant à partir du système d'exploitation à l'aide de la commande shutdown ou poweroff. Pour éviter cela, modifiez le comportement d'arrêt de l'instance.

Très rarement, le problème lié à la couche de l'infrastructure peut empêcher l'hôte sous-jacent de répondre aux appels d'API d'arrêt et de démarrage. Ainsi, l'instance reste bloquée à l'arrêt. Pour obtenir des instructions sur comment forcer l'arrêt de l'instance, consultez la section Résolution des problèmes d'arrêt de votre instance.

Vous pouvez créer une alarme Amazon CloudWatch qui surveille et récupère automatiquement l'instance EC2 suite à des problèmes impliquant une défaillance du matériel sous-jacent.