J'ai reçu une notification m'indiquant qu'Amazon EC2 avait détecté une dégradation du matériel sous-jacent hébergeant mon instance EC2. Que dois-je faire ?

Dernière mise à jour : 08/10/2020

J'ai reçu un avis indiquant qu'il y avait une dégradation du matériel sous-jacent hébergeant mon instance Amazon Elastic Compute Cloud (Amazon EC2). Que dois-je faire ?

Brève description

En cas de dysfonctionnement matériel, Amazon EC2 baliser le matériel spécifique comme défectueux. Toutes les instances qui s'exécutent sur l'hyperviseur du matériel défectueux sont déplacées vers du matériel sain. Pendant la transition vers un nouveau matériel, les instances basées sur Amazon EBS sont arrêtées et les instances basées sur le stockage d'instance sont arrêtées. Amazon EC2 vous envoie une notification par e-mail, et via votre Tableau de bord d'état personnel, pour vous informer de la dégradation du matériel et de l'arrêt ou de la résiliation imminente de l'instance.

Remarque : les instances lancées à partir d'un groupe Auto Scaling Amazon EC2 peuvent se résilier dès que la vérification de l'état du système de l'instance échoue. Si cela se produit, le groupe Auto Scaling Amazon EC2 lance de nouvelles instances de remplacement. Lorsque vous recevez une notification relative à une dégradation matérielle de la part d'Amazon EC2, l'instance d'origine n'est pas visible dans votre tableau de bord. Vous pouvez consulter le fichier journal AWS CloudTrail correspondant pour en savoir plus sur l'arrêt de cette même instance. Pour obtenir des informations supplémentaires sur la vérification de l'état d'une instance à partir des journaux AWS CloudTrail, consultez la section Comment puis-je consulter les journaux AWS CloudTrail pour savoir si des appels d'API ont entraîné l'exécution, l'arrêt, le redémarrage et la désactivation d'instances EC2 ?.

Résolution

Si vous recevez un avis de dégradation du matériel, vous pouvez arrêter et démarrer manuellement l'instance à l'aide de la console Amazon EC2 ou de l'interface de ligne de commande AWS (CLI AWS). L'arrêt entraîne la suppression de l'instance du matériel défaillant. Le redémarrage de l'instance entraîne son lancement sur le matériel fonctionnant correctement.

Remarque : si vous recevez des erreurs lors de l'exécution des commandes AWS CLI, assurez-vous que vous utilisez la version la plus récente d'AWS CLI.

Arrêt et redémarrage de l'instance

Remarque : un arrêt suivi d'un redémarrage n'est pas équivalent à une réinitialisation. Un redémarrage est nécessaire pour transférer l'instance sur le matériel fonctionnant correctement.

Important :

  • cette procédure nécessite d'arrêter et de redémarrer votre instance EC2. Les données stockées sur cette dernière sont perdues dans une telle situation. Si votre instance est basée sur le stockage d'instance ou si des volumes de stockage d'instance contiennent des données, les données sont perdues lorsque l'instance est arrêtée. Pour plus d'informations, consultez Déterminer le type de périphérique racine de votre instance.
  • Si votre instance fait partie d'un groupe Amazon EC2 Auto Scaling ou si votre instance est lancée par des services qui utilisent AWS Auto Scaling, tels qu'Amazon EMR, AWS CloudFormation, AWS Elastic Beanstalk, etc., l'arrêt de l'instance pourrait résilier l'instance. Dans ce cas, la désactivation dépend des paramètres de protection définis pour votre groupe Auto Scaling. Si votre instance fait partie d'un groupe Auto Scaling, supprimez-la temporairement de ce dernier avant de suivre les étapes de résolution.
  • L'arrêt et le redémarrage de l'instance entraînent la modification de son adresse IP publique. Il est recommandé d'utiliser une adresse IP Elastic, et non une adresse IP publique, lors de l'acheminement du trafic externe vers votre instance.

Pour arrêter et redémarrer l'instance, procédez comme suit :

  1. Ouvrez la console Amazon EC2, puis sélectionnez l’instance.
  2. Sélectionnez Actions, État de l'instance, puis Arrêter.
  3. Sélectionnez Oui, arrêter.
    Remarque : si votre instance est bloquée à l'état En cours d'arrêt, vous pouvez forcer son arrêt. Pour plus d'informations sur l'arrêt d'une instance bloquée à l’état En cours d'arrêt, consultez Résolution des problèmes liés à l'arrêt de votre instance.
  4. Sélectionnez à nouveau l'instance.
  5. Sélectionnez Actions, État de l'instance, puis Démarrer.
  6. Sélectionnez Oui, démarrer.

Remarque : la notification relative à une dégradation matérielle demeure dans votre tableau de bord, accompagnée de l'état Terminé, jusqu'à la date d'arrêt ou de fin indiquée dans la notification.

(Facultatif) Configurer la récupération d'instance pour vos instances

Vous pouvez créer une alarme Amazon CloudWatch qui vous permet de récupérer automatiquement les instances présentant une dégradation matérielle. Pour savoir comment configurer l’alarme CloudWatch, consultez Récupérer votre instance.</p


Cet article vous a-t-il été utile ?


Besoin d'aide pour une question technique ou de facturation ?