Comment puis-je empêcher AWS OpsWorks Stacks de redémarrer inopinément les instances saines ?

Lecture de 4 minute(s)

AWS OpsWorks Stacks redémarre mes instances Amazon Elastic Compute Cloud (Amazon EC2) même si les instances passent avec succès les surveillances de l'état Amazon EC2. Pourquoi cela se produit-il et comment puis-je résoudre le problème ?

Brève description

Si les fonctions de réparation automatique OpsWorks Stacks sont activées et que le service détermine qu'une instance qu'il gère échoue, il en résultera l'une des situations suivantes :

Si l'instance est soutenue par Amazon Elastic Block Store (Amazon EBS), l'API OpsWorks Stacks arrête et démarre l'instance défectueuse.
Si l'instance est soutenue par un stockage d'instances Amazon EC2, l'instance est résiliée. Ensuite, l'instance est recréée lorsque OpsWorks Stacks la redémarre.
Si l'instance est enregistrée avec une pile OpsWorks et qu'elle est sur site, le statut de l'instance est modifié en connexion perdue mais elle n'est pas redémarrée.

Pour empêcher OpsWorks Stacks de réparer automatiquement les instances qu'il gère, suivez tout d'abord les étapes de dépannage présentes dans cet article. Si le problème persiste, vous pouvez également désactiver la réparation automatique dans les paramètres généraux de la couche OpsWorks Stacks.

Pour plus d'informations, consultez la section Redémarrage inopiné des instances dans le guide de débogage et de dépannage AWS OpsWorks.

Résolution

Vérifiez que les instances Amazon EC2 gérées par OpsWorks Stacks disposent d'un accès Internet

Si une instance Amazon EC2 perd sa connexion au service OpsWorks Stacks, alors OpsWorks Stacks traite l'instance comme ayant échoué.

Pour vérifier que vos instances Amazon EC2 disposent d'un accès Internet, procédez comme suit :

Assurez-vous que vos instances ont accès à Internet via une passerelle Internet ou une passerelle de traduction d’adresses réseau (NAT).
Vérifiez que l'accès HTTPS entrant est autorisé via le port 443 au niveau de l'instance, du groupe de sécurité et de la liste de contrôle d'accès réseau (ACL réseau).

Pour résoudre les problèmes de connectivité de passerelle NAT, consultez la section Pourquoi mes instances EC2 ne peuvent-elles pas accéder à Internet à l'aide d'une passerelle NAT ?

Pour résoudre les problèmes de connectivité de passerelle Internet, consultez la section Pourquoi mon instance Amazon EC2 ne peut-elle pas se connecter à Internet à l'aide d'une passerelle Internet ?

Vérifiez que votre application dispose de suffisamment de mémoire et de capacité CPU au niveau de l'instance pour fonctionner lorsque l'instance est soumise à une charge supplémentaire

Lorsqu'il n'y a pas assez de ressources au niveau de l'instance pour permettre à l'agent OpsWorks d'envoyer son signal keepalive, OpsWorks Stacks traite l'instance comme ayant échoué.

Pour consulter les métriques de vos instances, suivez les instructions de la section Surveillance des piles à l'aide d'Amazon CloudWatch.

Pour définir des alarmes afin de vous avertir si votre instance dispose d'une charge élevée de CPU, de mémoire ou de trafic réseau, consultez la section Création d'alarmes Amazon CloudWatch.

Vérifiez que l'instance Amazon EC2 n'a pas été arrêtée en dehors de la console OpsWorks Stacks ou de l'API OpsWorks Stacks

Remarque : si vous recevez des erreurs lors de l'exécution de commandes de l’interface de la ligne de commande AWS (AWS CLI), assurez-vous d'utiliser la version la plus récente de l'AWS CLI.

Si une instance gérée par OpsWorks Stacks est arrêtée dans la console Amazon EC2, OpsWorks Stacks cesse de recevoir le signal keepalive de l'agent OpsWorks. OpsWorks Stacks traite alors l'instance comme ayant échoué.

Pour vérifier si votre instance a été arrêtée dans la console Amazon EC2, essayez de l'arrêter dans la console OpsWorks Stacks. Si l'instance est dans l'état stop_failed et que vous recevez un message d'erreur interne, l'instance a été arrêtée dans la console Amazon EC2.

Pour arrêter une instance dans OpsWorks Stacks après son arrêt dans la console Amazon EC2, exécutez la commande stop-instance de l'AWS CLI.

Important : la commande stop-instance doit inclure le paramètre --force pour ce cas d'utilisation.

Pour plus d'informations, consultez Comment résoudre les problèmes « d'erreur interne » lors de l'arrêt d'une instance AWS OpsWorks Stacks dans l'état « stop_failed » ?

Vérifiez que l'instance Amazon EC2 utilise l'Instance Metadata Service Version 1 (IMDSv1)

OpsWorks Stacks prend en charge uniquement IMDSv1, et non IMDSv2. Si une instance gérée par OpsWorks Stacks utilise IMDSv2, OpsWorks Stacks traite l'instance comme ayant échoué.

Pour vérifier le service de métadonnées utilisé par votre instance et pour reconfigurer l'instance si nécessaire, consultez la section Configurer les options de métadonnées d'instance.

Informations connexes

Qu'est-ce qu'Amazon CloudWatch Logs ?

Redémarrage inopiné des instances

Surveillance d’AWS Systems Manager

Sujets

Gestion et gouvernance

Balises

AWS OpsWorks

Langue

Français

AWS OFFICIELA mis à jour il y a 3 ans

Aucun commentaire

Contenus pertinents

AWS & OpenStack
Cedric
demandé il y a 9 mois
Fonction Lambda : 15 tests et toujours le même statut "Statut failed" avec toujours le même message d'erreur...
BrunoAWSLambda
demandé il y a 6 mois
Problème de facturation au niveau des instances réservée
Kevin
demandé il y a 5 mois
AWS Bare Metal Instances
stellabitchebe
demandé il y a 4 mois
Problème d'ajout d'IP V4 Publique secondaire sur une instance
Stephan
demandé il y a 4 mois
Comment surveiller les journaux de plusieurs instances Amazon EC2 dans AWS OpsWorks Stacks ?
AWS OFFICIELA mis à jour il y a 3 ans
Comment puis-je résoudre les problèmes d'erreur interne lors de l'arrêt d'une instance AWS OpsWorks Stacks dans l'état « stop_failed » ?
AWS OFFICIELA mis à jour il y a 3 ans
Comment savoir ce qui a arrêté mon instance AWS OpsWorks Stacks ?
AWS OFFICIELA mis à jour il y a 3 ans
Pourquoi mon instance AWS OpsWorks Stacks ne démarre-t-elle pas et reste-t-elle dans l'état « start_failed » ?
AWS OFFICIELA mis à jour il y a 2 ans