Comment puis-je résoudre les problèmes courants entraînant le non-fonctionnement de mon instance Lightsail ?

Date de la dernière mise à jour : 12/10/2021

Mon instance Amazon Lightsail ne répond pas. Quelles sont les raisons les plus courantes à cela et comment puis-je résoudre ces problèmes ?

Brève description

Si votre instance ne répond pas, passez en revue les métriques de vérification du statut de l'instance pour déterminer les étapes en vue de la résolution des problèmes. Amazon Lightsail surveille l'état de chaque instance via deux vérifications du statut :

Vérification du statut du système : la vérification du statut du système détecte les problèmes liés à l'hôte sous-jacent sur lequel votre instance s'exécute. Si l'hôte sous-jacent ne répond pas ou est inaccessible en raison de problèmes réseau, matériels ou logiciels, cette vérification de statut échoue.

Vérification du statut de l'instance : l'échec de la vérification du statut de l'instance indique un problème concernant l'instance en raison d'erreurs au niveau du système d'exploitation. Les erreurs au niveau du SE sont les suivantes :

  • Échec du démarrage du système d'exploitation.
  • Échec du montage correct des volumes.
  • Problèmes liés au système de fichiers.
  • Pilotes non compatibles.
  • Panique du noyau.

Les vérifications du statut d’une instance peuvent également échouer en raison d'une sur-utilisation des ressources. Voici les trois principales raisons pour lesquelles la surveillance de l’état peut échouer en raison d'une sur-utilisation des ressources :

  • Votre instance peut fonctionner dans la zone à capacité extensible lorsqu'elle est soumise à une charge importante. Ceci peut entraîner le non-fonctionnement de l’instance ou des incidents.
  • Le dispositif racine est plein à 100 % et l'instance se bloque lors du démarrage.
  • Les processus en cours d'exécution sur l'instance utilisent toute sa mémoire, ce qui empêche l'exécution du noyau.

Solution

Affichez les métriques de vérification du statut de votre instance afin de déterminer si la vérification du statut du système ou de l'instance a échoué.

Échec de vérification du statut du système

Si la vérification du statut du système échoue, l’instance doit être migrée vers un nouvel hôte sain en arrêtant, puis en démarrant l’instance. Vous pouvez aussi arrêter et démarrer manuellement l'instance pour la migrer vers un nouvel hôte sain.

Remarque : un arrêt suivi d'un démarrage n'est pas équivalent à une réinitialisation. Un démarrage est nécessaire pour transférer l'instance sur le matériel fonctionnant correctement.

Avertissement : avant d'arrêter et de démarrer votre instance, sachez que l'adresse IP publique de l'instance est modifiée à chaque arrêt et démarrage de l'instance. Si vous souhaitez bénéficier d’une adresse IP publique qui ne change pas à chaque arrêt et démarrage de l'instance, vous pouvez opter pour une adresse IP statique.

Échec de vérification du statut de l’instance

Si la vérification du statut de l'instance a échoué, cela peut être dû à des problèmes au niveau du système d'exploitation qui génèrent des erreurs de démarrage ou une sur-utilisation des ressources de l'instance. Voici les raisons courantes de l'échec de la vérification du statut d'une instance :

Utilisation élevée du CPU

Affichez la métrique CPUUtilization de l'instance. Remarque : si l'utilisation du CPU est supérieure à la zone durable, cela signifie que votre instance fonctionne dans la zone à capacité extensible et qu’elle est soumise à une charge importante. Si c'est le cas, procédez comme suit pour résoudre les problèmes :

  • Redémarrez votre instance pour la ramener à un état sain.
    Remarque : le problème se produira à nouveau après un redémarrage si les besoins en processeur de votre instance sont supérieurs à ce que votre forfait d'instance actuel peut offrir.
  • Pensez à passer à un forfait d'instance plus important, qui pourra répondre à vos besoins en matière de processeur.

Mémoire épuisée

Lorsque la mémoire est épuisée, le noyau n'a pas suffisamment de mémoire pour s’exécuter. Dans ce cas, d'autres processus sont arrêtés pour libérer de la mémoire, entraînant le non-fonctionnement de l’instance. Vous pouvez essayer de redémarrer, ou d'arrêter et de démarrer l'instance. Ces procédures permettent de réduire l'utilisation de la mémoire.

Erreurs de disque plein

S'il ne reste plus d'espace sur le périphérique et que le système de fichiers a atteint sa capacité, l'instance est peut-être passée en mode d'urgence car le périphérique racine est plein. Pour résoudre ce problème, vous pouvez augmenter votre forfait Lightsail ou le regrouper avec un autre forfait pour obtenir un volume supérieur.

Pour mettre à niveau votre forfait Lightsail en vue d’obtenir une instance plus conséquente, procédez comme suit :

1.    Créez un instantané de votre instance.

2.    Créez une instance plus volumineuse à partir de l'instantané.

3.    Une fois votre forfait Lightsail mis à niveau, connectez-vous à votre instance.

4.    Exécutez la commande lsblk pour vérifier la disposition du disque. Même si l'espace disque augmente, il peut y avoir un manque d'espace libre empêchant l'exécution du processus automatique qui augmente la partition et le système de fichiers. Si cela se produit, il convient alors de libérer de l'espace et d’augmenter manuellement la partition, puis le système de fichiers. Pour ce faire, exécutez les commandes suivantes :

Exécutez la commande growpart pour augmenter la taille de la partition racine ou de la partition 1 :

$ sudo growpart /dev/xvda 1

Exécutez la commande lsblk pour vérifier que la taille de la partition 1 est augmentée :

$ lsblk

Développez le système de fichiers. Vérifiez le système de fichiers de votre partition racine «/» à l'aide de la commande suivante :

$ lsblk -f

Dans l'exemple ci-après, un système de fichiers EXT2/EXT3/EXT4 sur la partition 1 est développé :

$ sudo resize2fs /dev/xvda1

Dans l'exemple suivant, un système de fichiers de type XFS est développé. Dans cet exemple, « / » est le point de montage du volume.

$ sudo xfs_growfs -d /

Après avoir développé le système de fichiers, exécutez la commande df -h pour vérifier que le système d'exploitation détecte bien l'espace supplémentaire :

$ df -h

Autres problèmes au niveau du SE

Les autres problèmes incluent les problèmes de démarrage, la panique du noyau et l’échec du réseau. Il peut également y avoir des erreurs de périphérique de stockage en mode bloc, des bogues logiciels, des tâches bloquées ou des problèmes système inhabituels. Tous ces éléments peuvent entraîner le non-fonctionnement d’une instance. Essayez de redémarrer, ou d'arrêter et de démarrer l'instance. Si un redémarrage, ou un arrêt et un démarrage ne permettent pas de résoudre le problème, vous devrez peut-être migrer le serveur Lightsail vers EC2 afin de résoudre d’autres problèmes. En effet, les options de résolution de problèmes sont limitées dans Lightsail, car cette solution est destinée aux applications plus simples.


Cet article vous a-t-il été utile ?


Besoin d'aide pour une question technique ou de facturation ?