Comment résoudre les problèmes de vérification d’état Route 53 non saines ?

Date de la dernière mise à jour : 17/06/2020

Les vérifications d'état Amazon Route 53 que j'ai créées sont signalées comme non saines. Comment résoudre les problèmes ?

Solution

Tout d'abord, vous devez déterminer la raison du dernier échec de vérification d'état à l'aide d'AWS Management Console. Ou bien, vous pouvez utiliser la commande get-health-check-last-failure-reason dans l’interface de ligne de commande AWS (AWS CLI). Une fois que vous avez identifié le type de vérification d'état, suivez les étapes correspondantes de résolution des problèmes pour identifier et résoudre le problème.

Remarque : quel que soit le type de vérification d'état, veillez à vérifier le statut de l'option « Inverser le statut de la vérification d’état ». Si cette option a la valeur « true », Route 53 considère que la vérification d'état n'est pas saine lorsque les vérificateurs d'état marquent la vérification d'état comme saine, et inversement.

Résoudre les problèmes liés à une vérification d'état qui surveille un point de terminaison

Cause : ce problème est indiqué par le message d'erreur « Le vérificateur d'état n'a pas pu établir une connexion dans le délai. » Cette erreur est due à un dépassement de délai d'expiration qui se produit lorsque les vérificateurs d'état tentent d'établir une connexion avec le point de terminaison configuré. La délai minimal pour établir une connexion varie en fonction du protocole de vérification d'état (TCP, HTTP ou HTTPS) :

  • Pour les vérifications d'état TCP, la connexion TCP entre les vérificateurs d'état et le point de terminaison doit se produire dans un délai de dix secondes.
  • Pour les vérifications d'état HTTP et HTTPS, la connexion TCP entre les vérificateurs d'état et le point de terminaison doit se produire dans un délai de quatre secondes. Le point de terminaison doit répondre avec un code de statut HTTP 2xx ou 3xx dans les deux secondes consécutives à l'établissement d'une connexion. Comment Amazon Route 53 détermine si une vérification d'état est saine.

Étapes :

1.    Dans la configuration de vérification d'état, notez le « nom de domaine » ou l'« adresse IP » du point de terminaison.

2.    Accédez au point de terminaison. Vérifiez que le pare-feu ou le serveur autorise les connexions à partir des adresses IP publiques Route 53 pour les régions activées dans la configuration de vérification d'état. Consultez les plages d'adresses IP et recherchez "service": "ROUTE53_HEALTHCHECKS". Si les ressources du point de terminaison se trouvent sur AWS, configurez des groupes de sécurité et des listes de contrôle d'accès réseau (NACL) pour autoriser les adresses IP des vérificateurs d'état Route 53.

3.    Utilisez les outils suivants pour tester la connectivité avec le point de terminaison configuré sur Internet. Veillez à remplacer les espaces réservés dans les commandes par vos valeurs.

Test TCP :

$ telnet <domain name / IP address> <port>

Test HTTP/HTTPS :

$ 

curl -Ik -w "HTTPCode=%{http_code} TotalTime=%{time_total}\n" <http/https>://<

domain-name/ip address>:<port>/<path>

 -so /dev/null 

Comparez la sortie précédente avec les valeurs de délai d'expiration des vérifications d'état. Ensuite, vérifiez que votre application répond dans les délais respectifs.

4.    Si cette option est activée, utilisez l'option Graphique de latence dans la configuration de vérification d'état pour vérifier le graphique des métriques de « Délai de connexion TCP », « Délai pour le premier octet » et « Délai de la prise de contact SSL ». Pour plus d'informations, consultez Surveillance de la latence entre les vérificateurs d'état et votre point de terminaison.

Remarque : si le graphique de latence n'est pas activé, vous ne pouvez pas modifier les vérifications d'état existantes. En fait, vous devez créer une vérification d'état.

Résoudre les problèmes de vérification d'état avec une condition de correspondance de chaîne

Cause : ce problème est indiqué lorsque le serveur de point de terminaison renvoie « 200 OK » et que Route 53 marque la vérification d'état comme non saine. Les vérificateurs d'état doivent établir une connexion TCP avec le point de terminaison dans un délai de quatre secondes. Les vérificateurs d'état doivent ensuite recevoir un code de statut HTTP 2xx ou 3xx dans un délai de deux secondes. Ensuite, la chaîne configurée doit apparaître dans les 5 120 premiers octets du corps de la réponse dans un délai de deux secondes. Si la chaîne n'est pas présente dans les 5 120 premiers octets, Route 53 marque la vérification d'état comme non saine.

Étapes :

Pour vérifier que la chaîne apparaît entièrement dans les 5 120 premiers octets du corps de la réponse, utilisez la commande suivante. Veillez à remplacer « $search-string » par la chaîne réelle.

$ curl -sL <http/https>://<domain-name>:<port> | head -c 5120 | grep $search-string   

Résoudre les problèmes liés à une vérification d'état qui surveille une alarme CloudWatch

Cause : Route 53 n'attend pas que l'alarme Amazon CloudWatch passe à l'état ALARM, car elle surveille le flux de données des métriques au lieu de l'état de l'alarme CloudWatch.

Étapes :

1.    Vérifiez la configuration de la vérification d'état ayant l'état « DONNEES INSUFFISANTES ». Si le flux de données des métriques fournit des informations insuffisantes pour déterminer l'état de l'alarme, le statut de la vérification d'état dépend de la configuration « InsufficientDataHealthStatus ». Les options de statut du paramètre « InsufficientDataHealthStatus » sont « sain », « non sain » ou « dernier statut connu ».

2.    Si vous avez mis à jour la configuration de l'alarme CloudWatch, les nouveaux paramètres n'apparaissent pas automatiquement dans la vérification de l'état associée. Dans la console Route 53, choisissez Vérifications d’état. Sélectionnez la vérification d'état, puis choisissez Synchroniser la configuration. Cette action synchronise la configuration de la vérification d'état avec la configuration de l'alarme CloudWatch mise à jour.


Cet article vous a-t-il été utile ?

Cette page peut-elle être améliorée ?


Vous avez besoin d'aide ?