Pourquoi le statut d'Amazon OpenSearch Dashboards est-il rouge sur mon domaine Amazon OpenSearch Service ?

Date de la dernière mise à jour : 30/07/2021

Les tableaux de bord OpenSearch continuent d'afficher le statut rouge sur mon domaine Amazon OpenSearch Service (successeur d'Amazon Elasticsearch Service). Quelle est la cause de ce problème, et comment puis-je le résoudre ?

Brève description

Les tableaux de bord OpenSearch affichent un statut vert lorsque toutes les surveillances de l'état passent sur chaque nœud du cluster OpenSearch Service. Le statut d'OpenSearch Dashboards est rouge lorsqu'une surveillance de l'état échoue. OpenSearch Dashboards affiche également un statut rouge lorsque le service OpenSearch est en statut de cluster rouge. Le statut d'OpenSearch Dashboards peut devenir rouge pour les raisons suivantes :

  • Un nœud échoue en raison d'un problème lié à une instance Amazon Elastic Compute Cloud (Amazon EC2) ou un volume Amazon Elastic Block Store (Amazon EBS). Pour plus d'informations sur les incidents de nœuds, veuillez consulter la rubrique Pourquoi mon nœud Amazon OpenSearch Service s'est-il bloqué ?
  • Vos nœuds ne disposent pas d'une mémoire suffisante.
  • Mise à niveau d'OpenSearch Service vers une version plus récente.
  • Incompatibilité entre OpenSearch Dashboards et les versions d'OpenSearch Service.
  • Un cluster à nœud unique s'exécute avec une charge importante et aucun nœud principal dédié. Le nœud leader dédié peut également être inaccessible. Pour plus d'informations sur la façon dont OpenSearch Service augmente la stabilité du cluster, veuillez consulter la rubrique Noeuds leaders dédiés.

Résolution

Utilisez une ou plusieurs des méthodes suivantes pour résoudre le statut rouge d'OpenSearch Dashboards pour votre domaine OpenSearch Service.

Remarque : si votre cluster affiche une exception de disjoncteur, augmentez d'abord la limite du disjoncteur. Si vous ne disposez pas d'exception de disjoncteur, essayez les autres méthodes avant d'augmenter la limite du disjoncteur.

Ajuster les requêtes

Si vous exécutez des requêtes complexes, telles que de lourdes agrégations, alors ajustez-les afin d'optimiser les performances. Les pics soudains de consommation de la mémoire de segment peuvent être provoqués par les données de champ ou les structures de données utilisées pour les requêtes d'agrégation.

Consultez les appels d'API suivants pour identifier la cause du pic, en remplaçant le point de terminaison OS par votre point de terminaison de domaine :

$curl os-endpoint/_nodes/stats/breaker?pretty
$curl "os-endpoint/_nodes/stats/indices/fielddata?level=indices&fields=*"

Pour plus d'informations sur la gestion de l'utilisation de la mémoire, veuillez consulter Ajuster la vitesse de recherche sur le site web d'Elasticsearch.

Utiliser des nœuds leader dédiés

Une bonne pratique consiste à allouer trois nœuds leaders dédiés à chaque domaine OpenSearch Service. Pour plus d'informations sur l'amélioration de la stabilité du cluster, consultez Démarrer avec Amazon OpenSearch Service : utiliser des instances leaders dédiées pour améliorer la stabilité du cluster.

Augmenter

Pour mettre à l'échelle votre domaine, augmentez le nombre de nœuds ou choisissez un type d'instance Amazon EC2 qui contient davantage de mémoire. Pour plus d'informations sur la mise à l’échelle, veuillez consulter la rubrique Comment augmenter la capacité de mon domaine Amazon OpenSearch Service ?

Vérifier la distribution de votre partition

Vérifiez l'index d'ingestion de vos partitions pour confirmer qu'elles sont réparties uniformément entre tous les nœuds de données. Si vos partitions sont distribuées inégalement, un ou plusieurs des nœuds de données peuvent manquer d'espace de stockage.

Utilisez la formule suivante pour confirmer que les partitions sont distribuées uniformément :

Total number of shards = shards per node * number of data nodes

Par exemple, si l'index contient 24 partitions pour huit nœuds de données, vous aurez trois partitions par nœud. Pour plus d'informations sur le nombre de partitions nécessaires, consultez Get started with Amazon OpenSearch Service: How many shards do I need ?

Vérifier vos versions

Important : vos versions de tableaux de bord OpenSearch et OpenSearch Service doivent être compatibles.

Exécutez l'appel d'API suivant pour vérifier que vos versions sont compatibles, en remplaçant os-endpoint par votre point de terminaison de domaine :

$curl os-endpoint/.kibana/config/_search?pretty

Remarque : une commande qui échoue peut indiquer des problèmes de compatibilité entre OpenSearch Dashboards et les versions prises en charge par OpenSearch Service. Pour plus d'informations sur les versions compatibles OpenSearch Dashboards et Elasticsearch, veuillez consulter Configuration sur le site web Elasticsearch.

Contrôler les ressources

Configurez des alarmes Amazon CloudWatch qui vous informent lorsque l'utilisation des ressources dépasse un certain seuil. Par exemple, si vous avez défini une alarme pour la sollicitation de la mémoire de la machine virtuelle Java, prenez des mesures correctives avant d'atteindre une sollicitation de 100 %. Pour plus d'informations sur les alarmes CloudWatch, veuillez consulter les rubriques Alarmes CloudWatch recommandées et Improve the operational efficiency of Amazon OpenSearch Service domains with automated alarms using Amazon CloudWatch.

Augmenter la limite du disjoncteur

Pour éviter que le cluster manque de mémoire, essayez d'augmenter la limite du disjoncteur de données parentes ou de champ. Pour plus d'informations sur les limites des disjoncteurs de données de champ, consultez la page Circuit Breaker (Disjoncteur) sur le site Web d'Elasticsearch.