¿Por qué OpenSearch Dashboards está en estado rojo en mi dominio de Amazon OpenSearch Service?

Última actualización: 30/07/2021

OpenSearch Dashboards sigue mostrando el estado rojo en mi dominio de Amazon OpenSearch Service. ¿Por qué sucede esto y cómo lo soluciono?

Descripción corta

OpenSearch Dashboards muestra el estado verde cuando todas las comprobaciones de estado pasan por todos los nodos del clúster de OpenSearch Service. Si se produce un error en una comprobación de estado, OpenSearch Dashboards pasa al estado rojo. OpenSearch Dashboards también muestra el estado rojo cuando OpenSearch Service está en estado de clúster rojo. El estado del panel de OpenSearch puede ponerse rojo por los siguientes motivos:

  • Error de nodo causado por un problema con una instancia de Amazon Elastic Compute Cloud (Amazon EC2) o un volumen de Amazon Elastic Block Store (Amazon EBS). Para obtener más información sobre los bloqueos de nodos, consulte ¿Por qué se ha bloqueado el nodo de Amazon OpenSearch Service?
  • Memoria insuficiente para los nodos.
  • Actualización de OpenSearch Service a una versión más reciente.
  • Incompatibilidad entre las versiones de OpenSearch Dashboards y OpenSearch Service.
  • Un clúster de un solo nodo se ejecuta con una carga pesada y sin nodos líderes dedicados. El nodo líder dedicado también puede ser inaccesible. Para obtener más información sobre cómo OpenSearch Service aumenta la estabilidad del clúster, consulte Nodos líderes dedicados.

Resolución

Utilice uno o más de los métodos siguientes para resolver el estado rojo de OpenSearch Dashboards en su dominio de OpenSearch Service.

Nota: Si el clúster muestra una excepción de interrupción, primero aumente el límite de interrupción. Si no tiene una excepción de interrupción, pruebe los otros métodos antes de aumentar el límite de interrupción.

Ajustar consultas

Si ejecuta consultas complejas (como agregaciones pesadas), ajuste las consultas para obtener el máximo rendimiento. Los datos de campo o las estructuras de datos que se utilizan para las consultas de agregación pueden provocar picos repentinos en el consumo de memoria de pila.

Revise las siguientes llamadas a la API para identificar la causa del pico y reemplace os-endpoint por el punto de enlace del dominio:

$curl os-endpoint/_nodes/stats/breaker?pretty
$curl "os-endpoint/_nodes/stats/indices/fielddata?level=indices&fields=*"

Para obtener más información sobre cómo administrar el uso de la memoria, consulte Ajustar la velocidad de búsqueda en el sitio web de Elasticsearch.

Utilizar nodos líderes dedicados

Se recomienda asignar tres nodos líderes dedicados a cada dominio de OpenSearch Service. Para obtener más información sobre cómo mejorar la estabilidad del clúster, consulte Introducción a Amazon OpenSearch Service: utilizar instancias líderes dedicadas para mejorar la estabilidad del clúster.

Escalar

Para escalar verticalmente el dominio, aumente el número de nodos o elija un tipo de instancia de Amazon EC2 que tenga más memoria. Para obtener más información sobre el escalado, consulte ¿Cómo se puede escalar verticalmente o escalar horizontalmente el dominio de Amazon OpenSearch Service?

Verificar la distribución de particiones

Compruebe el índice en el que se están procesando las particiones para confirmar que se distribuyen de manera uniforme en todos los nodos de datos. Si las particiones se distribuyen de forma desigual, uno o varios nodos de datos podrían quedarse sin espacio de almacenamiento.

Utilice la siguiente fórmula para confirmar que las particiones se distribuyen de manera uniforme:

Total number of shards = shards per node * number of data nodes

Por ejemplo, si hay 24 particiones en el índice y hay ocho nodos de datos, existen tres particiones por nodo. Para obtener más información sobre el número de particiones necesarias, consulte Introducción a Amazon OpenSearch Service: ¿cuántas particiones se necesitan?

Comprobar versiones

Importante: Las versiones de OpenSearch Dashboards y OpenSearch Service deben ser compatibles.

Ejecute la siguiente llamada a la API para confirmar que sus versiones son compatibles y reemplace os-endpoint por su punto de enlace de dominio:

$curl os-endpoint/.kibana/config/_search?pretty

Nota: Un comando incorrecto puede indicar problemas de compatibilidad entre OpenSearch Dashboards y las versiones de OpenSearch Service compatibles. Para obtener más información acerca de las versiones compatibles de OpenSearch Dashboards y Elasticsearch, consulte Configurar en el sitio web de Elasticsearch.

Monitorear los recursos

Configure alarmas de Amazon CloudWatch que le avisen cuando se utilizan recursos por encima de un umbral determinado. Por ejemplo, si configura una alarma para la presión de la memoria de JVM, tome medidas antes de que la presión alcance el 100 %. Para obtener más información sobre las alarmas de CloudWatch, consulte Alarmas de CloudWatch recomendadas y Mejorar la eficiencia operativa de los dominios de Amazon OpenSearch Service con alarmas automatizadas mediante Amazon CloudWatch.

Aumentar el límite de interrupción

Para evitar que el clúster se quede sin memoria, intente aumentar el límite de interrupción de datos principales o de campo. Para obtener más información sobre los límites de las interrupciones de datos de campo, consulte Interrupción en el sitio web de Elasticsearch.

Amazon OpenSearch Service es el sucesor de Amazon Elasticsearch Service.