¿Cómo se monitorea el clúster de Amazon OpenSearch Service mediante las alarmas de CloudWatch?

Actualización más reciente: 30-09-2021

Deseo monitorear el clúster de Amazon OpenSearch Service (sucesor de Amazon Elasticsearch Service) para detectar problemas de estabilidad. ¿Cómo puedo monitorear mi clúster de manera eficaz?

Resolución

Importante: Las distintas versiones de Elasticsearch utilizan grupos de subprocesos diferentes para procesar las llamadas a la API _index.

  • Las versiones 1.5 y 2.3 de Elasticsearch utilizan el grupo de subprocesos de índice.
  • Las versiones 5.x, 6.0 y 6.2 de Elasticsearch utilizan el grupo de subprocesos masivos. (Actualmente, la consola de OpenSearch Service no incluye un gráfico para el grupo de subprocesos masivos).
  • Las versiones 6.3 y posteriores de Elasticsearch utilizan el grupo de subprocesos de escritura.

Para monitorear el estado del clúster de OpenSearch Service, establezca las alarmas recomendadas de Amazon CloudWatch y las siguientes alarmas de métricas de clúster de OpenSearch Service:

  • MasterReachableFromNode
  • KibanaHealthyNodes
  • DiskQueueDepth
  • ThreadpoolIndexQueue
  • ThreadpoolSearchQueue

Puede configurar las alarmas de métricas de OpenSearch Service de la siguiente manera:

MasterReachableFromNode:
Statistic = Maximum
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Leader node is down.

KibanaHealthyNodes:
Statistic = Average
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that the kibana index is unhealthy.

DiskQueueDepth:
Statistic = Average
Value = ‘>=100'
Frequency = 1 period
Period = 5 minutes
Issue: Disk Queue Depth is the number of I/O requests that are queued at a time against the storage. This could indicate a surge in requests or Amazon EBS throttling, resulting in increased latency.

ThreadpoolIndexQueue and ThreadpoolSearchQueue:
Statistic = Maximum
Value = ‘>=20’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that there are requests getting queued up, which can be rejected. To verify the request status, check the CPU Utilization and Threadpool Index or Search rejects.

Para configurar una alarma de Amazon CloudWatch para el clúster de OpenSearch Service, lleve a cabo los siguientes pasos:

1.    Abra la consola de Amazon CloudWatch.

2.    Vaya a la pestaña Alarma.

3.    Elija Create Alarm (Crear alarma).

4.    Elija Select Metric (Seleccionar métrica).

5.    Elija ES para su métrica.

6.    Seleccione Per-Domain (Por dominio) y Per-Client Metrics (Métricas por cliente).

7.    Seleccione una métrica y elija Next (Siguiente).

8.    Configure los siguientes ajustes para la alarma de Amazon CloudWatch:

Statistic = Maximum
Period to 1 minute
Threshold type = Static
Alarm condition = Greater than or equal to
Threshold value = 1

9.    Seleccione la pestaña Additional configuration (Configuración adicional).

10.    Actualice los siguientes ajustes de configuración:

Datapoints to alarm = Frequency stated above
Missing data treatment = Treat missing data as ignore (maintain the alarm state)

11.    Seleccione Next (Siguiente).

12.    Elija la acción que desea que realice la alarma y elija Siguiente.

13.    Establezca un nombre para la alarma y, a continuación, elija Next (Siguiente).

14.    Elija Create Alarm (Crear alarma).

Nota: Si la alarma se activa para CPUUtilization o JVMMemoryPressure, verifique sus métricas de Amazon CloudWatch con el fin de ver si hay un pico que coincide con las solicitudes entrantes. En particular, monitoree estas métricas de Amazon CloudWatch: IndexingRate, SearchRate y OpenSearchRequests.


¿Le resultó útil este artículo?


¿Necesita asistencia técnica o con la facturación?