In che modo è possibile monitorare il mio cluster Amazon OpenSearch Service utilizzando gli allarmi CloudWatch?

Ultimo aggiornamento: 30-09-2021

Desidero monitorare il cluster Amazon OpenSearch Service (successore di Amazon Elasticsearch Service) per rilevare eventuali problemi di stabilità. Come posso monitorare in modo efficace il mio cluster?

Risoluzione

Importante: versioni diverse di Elasticsearch utilizzano pool di thread diversi per elaborare le chiamate all'API _index.

  • Le versioni 1.5 e 2.3 di Elasticsearch utilizzano il pool di thread di indice.
  • Le versioni 5.x, 6.0 e 6.2 di Elasticsearch utilizzano il pool di thread in blocco. (Attualmente, la console di OpenSearch Service non include un grafico per il pool di thread in blocco.)
  • Le versioni 6.3 e successive di Elasticsearch utilizzano il pool di thread di scrittura.

Per monitorare l'integrità del cluster OpenSearch Service, imposta gli allarmi Amazon CloudWatch consigliati e i seguenti allarmi per i parametri del cluster OpenSearch Service:

  • MasterReachableFromNode
  • KibanaHealthyNodes
  • DiskQueueDepth
  • ThreadpoolIndexQueue
  • ThreadpoolSearchQueue

Vi è la possibilità di configurare gli allarmi delle metriche di OpenSearch Service in questo modo:

MasterReachableFromNode:
Statistic = Maximum
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Leader node is down.

KibanaHealthyNodes:
Statistic = Average
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that the kibana index is unhealthy.

DiskQueueDepth:
Statistic = Average
Value = ‘>=100'
Frequency = 1 period
Period = 5 minutes
Issue: Disk Queue Depth is the number of I/O requests that are queued at a time against the storage. This could indicate a surge in requests or Amazon EBS throttling, resulting in increased latency.

ThreadpoolIndexQueue and ThreadpoolSearchQueue:
Statistic = Maximum
Value = ‘>=20’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that there are requests getting queued up, which can be rejected. To verify the request status, check the CPU Utilization and Threadpool Index or Search rejects.

Per configurare un allarme Amazon CloudWatch per il cluster OpenSearch Service, attenersi alla seguente procedura:

1.    Aprire la console Amazon CloudWatch.

2.    Passa alla scheda Allarme.

3.    Scegliere Crea avviso.

4.    Scegliere Seleziona parametro di riferimento.

5.    Scegliere ES per il proprio parametro di riferimento.

6.    Selezionare Parametro di riferimento per dominio e per client.

7.    Seleziona un parametro di riferimento e scegliere Avanti.

8.    Configurare le seguenti impostazioni per il proprio allarme Amazon CloudWatch:

Statistic = Maximum
Period to 1 minute
Threshold type = Static
Alarm condition = Greater than or equal to
Threshold value = 1

9.    Scegliere la scheda Configurazione aggiuntiva.

10.    Aggiornare le seguenti impostazioni di configurazione:

Datapoints to alarm = Frequency stated above
Missing data treatment = Treat missing data as ignore (maintain the alarm state)

11.    Scegliere Next (Avanti).

12.    Scegli l'azione che desideri venga eseguita dall’allarme e scegli Successivo.

13.    Impostare un nome per la sveglia, quindi scegliere Avanti.

14.    Scegliere Crea avviso.

Nota: se l'allarme viene attivato per CPUUtilization o JVMMemoryPressure, controllare i parametri di riferimento di Amazon CloudWatch per osservare se c'è un picco che coincide con le richieste in arrivo. In particolare, monitorare questi parametri di riferimento di Amazon CloudWatch: IndexingRate, SearchRate e OpenSearchRequests.


Questo articolo è stato utile?


Hai bisogno di supporto tecnico o per la fatturazione?