Como monitorar meu cluster do Amazon OpenSearch Service usando alarmes do CloudWatch?

Data da última atualização: 05/08/2021

Quero monitorar meu cluster do Amazon OpenSearch Service (sucessor do Amazon Elasticsearch Service) em relação a problemas de estabilidade. Como posso monitorar meu cluster de forma eficaz?

Resolução

Importante: versões diferentes do Elasticsearch usam grupos de threads diferentes para processar chamadas para a API _index.

As versões 1.5 e 2.3 do Elasticsearch usam o grupo de threads de índice.
As versões 5.x, 6.0 e 6.2 do Elasticsearch usam o grupo de threads em massa. (Atualmente, o console do OpenSearch Service não inclui um gráfico para o grupo de threads em massa.)
As versões 6.3 e posteriores do Elasticsearch usam o grupo de threads de gravação.

Para monitorar a integridade do cluster do OpenSearch Service, defina os alarmes recomendados do Amazon CloudWatch e os seguintes alarmes métricos de clusters do OpenSearch Service:

  • MasterReachableFromNode
  • KibanaHealthyNodes
  • DiskQueueDepth
  • ThreadpoolIndexQueue
  • ThreadpoolSearchQueue

Você pode configurar os alarmes métricos do OpenSearch Service da seguinte forma:

MasterReachableFromNode:
Statistic = Maximum
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Leader node is down.

KibanaHealthyNodes:
Statistic = Average
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that the kibana index is unhealthy.

DiskQueueDepth:
Statistic = Average
Value = ‘>=100'
Frequency = 1 period
Period = 5 minutes
Issue: Disk Queue Depth is the number of I/O requests that are queued at a time against the storage. This could indicate a surge in requests or Amazon EBS throttling, resulting in increased latency.

ThreadpoolIndexQueue and ThreadpoolSearchQueue:
Statistic = Maximum
Value = ‘>=20’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that there are requests getting queued up, which can be rejected. To verify the request status, check the CPU Utilization and Threadpool Index or Search rejects.

Para configurar um alarme do Amazon CloudWatch para o cluster do OpenSearch Service, execute as seguintes etapas:

1.    Abra o console do Amazon CloudWatch.

2.    Vá para a guia Alarm (Alarme).

3.    Escolha Create alarm (Criar alarme).

4.    Escolha Select Metric (Selecionar métrica).

5.    Escolha ES para sua métrica.

6.    Selecione Per-Domain e Per-Client Metrics (Métricas por domínio e por cliente).

7.    Selecione uma métrica e escolha Next (Avançar).

8.    Defina as seguintes configurações para o alarme do Amazon CloudWatch:

Statistic = Maximum
Period to 1 minute
Threshold type = Static
Alarm condition = Greater than or equal to
Threshold value = 1

9.    Escolha a guia Additional configuration (Configuração adicional).

10.    Atualize as seguintes configurações:

Datapoints to alarm = Frequency stated above
Missing data treatment = Treat missing data as ignore (maintain the alarm state)

11.    Selecione Next (Próximo).

12.    Escolha a ação que você deseja que o alarme execute e escolha Next (Avançar).

13.    Defina um nome para o alarme e escolha Next (Avançar).

14.    Escolha Create alarm (Criar alarme).

Observação: se o alarme for acionado para CPUUtilization ou JVMMemoryPressure, verifique suas métricas do Amazon CloudWatch para verificar se há um pico coincidindo com as solicitações recebidas. Especificamente, monitore estas métricas do Amazon CloudWatch: IndexingRate, SearchRate e OpenSearchRequests.


ClusterBlockException

Using Amazon CloudWatch alarms (“Usar alarmes do Amazon CloudWatch”).

Este artigo ajudou?


Precisa de ajuda com faturamento ou suporte técnico?