In che modo è possibile monitorare il mio cluster Amazon OpenSearch Service utilizzando gli allarmi CloudWatch?

3 minuti di lettura

Voglio monitorare il mio cluster Amazon OpenSearch Service per rilevare i problemi di stabilità. Come posso monitorare in modo efficace il mio cluster?

Risoluzione

Importante: versioni diverse di Elasticsearch utilizzano pool di thread diversi per elaborare le chiamate all'API _index.

Le versioni 1.5 e 2.3 di Elasticsearch utilizzano il pool di thread di indice.
Le versioni 5.x, 6.0 e 6.2 di Elasticsearch utilizzano il pool di thread in blocco. (Attualmente, la console di OpenSearch Service non include un grafico per il pool di thread in blocco.)
Le versioni 6.3 e successive di Elasticsearch utilizzano il pool di thread di scrittura.

Per monitorare l'integrità del cluster OpenSearch Service, imposta gli allarmi Amazon CloudWatch consigliati e i seguenti allarmi per i parametri del cluster OpenSearch Service:

MasterReachableFromNode
KibanaHealthyNodes
DiskQueueDepth
ThreadpoolIndexQueue
ThreadpoolSearchQueue

Vi è la possibilità di configurare gli allarmi delle metriche di OpenSearch Service in questo modo:

MasterReachableFromNode:
Statistic = Maximum
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Leader node is down.

KibanaHealthyNodes:
Statistic = Average
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that the kibana index is unhealthy.

DiskQueueDepth:
Statistic = Average
Value = ‘>=100'
Frequency = 1 period
Period = 5 minutes
Issue: Disk Queue Depth is the number of I/O requests that are queued at a time against the storage. This could indicate a surge in requests or Amazon EBS throttling, resulting in increased latency.

ThreadpoolIndexQueue and ThreadpoolSearchQueue:
Statistic = Maximum
Value = ‘>=20’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that there are requests getting queued up, which can be rejected. To verify the request status, check the CPU Utilization and Threadpool Index or Search rejects.

Per configurare un allarme Amazon CloudWatch per il cluster OpenSearch Service, attenersi alla seguente procedura:

1. Aprire la console Amazon CloudWatch.

2. Passa alla scheda Allarme.

3. Scegliere Crea avviso.

4. Scegliere Seleziona parametro di riferimento.

5. Scegliere ES per il proprio parametro di riferimento.

6. Selezionare Parametro di riferimento per dominio e per client.

7. Seleziona un parametro di riferimento e scegliere Avanti.

8. Configurare le seguenti impostazioni per il proprio allarme Amazon CloudWatch:

Statistic = Maximum
Period to 1 minute
Threshold type = Static
Alarm condition = Greater than or equal to
Threshold value = 1

9. Scegliere la scheda Configurazione aggiuntiva.

10. Aggiornare le seguenti impostazioni di configurazione:

Datapoints to alarm = Frequency stated above
Missing data treatment = Treat missing data as ignore (maintain the alarm state)

11. Scegliere Next (Avanti).

12. Scegli l'azione che desideri venga eseguita dall’allarme e scegli Successivo.

13. Impostare un nome per la sveglia, quindi scegliere Avanti.

14. Scegliere Crea avviso.

Nota: se l'avviso viene attivato per CPUUtilization o JVMMemoryPressure, controlla i parametri di riferimento di Amazon CloudWatch per verificare se c'è un picco che coincide con le richieste in arrivo. In particolare, monitora questi parametri di riferimento di Amazon CloudWatch: IndexingRate, SearchRate e OpenSearchRequests.

Informazioni correlate

ClusterBlockException

Utilizzo di allarmi di Amazon CloudWatch

Argomenti

Serverless Analisi

Tag

Amazon OpenSearch Service

Lingua

Italiano

AWS UFFICIALEAggiornata 3 anni fa

Contenuto pertinente

In che modo è possibile migliorare le prestazioni di indicizzazione nel mio cluster Amazon OpenSearch Service?
AWS UFFICIALEAggiornata 3 anni fa
In che modo è possibile evitare gli errori di timeout del gateway HTTP 504 su Amazon OpenSearch Service?
AWS UFFICIALEAggiornata 3 anni fa
In che modo è possibile migrare i dati da un dominio Amazon OpenSearch Service a un altro?
AWS UFFICIALEAggiornata 3 anni fa
In che modo posso aumentare la tolleranza ai guasti del mio dominio Amazon OpenSearch Service?
AWS UFFICIALEAggiornata 3 anni fa