Comment surveiller mon cluster Amazon Elasticsearch Service à l'aide d'alarmes CloudWatch ?

Dernière mise à jour : 21/08/2020

Je souhaite surveiller mon cluster Amazon Elasticsearch Service (Amazon ES) à la recherche de problèmes de stabilité. Comment puis-je surveiller efficacement mon cluster Elasticsearch ?

Résolution

Important : différentes versions d'Elasticsearch utilisent différents pools de threads pour traiter les appels à l'API _index. Elasticsearch 1.5 et 2.3 utilisent le pool de threads d'index. Elasticsearch 5.x, 6.0 et 6.2 utilisent le pool de threads en bloc. Elasticsearch version 6.3 et les versions ultérieures utilisent le pool de threads d'écriture. Actuellement, la console Amazon ES n'inclut pas de graphique pour le pool de threads en bloc.

Pour surveiller l'état de votre cluster Elasticsearch, définissez les alarmes Amazon CloudWatch recommandées ainsi que les alarmes suivantes :

LeaderReachableFromNode:
Statistic = Maximum
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: Leader node is down

KibanaHealthyNodes:
Statistic = Average
Value = ‘=0’
Frequency = 1 period
Period = 1 minute
Issue: kibana is unhealthy

DiskQueueDepth:
Statistic = Average
Value = ‘>=100'
Frequency = 1 period
Period = 5 minutes
Issue: Disk Queue Depth is the number of I/O requests that are queued at a time against the storage. This could indicate a surge in requests or Amazon EBS throttling, resulting in increased latency.

ThreadpoolIndexQueue and ThreadpoolSearchQueue:
Statistic = Maximum
Value = ‘>=20’
Frequency = 1 period
Period = 1 minute
Issue: Indicates that there are requests getting queued up, which can be rejected. To verify the request status, check the CPU Utilization and Threadpool Index or Search rejects.

Pour configurer une alarme Amazon CloudWatch pour votre cluster Elasticsearch, suivez ces étapes :

1.    Ouvrez la console CloudWatch.

2.    Accédez à l'onglet Alarme.

3.    Sélectionnez Créer une alarme.

4.    Choisissez Sélectionner une métrique.

5.    Choisissez ES pour votre métrique.

6.    Sélectionnez Métriques par domaine et Métriques par client.

7.    Sélectionnez une métrique, puis choisissez Suivant.

8.    Configurez les paramètres suivants pour votre alarme CloudWatch :

Statistic = Maximum
Period to 1 minute
Threshold type = Static
Alarm condition = Greater than or equal to
Threshold value = 1

9.    Choisissez l'onglet Configuration supplémentaire.

10.    Mettez à jour les paramètres de configuration suivants :

Datapoints to alarm = Frequency stated above
Missing data treatment = Treat missing data as ignore (maintain the alarm state)

11.    Sélectionnez Suivant.

12.    Choisissez l'action souhaitée pour votre alarme, puis cliquez sur Suivant.

13.    Définissez un nom pour votre alarme, puis choisissez Suivant.

14.    Sélectionnez Créer une alarme.

Remarque : lorsque l'alarme se déclenche pour les éléments CPUUtilization ou JVMMemoryPressure, vérifiez les métriques suivantes pour voir s'il y a un pic qui coïncide avec les demandes entrantes :

IndexingRate

SearchRate

ElasticsearchRequests


Cet article vous a-t-il été utile ?


Besoin d'aide pour une question technique ou de facturation ?