Comment puis-je rendre mon domaine Amazon Elasticsearch Service plus tolérant aux pannes ?

Date de la dernière mise à jour : 09/01/2020

Comment puis-je protéger les ressources Amazon Elasticsearch Service (Amazon ES) contre les suppressions accidentelles, les défaillances matérielles ou applicatives ou les pannes ?

Brève description

Pour améliorer la tolérance aux pannes d'un domaine Amazon ES :

  • Prenez régulièrement des instantanés d'index.
  • Utilisez les métriques Amazon CloudWatch pour surveiller les ressources Amazon ES.
  • Comprenez les limites de service Amazon ES.
  • Utilisez des nœuds principaux dédiés.
  • Utilisez plus de deux nœuds.
  • Activez la prise en compte des zones.
  • N'utilisez pas d'instances T2 dans des environnements de production.

Solution

Prendre régulièrement des instantanés d'index

Tous les domaines Amazon ES prennent des instantanés automatiques. Prenez des instantanés d'index manuels pour créer des sauvegardes à un temps donné des données dans un domaine Amazon ES. Stockez les instantanés dans un compartiment Amazon Simple Storage Service (Amazon S3). Vous pouvez également utiliser des instantanés d'index manuels pour migrer des données entre des domaines Amazon ES et pour restaurer des données vers un autre domaine Amazon ES.

Surveiller les métriques Amazon CloudWatch

Utiliser des nœuds principaux dédiés

Lesnœuds principaux dédiés permettent d'éviter les problèmes causés par des nœuds surchargés. Utilisez des nœuds principaux dédiés :

  • Votre domaine est utilisé dans les environnements de production.
  • Votre domaine possède cinq nœuds ou plus.
  • Votre mappage d'index est complexe, avec de nombreux champs définis entre les types et les index.

Utiliser au moins trois nœuds

Pour éviter un réseau partitionné par inadvertance (cerveau fractionné), utilisez au moins trois nœuds. Pour éviter toute perte de données potentielle, assurez-vous d'avoir au moins un réplica pour chaque index. (Par défaut, chaque index possède un réplica.)

Activer la prise en compte des zones

La prise en compte des zones permet d'éviter les temps d'arrêt et la perte de données. Lorsque la prise en compte des zones est activée, Amazon ES alloue les nœuds et les partitions d'index de réplica qui appartiennent à un cluster sur deux zones de disponibilité de la même région.

Ne pas utiliser d'instances T2 dans des environnements de production

Pour les environnements de production, utilisez des instances Amazon Elastic Compute Cloud (Amazon EC2) de classe M ou plus grandes. Si vous décidez d'utiliser les types d'instance T2, veillez à surveiller de près les crédits UC, l'utilisation de l'UC, l'utilisation de la mémoire et la stabilité de vos instances. Procédez à un redimensionnement si nécessaire.