Comment rendre mon domaine Amazon Elasticsearch Service plus tolérant aux pannes ?

Dernière mise à jour : 05/01/2021

Je souhaite protéger les ressources Amazon Elasticsearch Service (Amazon ES) contre les suppressions accidentelles, les défaillances matérielles ou applicatives ou les pannes. Quelles sont les bonnes pratiques pour améliorer la tolérance aux pannes ou restaurer les instantanés ?

Brève description

Pour améliorer la tolérance aux pannes de votre domaine Amazon ES, tenez compte des bonnes pratiques suivantes :

  • Créez régulièrement des instantanés d'index.
  • Utilisez les métriques Amazon CloudWatch pour surveiller les ressources Amazon ES.
  • Comprenez les limites de service Amazon ES.
  • Utilisez des nœuds principaux dédiés.
  • Utilisez au moins trois nœuds.
  • Activez la prise en compte des zones.
  • N'utilisez pas d'instances T2 dans des environnements de production.

Solution

Prendre régulièrement des instantanés d'index

Tous les domaines Amazon ES créent des instantanés automatiques. Prenez des instantanés d'index manuels pour créer des sauvegardes à un temps donné des données dans un domaine Amazon ES. Stockez les instantanés dans un compartiment Amazon Simple Storage Service (Amazon S3). Vous pouvez également utiliser des instantanés d'index manuels pour migrer des données entre des domaines Amazon ES et pour restaurer des données vers un autre domaine Amazon ES.

Surveillance des métriques Amazon CloudWatch

Utilisation de nœuds principaux dédiés

Lesnœuds principaux dédiés permettent d'éviter les problèmes causés par des nœuds surchargés. Utilisez des nœuds principaux dédiés :

  • Votre domaine est utilisé dans les environnements de production.
  • Votre domaine possède cinq nœuds ou plus.
  • Votre mappage d'index est complexe, avec de nombreux champs définis entre les types et les index.

Utiliser au moins trois nœuds

Pour éviter un réseau partitionné par inadvertance (cerveau fractionné), utilisez au moins trois nœuds. Pour éviter toute perte de données potentielle, assurez-vous d'avoir au moins un réplica pour chaque index. (Par défaut, chaque index possède un réplica.)

Activer la prise en compte des zones

La prise en compte des zones permet d'éviter les temps d'arrêt et les pertes de données. Lorsque la prise en compte des zones est activée, Amazon ES alloue les nœuds et les partitions d'index de réplica dans deux ou trois zones de disponibilité dans la même région.

Remarque : pour configurer trois zones de disponibilité, utilisez deux réplicas de votre index. En cas de défaillance d'une seule zone, les deux réplicas garantissent la redondance totale des données.

Ne pas utiliser d'instances T2 dans des environnements de production

Pour les environnements de production, utilisez des instances Amazon Elastic Compute Cloud (Amazon EC2) de classe M ou plus grandes. Si vous décidez d'utiliser les types d'instance T2, veillez à surveiller les crédits CPU, l'utilisation CPU, l'utilisation de la mémoire et la stabilité des instances. Augmentez les instances ou le stockage si nécessaire.

En outre, notez les limitations suivantes pour les instances T2 :

  • Les instances T2 se voient attribuer des crédits CPU. S'il existe un pic dans le trafic réseau, votre cluster Elasticsearch peut dépasser la quantité de crédits CPU disponibles dans votre instance T2. Pour plus d'informations, consultez Crédits CPU et utilisation de la ligne de base pour les instances à capacité extensible.
  • Les instances T2 ont une limite de volume EBS de 35 Go.
  • Les instances T2 ont une limite de charge utile de 10 Mo. Assurez-vous que la charge utile de votre demande ne dépasse pas la limite de charge utile. Pour plus d'informations sur les Service Limits Amazon ES, consultez Limites réseau.
  • Les types d'instance T2 ne peuvent être utilisés que si le nombre d'instances Amazon ES est égal ou inférieur à dix. Pour plus d'informations sur les types d'instance Amazon ES pris en charge, consultez Types d'instances pris en charge.
  • Les types d'instance T2 ne doivent pas être utilisés comme nœuds de données ou nœuds principaux dédiés. Les types d'instance T2 peuvent devenir instables sous une charge lourde soutenue. Pour plus d'informations, consultez Bonnes pratiques Amazon Elasticsearch Service.