Comment puis-je rendre mon domaine Amazon OpenSearch Service plus tolérant aux pannes ?

Date de la dernière mise à jour : 30/07/2021

Je souhaite protéger les ressources Amazon OpenSearch Service contre les suppressions accidentelles, les défaillances matérielles ou applicatives ou les pannes. Quelles sont les bonnes pratiques pour améliorer la tolérance aux pannes ou pour restaurer les instantanés ?

Brève description

Pour améliorer la tolérance aux pannes d'un domaine OpenSearch Services, tenez compte des bonnes pratiques suivantes :

  • Créez régulièrement des instantanés d'index.
  • Utilisez les métriques Amazon CloudWatch pour contrôler les ressources OpenSearch Service.
  • Comprenez les limites d'OpenSearch Service.
  • Utilisez des nœuds principaux dédiés.
  • Utilisez au moins trois nœuds.
  • Activez la prise en compte des zones.
  • N'utilisez pas d'instances T2 dans des environnements de production.

Solution

Prendre régulièrement des instantanés d'index

Tous les domaines OpenSearch Services prennent des instantanés automatisés. Prenez des instantanés d'index manuels pour créer des sauvegardes ponctuelles des données dans un domaine OpenSearch Services. Stockez les instantanés dans un compartiment Amazon Simple Storage Service (Amazon S3). Vous pouvez également utiliser des instantanés d'index manuels pour effectuer la migration des données entre des domaines OpenSearch Services ou restaurer des données vers un autre domaine OpenSearch Services.

Contrôler les métriques Amazon CloudWatch

Utiliser des nœuds principaux dédiés

Les nœuds principaux dédiés permettent d'éviter les problèmes causés par des nœuds surchargés. Utilisez des nœuds principaux dédiés :

  • Votre domaine est utilisé dans les environnements de production.
  • Votre domaine possède cinq nœuds ou plus.
  • Votre mappage d'index est complexe, avec de nombreux champs définis entre les types et les index.

Utiliser au moins trois nœuds

Pour éviter un réseau partitionné par inadvertance (cerveau fractionné), utilisez au moins trois nœuds. Pour éviter toute perte de données potentielle, assurez-vous d'avoir au moins un réplica pour chaque index. (Par défaut, chaque index possède un réplica.)

Activer la prise en compte des zones

La prise en compte des zones aide à prévenir les temps d'arrêt et la perte de données. Lorsque la prise en compte de zone est activée, OpenSearch Service alloue les nœuds et les partitions d'index de réplica entre deux ou trois zones de disponibilité dans la même région.

Remarque : pour configurer trois zones de disponibilité, utilisez deux réplicas de votre index. En cas de défaillance d'une seule zone, les deux réplicas garantissent une redondance totale des données.

Ne pas utiliser d'instances T2 dans des environnements de production

Pour les environnements de production, utilisez des instances Amazon Elastic Compute Cloud (Amazon EC2) de classe M ou plus grandes. Si vous décidez d'utiliser les types d'instance T2, veillez à surveiller les crédits CPU, l'utilisation CPU, l'utilisation de la mémoire et la stabilité de vos instances. Augmentez les instances ou le stockage si nécessaire.

En outre, notez les limitations suivantes pour les instances T2 :

  • Les instances T2 se voient attribuer des crédits CPU. En cas de pic de trafic réseau, votre cluster OpenSearch Services peut dépasser le nombre de crédits CPU disponibles dans votre instance T2. Pour plus d'informations, consultez Crédits CPU et utilisation de la ligne de base pour les instances de performance à capacité extensible.
  • Les instances T2 ont une limite de volume EBS de 35 Go.
  • Les instances T2 ont une limite de charge utile de 10 Mo. Assurez-vous que la charge utile de votre requête ne dépasse pas la limite. Pour plus d'informations sur les limites réseau OpenSearch Service, veuillez consulter la rubrique Limites réseau.
  • Les types d'instance T2 ne peuvent être utilisés que si le nombre d'instances OpenSearch Service est de dix ou moins. Pour plus d'informations sur les types d'instances OpenSearch Service pris en charge, veuillez consulter la rubrique Types d'instance pris en charge.
  • Les types d'instance T2 ne doivent pas être utilisés comme nœuds de données ou nœuds principaux dédiés. Les types d'instance T2 peuvent devenir instables sous une charge lourde soutenue. Pour plus d'informations, consultez Bonnes pratiques d'Amazon OpenSearch Service.

Amazon OpenSearch Service est le successeur d'Amazon Elasticsearch Service.