¿Cómo hago que mi dominio de Amazon OpenSearch Service sea más tolerante a errores?

Última actualización: 30-07-2021

Deseo proteger los recursos de Amazon OpenSearch Service ante eliminaciones accidentales, errores de aplicaciones o hardware, o interrupciones. ¿Cuáles son las prácticas recomendadas para mejorar la tolerancia a errores o restaurar instantáneas?

Descripción breve

Nota: Amazon OpenSearch Service es el sucesor de Amazon Elasticsearch Service.

Para mejorar la tolerancia a errores de un dominio de OpenSearch Services, tenga en cuenta las siguientes prácticas recomendadas:

  • Cree instantáneas de índice de forma habitual.
  • Utilice las métricas de Amazon CloudWatch para monitorear los recursos de OpenSearch Service.
  • Conozca los límites de OpenSearch Service.
  • Utilice nodos maestros dedicados.
  • Utilice al menos tres nodos.
  • Habilite el reconocimiento de zonas.
  • No utilice instancias T2 en entornos de producción.

Resolución

Creación de instantáneas de índices habituales

Todos los dominios de OpenSearch Services crean instantáneas automatizadas. Cree instantáneas de índice manuales para generar copias de seguridad de los datos a un momento dado en un dominio de OpenSearch Services. Almacene las instantáneas en un bucket de Amazon Simple Storage Service (Amazon S3). También puede utilizar instantáneas de índice manuales para migrar datos entre dominios de OpenSearch Services o restaurar datos a otro dominio de OpenSearch Services.

Monitoreo de las métricas de Amazon CloudWatch

Uso de nodos maestros dedicados

Los nodos maestros dedicados ayudan a evitar los problemas que ocasionan los nodos sobrecargados. Utilice nodos maestros dedicados cuando suceda lo siguiente:

  • Su dominio se utiliza en entornos de producción.
  • Su dominio tiene cinco nodos o más.
  • El mapeo de índices es complejo, y existen muchos campos definidos en distintos tipos e índices.

Uso de un mínimo de tres nodos

Para evitar que una red esté dividida de forma involuntaria (cerebro dividido), utilice al menos tres nodos. Para evitar posibles pérdidas de datos, asegúrese de tener al menos una réplica para cada índice. (Cada índice tiene una réplica de forma predeterminada).

Habilitación del reconocimiento de zona

El reconocimiento de zonas ayuda a evitar el tiempo de inactividad y la pérdida de datos. Cuando el reconocimiento de zonas está habilitado, OpenSearch Service asigna los nodos y las particiones de índice de réplica en dos o tres zonas de disponibilidad de la misma región.

Nota: Para configurar tres zonas de disponibilidad, utilice dos réplicas del índice. Si se produce un error en una zona, las dos réplicas permiten una redundancia de datos del 100 %.

No utilice instancias T2 en entornos de producción.

Para entornos de producción, utilice instancias de clase M o más grandes de Amazon Elastic Compute Cloud (Amazon EC2). Si utiliza tipos de instancia T2, asegúrese de monitorear los créditos de la CPU, el uso de la CPU, el uso de la memoria y la estabilidad de las instancias. Escale vertical u horizontalmente cuando sea necesario.

Además, tenga en cuenta las siguientes limitaciones para las instancias T2: