¿Qué sucede cuando hago un cambio de configuración en mi clúster de Amazon OpenSearch Service?

4 minutos de lectura
0

Intento minimizar el tiempo de inactividad durante un cambio de configuración. ¿Qué sucede si hago un cambio de configuración en mi clúster de Amazon OpenSearch Service?

Resolución

Al cambiar la configuración del clúster de OpenSearch Service, se puede activar una implementación azul/verde. Durante una implementación azul/verde, el estado de un clúster cambia a “Processing” (Procesando) mientras se crea un dominio nuevo de OpenSearch Service. Cuando se crea el dominio nuevo, ocurre lo siguiente:

  • La cantidad total de nodos se duplica. De lo contrario, la cantidad total de nodos equivale al recuento de nodos del dominio antiguo y del nuevo.
  • La cantidad de nodos se duplica hasta que se terminan los nodos de dominio antiguos.
  • Si finalmente se está realizando una asignación de particiones, el estado del clúster vuelve a “Active” (Activo).

Nota: Durante la implementación azul/verde, es posible que observe cierta latencia. Para evitar problemas de latencia, se recomienda ejecutar una implementación azul/verde cuando el clúster está en buen estado y hay poco tráfico de red.

Duración del cambio de configuración

El cambio de configuración puede tardar más tiempo en función del tamaño del clúster, la carga de trabajo, el tamaño de la partición y la cantidad de particiones. Utilice el comando cat recovery para monitorear el estado de la reubicación de la partición.

Para ver qué particiones continúan reubicándose, utilice la siguiente sintaxis de comandos:

curl -X GET "cluster_endpoint/_cat/recovery?v=true&pretty" | awk '/peer/ {print $1" "$2" "$3" "$4" "$18}' | grep -v 100\.0\%

Para enumerar la reubicación de particiones por porcentajes de bytes, utilice la siguiente sintaxis de comandos:

curl -X GET "https://<end_point>/_cat/recovery?v=true&pretty" | awk '/peer/ {print $1" "$2" "$3" "$4" "$18}' | tr -d "%" | sort -k 5 -n

Nota: Para ordenar los datos por porcentaje de bytes (que se encuentran en la quinta columna), debe especificar “5” para -k.

Si observa un progreso mínimo para la reubicación de la partición, es posible que el clúster esté estancado.

Motivos por los que el proceso de implementación azul/verde puede estar estancado

Es posible que el proceso de implementación azul/verde se estanque por los siguientes motivos:

  • Un estado de clúster incorrecto antes del cambio de configuración.
  • Presión de memoria JVM alta y constante. Intento de mantener la presión de la memoria de la JVM por debajo del 75 % para evitar problemas de memoria insuficiente (OOM).
  • Uso constante y alto de la CPU. Intento de mantener el uso de la CPU por debajo del 80 %.
  • Demasiadas particiones en un clúster o tamaño incorrecto de las particiones. Se recomienda mantener la cantidad de particiones entre 10 GiB y 50 GiB. Para obtener más información sobre la estrategia de indexación, consulte Elegir el número de particiones.
  • Ajustes de configuración inválidos o demasiados cambios de configuración al mismo tiempo. Asegúrese de verificar los valores de configuración y espere a que se complete el primer cambio de configuración para enviar otro.
  • Espacio en disco o capacidad insuficientes para el proceso de reubicación o el tipo de instancias solicitado.
  • Falta de IP disponibles en la subred solicitada para un clúster dentro de una Virtual Private Cloud (VPC).
  • Uso del tamaño del volumen para el tipo de instancias. El tamaño del volumen debe estar dentro del rango límite.
  • Uso de configuración de índice como “index.routing.allocation.require. _name” o “NODE_NAME” o “index.blocks.write»: true”. Esta configuración indica un bloque de escritura. Asegúrese de quitar esta configuración de la configuración de índice antes de continuar.

Para obtener más información, consulte ¿Por qué el dominio de OpenSearch Service está atascado en el estado “Procesando”?


Información relacionada

¿Por qué la actualización de mi dominio de Amazon OpenSearch Service está tardando tanto?

OFICIAL DE AWS
OFICIAL DE AWSActualizada hace 3 años