¿Por qué la actualización de mi dominio de Amazon OpenSearch Service demora tanto?

Última actualización: 30/07/2021

Estoy intentando actualizar el clúster de Amazon OpenSearch Service, pero la actualización tarda mucho tiempo. ¿A qué se debe y cómo puedo monitorear mejor el estado de actualización de mi clúster en OpenSearch Service?

Descripción breve

Al realizar un cambio de configuración en OpenSearch Service, se utiliza un proceso de implementación azul/verde. En una implementación azul/verde, se ejecutan dos entornos de producción (uno está activo y el otro, inactivo). Los dos entornos de producción se conmutan de acuerdo con las actualizaciones de software. Para OpenSearch Service, se crea un nuevo entorno durante las actualizaciones de dominio y, una vez finalizadas las actualizaciones, los usuarios se dirigen al nuevo entorno de producción. Este comportamiento minimiza el tiempo de inactividad y conserva el entorno original en caso de que la implementación no se realice correctamente.

Para monitorear mejor el estado de actualización del clúster en OpenSearch Service, monitoree el proceso de implementación azul/verde en cada etapa:

  • Creación de nodos nuevos
  • Migración de datos
  • Eliminación de nodos antiguos

Resolución

Recuperación de todas las instantáneas del clúster y los ID del nodo

Antes de una migración, OpenSearch Service realiza una instantánea automatizada del clúster cuando supera la prueba de elegibilidad. Durante una instantánea, el estado del progreso puede ser “nulo” o 0 %. Una vez tomada la instantánea, se actualiza el valor porcentual. El tiempo que se tarda en completar una instantánea puede variar en función del espacio de almacenamiento. Dado que las instantáneas se toman de forma progresiva, es posible que la instantánea demore más en completarse si hay cambios significativos en los datos de la instantánea automatizada anterior.

La siguiente solicitud _snapshot extrae todas las instantáneas que se están ejecutando actualmente con información detallada sobre el estado:

GET /_snapshot/_status

Para obtener más información sobre las API de instantáneas, consulte (Monitoreo del progreso de instantáneas) en el sitio web de Elasticsearch.

Para extraer todas las instantáneas que se están ejecutando actualmente en el clúster, utilice el parámetro current:

GET /_snapshot/<snapshot-repository>/_current

Para obtener los ID de todos los nodos de datos, utilice la API cat nodes:

GET _cat/nodes

Puede utilizar los ID de nodos para identificar cuáles son antiguos y cuáles son nuevos. Una cantidad creciente de particiones en los nodos nuevos indica una migración fluida. Con el tiempo, todas las particiones se trasladarán a los nodos nuevos, y los nodos antiguos quedarán vacíos.

Monitoreo del proceso de implementación azul/verde

Cuando el clúster entra en el proceso de implementación azul/verde, aparecen los nodos nuevos (en el entorno verde). Luego, las particiones migran desde los nodos antiguos (en el entorno azul). Una vez finalizada la migración de datos o la reasignación de partición, el clúster antiguo se destruye.

Puede monitorear el proceso de implementación azul/verde en sus tres etapas: nodos nuevos, migración de datos y eliminación de nodos antiguos.

Fase 1: Creación de nodos nuevos

Puede monitorear la métrica del clúster de nodos en Amazon CloudWatch para obtener el recuento de nodos. De lo contrario, puede utilizar la API cat nodes para enumerar todos los nodos del clúster:

GET /_cat/nodes?v&pretty

Dado que solo está actualizando la versión del clúster, el proceso se completa en cuanto aumenta la cantidad de nodos (nodos antiguos y nuevos). Luego, es posible que vea que el dominio de OpenSearch Service vuelve a un estado “Active” (Activo) (después de pasar por el estado “Processing” [Procesando]). En el caso de los clústeres con nodos dedicados, puede ver que el recuento de nodos aumenta a la cantidad total de nodos antiguos y nuevos. Los nodos principales de la configuración antigua se apagan, y el recuento de nodos disminuye según la cantidad de nodos principales. Por ejemplo, en un clúster de OpenSearch Service con tres nodos principales dedicados, se reducen tres nodos.

Etapa 2: Migración de datos

Tan pronto como finaliza la primera etapa, comienza la migración de particiones. Durante la migración de datos, el recuento de particiones de los nodos antiguos disminuye, y aumenta el recuento de particiones para los nodos más nuevos. Puede utilizar la API cat allocation para observar cuántas particiones se asignan a cada nodo:

GET /_cat/allocation?v&pretty

Para obtener más información, consulte cat allocation en el sitio web de Elasticsearch.

Etapa 3: Eliminación de nodos antiguos

Después de migrar todas las particiones a los nodos nuevos, los nodos antiguos se eliminan del clúster. El recuento de nodos vuelve al recuento de nodos original que se configuró. En esta etapa, los procesos de implementación y actualización azul/verde finalizan.

Amazon OpenSearch Service es el sucesor de Amazon Elasticsearch Service.


¿Le resultó útil este artículo?


¿Necesita asistencia técnica o con la facturación?