O que acontece quando faço uma alteração na configuração do meu cluster do Amazon OpenSearch Service?

Última atualização: 05/08/2021

Estou tentando minimizar o tempo de inatividade durante uma alteração de configuração. O que acontece se eu fizer uma alteração de configuração no cluster do Amazon OpenSearch Service (sucessor do Amazon Elasticsearch Service)?

Resolução

Quando você altera a configuração do cluster do OpenSearch Service, uma implantação azul/verde pode ser acionada. Durante uma implantação azul/verde, um estado de cluster muda para “Processando” enquanto um novo domínio do OpenSearch Service está sendo criado. Quando o novo domínio é criado, ocorre o seguinte:

  • O número total de nós é duplicado. Ou, o número total de nós é igual à contagem de nós no domínio antigo e no novo.
  • O número de nós é dobrado até que os nós de domínio antigos sejam encerrados.
  • Se uma alocação de fragmento estiver finalmente em andamento, o estado do cluster retornará para “Ativo”.

Observação: durante a implantação azul/verde, você pode observar alguma latência. Para evitar problemas de latência, é uma prática recomendada executar a implantação azul/verde quando o cluster estiver íntegro e houver baixo tráfego de rede.

Duração da alteração de configuração

A alteração na configuração pode demorar mais, dependendo do tamanho do cluster, da workload, do tamanho do fragmento e da contagem de fragmentos. Use o comandocat recovery para monitorar o status da realocação do fragmento.

Para ver quais fragmentos ainda estão sendo realocados, use a seguinte sintaxe de comando:

Curl  -X GET "cluster_endpoint/_cat/recovery?v=true&pretty" | awk '/peer/ {print $1" "$2" "$3" "$4" "$18}' | grep -v 100\.0\%

Para listar a realocação de fragmentos por porcentagens de bytes, use a seguinte sintaxe de comando:

Curl -X GET "https://<end_point>/_cat/recovery?v=true&pretty" | awk '/peer/ {print $1" "$2" "$3" "$4" "$18}' | tr -d "%" | sort -k 5 -n

Observação: para classificar os dados por porcentagem de bytes (que está na quinta coluna), você deve especificar “5" para-k.

Se você observar um progresso mínimo para a realocação de fragmento, o cluster pode travar.

Motivos pelos quais o processo de implantação azul/verde está travado

Seu processo de implantação azul/verde pode ficar preso pelos seguintes motivos:

  • Um estado de cluster não íntegro antes da alteração da configuração.
  • Pressão da memória JVM consistentemente alta. Procure manter a pressão da memória JVM abaixo de 75% para evitar problemas de falta de memória (OOM).
  • Utilização de CPU consistentemente alta. Procure manter a utilização da CPU abaixo de 80%.
  • Muitos fragmentos em um cluster ou dimensionamento incorreto de fragmentos. É uma prática recomendada manter a contagem de fragmentos entre 10 GiB e 50 GiB. Para obter mais informações sobre a estratégia de indexação, consulte Escolher o número de fragmentos.
  • Configuração inválida ou muitas alterações de configuração ao mesmo tempo. Certifique-se de verificar suas definições de configuração e aguarde para enviar uma alteração de configuração até que a primeira alteração de configuração seja concluída.
  • Espaço em disco ou capacidade insuficiente para o processo de realocação ou o tipo de instância solicitado.
  • Falta de IPs disponíveis na sub-rede solicitada para um cluster dentro de uma Virtual Private Cloud (VPC).
  • Usando o tamanho do volume para o tipo de instância. O tamanho do volume deve estar dentro do intervalo limite.
  • Usar configurações de índice como "index.routing.allocation.require._name" ou "NODE_NAME" ou "index.blocks.write": true". Essas configurações indicam um bloco de gravação. Certifique-se de remover essas configurações das configurações de índice antes de continuar.

Para mais informações, consulte Por que meu domínio do Amazon OpenSearch Service não sai do estado “Processing” (Processando)?


Este artigo ajudou?


Precisa de ajuda com faturamento ou suporte técnico?