Por que minha atualização de domínio do Amazon OpenSearch Service está demorando tanto?

Data da última atualização: 30/07/2021

Estou tentando atualizar meu cluster do Amazon OpenSearch Service (sucessor do Amazon Elasticsearch Service), mas a atualização está demorando muito. Por que isso está acontecendo e como posso monitorar melhor meu status de atualização de cluster no OpenSearch Service?

Breve descrição

Quando você faz uma alteração de configuração no OpenSearch Service, um processo de implantação azul/verde é utilizado. Em uma implantação azul/verde, dois ambientes de produção são executados (um está ativo, enquanto o outro está ocioso). Os dois ambientes de produção são alternados de acordo com as atualizações de software. Para o OpenSearch Service, um novo ambiente é criado durante as atualizações de domínio, e os usuários são encaminhados para o novo ambiente de produção após a conclusão das atualizações. Esse comportamento minimiza o tempo de inatividade e mantém o ambiente original caso uma implantação seja mal-sucedida.

Para monitorar melhor o status de atualização do cluster no OpenSearch Service, monitore seu processo de implantação azul/verde em cada estágio:

  • Criação de novos nós
  • Migração de dados
  • Remoção de nós antigos

Resolução

Recuperando todos os snapshots de cluster e IDs de nó

Antes de uma migração, o OpenSearch Service tira um snapshot automatizado do cluster quando ele passa no teste de elegibilidade. Durante um snapshot, o status de progresso pode mostrar “nulo” ou 0%. Depois que o snapshot é obtido, o valor percentual é atualizado. O tempo necessário para concluir um snapshot pode variar conforme o espaço de armazenamento. Como os snapshots são obtidos de forma incremental, o snapshot pode demorar mais para ser concluído se houver alterações significativas nos dados do snapshot automatizado anterior.

A solicitação _snapshot seguinte recupera todos os snapshots atualmente em execução com informações detalhadas de status:

GET /_snapshot/_status

Para obter mais informações sobre as APIs de snapshot, consulte Monitorar instantâneos e restaurar o progresso no site do Elasticsearch.

Para recuperar todos os snapshots em execução no cluster, use o parâmetro current:

GET /_snapshot/<snapshot-repository>/_current

Para obter os IDs de todos os nós de dados, use a API cat nodes:

GET _cat/nodes

Você pode usar os IDs de nó para identificar quais nós são antigos e quais nós são novos. Um número crescente de fragmentos nos novos nós indica uma migração suave. Eventualmente, todos os fragmentos serão movidos para os novos nós e os nós antigos ficarão vazios.

Monitorando o processo de implantação azul/verde

Quando o cluster entra no processo de implantação azul/verde, os novos nós (no ambiente verde) aparecem. Os fragmentos são então migrados dos nós antigos (no ambiente azul). Depois que a migração de dados ou a realocação de fragmento for concluída, o cluster antigo será demolido.

Você pode monitorar o processo de implantação azul/verde em seus três estágios: novos nós, migração de dados e remoção de nós antigos.

Etapa 1: Criação de novos nós

Você pode monitorar a métrica de cluster Nodes no Amazon CloudWatch para obter a contagem de nós. Ou você pode usar a API cat nodes para listar todos os nós do cluster:

GET /_cat/nodes?v&pretty

Como você só está atualizando a versão do seu cluster, assim que as contagens de nós (nós antigos e novos nós) aumentam, o processo está concluído. Depois disso, você poderá ver seu domínio do OpenSearch Service retornando ao estado “Ativo” (depois de ter ficado no estado “Processando”). Para clusters com nós dedicados, você pode ver que a contagem de nós aumenta para a soma de nós antigos e novos. Os nós líderes da configuração mais antiga serão encerrados e a contagem de nós diminuirá pelo número de nós líderes. Por exemplo, um cluster do OpenSearch Service com três nós líderes dedicados diminuirá em três nós.

Estágio 2: migração de dados

Assim que o primeiro estágio for concluído, a migração do fragmento começa. Durante a migração de dados, a contagem de fragmentos para nós mais antigos diminui e a contagem de fragmentos para nós mais novos aumenta. Você pode usar a API de cat allocation para ver quantos fragmentos estão alocados para cada nó:

GET /_cat/allocation?v&pretty

Para obter mais informações, consulte cat allocation no site do Elasticsearch.

Etapa 3: Remoção de nós antigos

Depois que todos os fragmentos forem migrados para os novos nós, os nós mais antigos serão removidos do cluster. A contagem de nós retorna à contagem de nós original que você configurou. Nesse estágio, o processo de implantação e atualização azul/verde está concluído.


Este artigo ajudou?


Precisa de ajuda com faturamento ou suporte técnico?