Como torno meu domínio do Amazon OpenSearch Service mais tolerante a falhas?

Data da última atualização: 30/07/2021

Quero proteger os recursos do Amazon OpenSearch Service contra exclusão acidental, falhas de aplicações ou de hardware, ou interrupções. Quais são algumas das práticas recomendadas para melhorar a tolerância a falhas ou restaurar snapshots?

Breve descrição

Observação: o Amazon OpenSearch Service é o sucessor do Amazon Elasticsearch Service.

Para melhorar a tolerância a falhas de um domínio do OpenSearch Services, você pode seguir as seguintes práticas recomendadas:

  • Tire regularmente snapshots dos índices.
  • Use as métricas do Amazon CloudWatch para monitorar os recursos do OpenSearch Service.
  • Entenda os limites do OpenSearch Service.
  • Use nós principais dedicados.
  • Use pelo menos três nós.
  • Habilite o reconhecimento de zona.
  • Não use instâncias T2 em ambientes de produção.

Resolução

Tire regularmente snapshots dos índices

Todos os domínios do OpenSearch Services tiram snapshots automatizados. Tire snapshots dos índices manualmente para criar backups em um ponto anterior no tempo dos dados em um domínio do OpenSearch Services. Armazene os snapshots em um bucket do Amazon Simple Storage Service (Amazon S3). Você também pode usar snapshots de índice manuais para migrar dados entre domínios do OpenSearch Services ou para restaurar dados para outro domínio do OpenSearch Services.

Monitorar métricas do Amazon CloudWatch

Usar nós principais dedicados

Os nós principais dedicados ajudam a evitar problemas causados por nós sobrecarregados. Use nós principais dedicados quando:

  • Seu domínio for usado em ambientes de produção.
  • Seu domínio possuir cinco ou mais nós.
  • Seu mapeamento de índice for complexo, com muitos campos definidos entre tipos e índices.

Use pelo menos três nós

Para evitar uma rede particionada involuntariamente (cérebro dividido), use pelo menos três nós. Para evitar possíveis perdas de dados, verifique se você tem pelo menos uma réplica para cada índice. (Por padrão, cada índice tem uma réplica.)

Habilitar reconhecimento de zona

O reconhecimento de zona ajuda a evitar tempo de inatividade e perda de dados. Quando o reconhecimento de zona está habilitado, o OpenSearch Service aloca os nós e os fragmentos de índice de réplica em duas ou três zonas de disponibilidade na mesma região.

Observação: para uma configuração de três zonas de disponibilidade, use duas réplicas de seu índice. Se houver uma falha de zona única, as duas réplicas permitirão 100% de redundância de dados.

Não use instâncias T2 em ambientes de produção

Para ambientes de produção, use instâncias de classe M ou maiores do Amazon Elastic Compute Cloud (Amazon EC2). Se estiver usando tipos de instância T2, monitore os créditos de CPU, o uso da CPU, o uso da memória e a estabilidade das instâncias. Aumente a escala na vertical ou na horizontal quando necessário.

Além disso, observe as seguintes limitações para instâncias T2:

  • As instâncias T2 recebem créditos de CPU. Se houver um pico no tráfego de rede, o cluster do OpenSearch Services poderá exceder a quantidade de créditos de CPU disponíveis na instância T2. Para obter mais informações, consulte créditos de CPU e utilização de linha de base para instâncias de performance expansíveis.
  • As instâncias T2 contam com um limite de volume do EBS de 35 GB.
  • As instâncias T2 têm 10 MB de limite de carga útil. Verifique se a carga útil da solicitação não excede o limite de carga útil. Para obter mais informações sobre os limites de rede do OpenSearch Service, consulte Limites de rede.
  • Os tipos de instância T2 só podem ser usados se a contagem de instâncias do OpenSearch Service for dez ou menos. Para obter mais informações sobre os tipos de instância do OpenSearch Service compatíveis, consulte Tipos de instâncias compatíveis.
  • Os tipos de instância T2 não devem ser usados como nós de dados ou nós principais dedicados. Os tipos de instância T2 podem se tornar instáveis sob carga pesada sustentada. Para obter mais informações, consulte Práticas recomendadas do Amazon OpenSearch Service.