Como posso solucionar problemas comuns que fazem minha instância do Lightsail parar de responder?

Data da última atualização: 12-10-2021

Minha instância do Amazon Lightsail não responde. Quais são alguns dos motivos comuns para isso e como solucionar esses problemas?

Breve descrição

Se a instância não responder, revise as métricas da instância de verificação de status para determinar as etapas de solução de problemas. O Amazon Lightsail monitora a integridade de cada instância com duas verificações de status:

Verificação de status do sistema: a verificação de status do sistema detecta problemas com o host de base no qual sua instância é executada. Se o host de base não responder ou não puder ser acessado devido a problemas de rede, hardware ou software, essa verificação de status falhará.

Verificação de status da instância: uma falha na verificação de status da instância indica um problema com a instância devido a erros no nível do sistema operacional. Alguns dos erros no nível do sistema operacional são:

  • Falha ao inicializar o sistema operacional.
  • Falha ao montar volumes corretamente.
  • Problemas no sistema de arquivos.
  • Drivers incompatíveis.
  • Kernel panic.

As verificações de status da instância também podem falhar devido à utilização excessiva de recursos. A seguir estão três dos motivos mais comuns pelos quais sua verificação de integridade pode falhar devido à utilização excessiva de recursos:

  • Sua instância pode operar na zona de intermitência quando estiver sob carga pesada. Isso pode fazer com que a instância não responda ou ocorra falhas.
  • O dispositivo raiz está 100% cheio e a instância ficou travada durante a inicialização.
  • Os processos em execução na instância usaram toda a memória, impedindo a execução do kernel.

Resolução

Exiba as métricas de verificação de status da instância para determinar se a instância falhou na verificação de status do sistema ou na verificação de status da instância.

Falha na verificação de status do sistema

Se a verificação de status do sistema falhar, a instância deverá ser migrada para um novo host íntegro, interrompendo e iniciando a instância. Você pode interromper e iniciar manualmente a instância para migrá-la para um host novo e íntegro.

Observação: parar e iniciar não equivale a uma reinicialização. É necessário iniciar a migração da instância para um hardware saudável.

Aviso: antes de interromper e iniciar a instância, saiba que o endereço IP público da instância muda a cada parada e inicialização da instância. Se você quiser um IP público que não mude a cada parada e inicialização da instância, poderá anexar um endereço IP estático.

Falha na verificação de status da instância

Uma possível falha na verificação de status da instância pode ocorrer devido a problemas no nível do sistema operacional que causam erros de inicialização ou utilização excessiva dos recursos da instância. Veja a seguir os motivos comuns para a falha na verificação de status da instância:

Uso elevado de CPU

Veja a métrica de utilização da CPU da instância. Se a utilização da CPU está acima da zona sustentável, isso significa que sua instância está operando na zona de intermitência e está sob carga pesada. Se for esse o caso, use as seguintes opções para solucionar problemas:

  • Reinicie a instância para que ela retorne a um status íntegro.
    Observação: se os requisitos de CPU da instância forem mais elevados do que aquilo que o plano de instância atual pode oferecer, o problema ocorrerá novamente após uma reinicialização.
  • Considere mudar para um plano de instância maior que atenda aos requisitos de CPU.

Memória esgotada

Quando a memória está esgotada, o kernel não tem memória suficiente para ser executado. Quando isso ocorre, outros processos são interrompidos para liberar memória, fazendo com que a instância não responda. Você pode tentar reinicializar ou interromper e iniciar a instância. Esses procedimentos reduzem o uso de memória.

Erros de disco cheio

Se não houver espaço no dispositivo e o sistema de arquivos tiver atingido a capacidade máxima, a instância poderá ter entrado no modo de emergência porque o dispositivo raiz está cheio. Para resolver isso, você pode aumentar seu plano ou pacote do Lightsail para outro com um volume maior.

Para atualizar seu plano do Lightsail para uma instância maior, faça o seguinte:

1.    Crie um snapshot da sua instância.

2.    Crie uma instância maior a partir do snapshot.

3.    Depois de atualizar seu plano do Lightsail, conecte-se à instância.

4.    Execute o comando lsblk para verificar o layout do disco. Mesmo que o espaço em disco aumente, pode haver falta de espaço livre impedindo a execução do processo automático que aumenta a partição e o sistema de arquivos. Se isso ocorrer, libere algum espaço e aumente manualmente a partição seguida pelo sistema de arquivos. Para fazer isso, execute os seguintes comandos:

Execute o comando growpart para aumentar o tamanho da partição raiz ou da partição 1:

$ sudo growpart /dev/xvda 1

Execute o comando lsblk para verificar se a partição 1 está expandida:

$ lsblk

Expanda o sistema de arquivos. Verifique o sistema de arquivos da sua partição raiz “/” usando o seguinte comando:

$ lsblk -f

No exemplo a seguir, um sistema de arquivos EXT2/EXT3/EXT4 na partição 1 é expandido:

$ sudo resize2fs /dev/xvda1

No exemplo a seguir, um sistema de arquivos do tipo XFS é expandido. Neste exemplo, "/" é o ponto de montagem do volume.

$ sudo xfs_growfs -d /

Depois de expandir o sistema de arquivos, execute o comando df -h para verificar se o sistema operacional pode detectar o espaço adicional:

$ df -h

Outros problemas no nível do sistema operacional

Alguns outros problemas são problemas de inicialização, kernel panic e falha de rede. Além disso, pode haver erros de dispositivo de bloqueio, bugs de software, tarefas travadas ou problemas incomuns do sistema. Tudo isso pode levar a instância a não responder. Tente reinicializar ou parar e iniciar a instância. Se uma reinicialização ou interrupção e inicialização não resolver o problema, talvez seja necessário migrar o servidor Lightsail para o EC2 para solucionar problemas mais complexos. Isso ocorre porque as opções de solução de problemas são limitadas no Lightsail, visto que são para cargas de trabalho mais simples.


Este artigo foi útil?


Precisa de ajuda com faturamento ou suporte técnico?