Por que não posso iniciar minha instância de cadernos Amazon SageMaker que é compatível com um endpoint de desenvolvimento de AWS Glue?

Data da última atualização: 26/08/2021

Minha instância de cadernos do Amazon SageMaker com suporte para um endpoint de desenvolvimento do AWS Glue esgota com o seguinte erro:

“A configuração do ciclo de vida da instância de cadernos 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance-lifecycle-config/mylifecycleconfig' para instância de cadernos 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance/mynotebook' demorou mais de 5 minutos. Verifique seus logs do CloudWatch para obter mais detalhes se a Instância de cadernos tiver acesso à Internet.”

Resolução

Este erro pode indicar que o serviço Apache Livy no endpoint de desenvolvimento do AWS Glue não pode se comunicar com o servidor em que o caderno é executado. O motivo mais comum para o problema é que a configuração do ciclo de vida anexada ao caderno pode fazer referência a um endpoint de desenvolvimento inexistente. O script de ciclo de vida do SageMaker é usado para configurar o plugin SparkMagic para chamar a API REST em um servidor Livy em execução em um endpoint de desenvolvimento. Para saber como esses componentes funcionam juntos, consulte Como os endpoints de desenvolvimento do AWS Glue funcionam com os cadernos SageMaker.

Para resolver o problema, tente as opções de solução de problemas adequadas ao seu caso de uso.

Crie um novo endpoint de desenvolvimento

Crie um novo endpoint de desenvolvimento do AWS Glue, de preferência com o mesmo nome e configuração do endpoint que você estava usando. Para obter mais informações, consulte Adição de um endpoint de desenvolvimento.

Atualize a configuração do ciclo de vida da instância de cadernos

Você deve atualizar a configuração do ciclo de vida da instância de cadernos que falhou se uma das seguintes condições for verdadeira:

  • Você criou um endpoint de desenvolvimento com um nome diferente.
  • Você quer usar um endpoint de desenvolvimento que você criou anteriormente.

Para atualizar a configuração do ciclo de vida de caderno, faça o seguinte:

  1. Abra o console do SageMaker.
  2. No painel de navegação, em Caderno, escolha Configurações do ciclo de vida.
  3. Selecione a configuração do ciclo de vida da instância de cadernos que falhou.
  4. Escolha Editar.
  5. No script de caderno, substitua o nome do endpoint de desenvolvimento pelo do endpoint que você criou.

Recupere os dados do caderno

Você pode considerar a recuperação do caderno quando tiver acesso ao SageMaker, mas não conseguir criar um novo endpoint de desenvolvimento.

Para recuperar os dados do caderno, faça o seguinte:

  1. Abra o console do SageMaker.
  2. No painel de navegação, em Caderno, escolha Instâncias de cadernos.
  3. Selecione o caderno que você deseja recuperar.
  4. Se o status de caderno não for Interrompido, escolha Ações e, em seguida, escolha Interromper para interromper a instância de cadernos.
    Você pode ver que o status da instância de cadernos muda para Interrompendo. Aguarde até que o status mude para Interrompido para concluir o restante das etapas.
  5. Escolha Ações e, em seguida, escolha Atualizar configurações.
  6. Na página Editar instância de cadernos, em Configuração adicional, para Configuração do ciclo de vida, selecione Sem configuração.
  7. Escolha Atualizar instância de cadernos.

O status da instância de cadernos muda para Atualizando. Quando a atualização da instância de cadernos for concluída, o status será alterado para Interrompido. Escolha Iniciar para iniciar a instância. Depois que a instância for iniciada, você poderá acessar o Jupyter e o JupyterLab para baixar seus scripts e dados localmente. No entanto, você ainda não consegue se conectar ao endpoint de desenvolvimento do AWS Glue.

Importante: você pode vincular seus scripts a um repositório do GitHub para evitar a perda de dados no futuro.

Observação: se a configuração do ciclo de vida esgotar quando você tentar instalar as bibliotecas, consulte Como posso ter certeza de que as bibliotecas instaladas manualmente persistem no Amazon SageMaker se minha configuração de ciclo de vida se esgotar quando tento instalar as bibliotecas?