¿Por qué no puedo iniciar mi instancia de notebook de Amazon SageMaker que tiene el respaldo de un punto de enlace de desarrollo de AWS Glue?

Última actualización: 26/08/2021

Mi instancia de notebook de Amazon SageMaker con el respaldo de un punto de enlace de desarrollo de AWS Glue se detiene con el siguiente error:

“Notebook Instance Lifecycle Config 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance-lifecycle-config/mylifecycleconfig' for Notebook Instance 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance/mynotebook' took longer than 5 minutes. Please check your CloudWatch logs for more details if your Notebook Instance has Internet access”. (La configuración del ciclo de vida de la instancia de notebook 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance-lifecycle-config/mylifecycleconfig' para la instancia de notebook 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance/mynotebook' tardó más de 5 minutos. Consulte los registros de CloudWatch para obtener más información sobre si su instancia de notebook tiene acceso a Internet).

Resolución

Este error podría indicar que el servicio Apache Livy en el punto de enlace de desarrollo de AWS Glue no se puede comunicar con el servidor en el que se ejecuta el notebook. El motivo más común de este problema es que la configuración del ciclo de vida asociado al notebook puede hacer referencia a un punto de enlace de desarrollo que no existe. El script de ciclo de vida de SageMaker se utiliza para configurar el complemento SparkMagic para que llame a la API REST para un servidor Livy que se ejecuta en un punto de enlace de desarrollo. Para obtener información sobre cómo funcionan conjuntamente estos componentes, consulte ¿Cómo funcionan los puntos de enlace de desarrollo de AWS Glue con los notebooks de SageMaker?.

Para resolver este problema, pruebe las opciones de solución de problemas que se adapten a su caso de uso.

Crear un punto de enlace de desarrollo nuevo

Cree un punto de enlace de desarrollo de AWS Glue nuevo, preferiblemente con el mismo nombre y configuración que el punto de enlace que estaba utilizando. Para obtener más información, consulte Cómo agregar un punto de enlace de desarrollo.

Actualizar la configuración del ciclo de vida de la instancia de notebook

Debe actualizar la configuración del ciclo de vida de la instancia de notebook que ha fallado si se cumple alguna de las siguientes condiciones:

  • Ha creado un punto de enlace de desarrollo con un nombre diferente.
  • Desea utilizar un punto de enlace de desarrollo que ha creado previamente.

Para actualizar la configuración del ciclo de vida del notebook, haga lo siguiente:

  1. Abra la consola de SageMaker.
  2. En el panel de navegación, vaya a Notebook y elija Lifecycle configurations (Configuración del ciclo de vida).
  3. Seleccione la configuración del ciclo de vida de la instancia de notebook que ha fallado.
  4. Elija Edit (Editar).
  5. En el script del notebook, sustituya el nombre del punto de enlace de desarrollo con el del punto de enlace que ha creado.

Recuperar los datos del notebook

Puede recuperar los datos del notebook cuando tenga acceso a SageMaker, pero no puede crear un nuevo punto de enlace de desarrollo.

Para recuperar los datos del notebook, haga lo siguiente:

  1. Abra la consola de SageMaker.
  2. En el panel de navegación, vaya a Notebook y elija Notebook instances (Instancias de notebook).
  3. Seleccione el notebook que quiera recuperar.
  4. Si el estado de su cuaderno no es Stopped (Detenido), elija Actions (Acciones) y luego, Stop (Detener) para detener la instancia de notebook.
    Puede ver que el estado de la instancia de notebook cambia a Stopping (Deteniéndose). Espere hasta que el estado cambie a Stopped (Detenido) para completar el resto de los pasos.
  5. Elija Actions (Acciones) y luego, Update settings (Actualizar configuración).
  6. En la página Edit notebook instance (Editar instancia de notebook), vaya a Additional Configuration (Configuración adicional) y en Lifecycle configuration(Configuración del ciclo de vida), seleccione No configuration (Sin configuración).
  7. Elija Update Notebook Instance (Actualizar instancia de notebook).

El estado de la instancia de notebook cambia a Updating (Actualizándose). Cuando la actualización de la instancia de notebook finaliza, el estado cambia a Stopped (Detenido). Elija Start (Iniciar) para comenzar la instancia. Una vez iniciada la instancia, puede acceder a Jupyter y JupyterLab para descargar los scripts y los datos de manera local. Sin embargo, sigue sin poder conectarse al punto de enlace de desarrollo de AWS Glue.

Importante: Puede vincular los scripts a un repositorio de GitHub para evitar la pérdida de datos en el futuro.

Nota: Si la configuración del ciclo de vida caduca cuando intenta instalar las bibliotecas, consulte ¿Cómo me aseguro de que las bibliotecas instaladas manualmente persistirán en Amazon SageMaker si la configuración del ciclo de vida caduca cuando intento instalar las bibliotecas?