Pourquoi ne puis-je pas démarrer mon instance de bloc-notes Amazon SageMaker qui s'appuie sur un point de terminaison de développement AWS Glue ?

Date de la dernière mise à jour : 26/08/2021

Mon instance de bloc-notes Amazon SageMaker qui s'appuie sur un point de terminaison de développement AWS Glue expire avec l'erreur suivante :

« Notebook Instance Lifecycle Config 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance-lifecycle-config/mylifecycleconfig' for Notebook Instance 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance/mynotebook' took longer than 5 minutes. Please check your CloudWatch logs for more details if your Notebook Instance has Internet access. » (La configuration du cycle de vie de l'instance de bloc-notes 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance-lifecycle-config/mylifecycleconfig' pour l'instance de bloc-notes 'arn:aws:sagemaker:us-xxxx-x:xxxxxx:notebook-instance/mynotebook' a durée plus de 5 minutes. Veuillez consulter vos journaux CloudWatch pour obtenir plus de détails si votre instance de bloc-notes dispose d'un accès Internet.)

Résolution

Cette erreur peut indiquer que le service Apache Livy sur le point de terminaison de développement AWS Glue ne peut pas communiquer avec le serveur sur lequel le bloc-notes s'exécute. La raison la plus courante associée à ce problème est que la configuration du cycle de vie attachée au bloc-notes peut faire référence à un point de terminaison de développement non existant. Le script de cycle de vie SageMaker est utilisé pour configurer le plugin SparkMagic pour appeler l'API REST sur un serveur Livy exécuté sur un point de terminaison de développement. Pour savoir comment ces composants fonctionnent ensemble, consultez Comment les points de terminaison de développement AWS Glue fonctionnent avec les bloc-notes SageMaker.

Pour résoudre ce problème, essayez les options de résolution qui correspondent à votre cas d'utilisation.

Créer un point de terminaison de développement

Créez un point de terminaison de développement AWS Glue, de préférence avec le même nom et la même configuration que le point de terminaison que vous utilisiez. Pour en savoir plus, consultez la section Ajout d'un point de terminaison de développement.

Mettre à jour la configuration du cycle de vie de l'instance de bloc-notes

Vous devez mettre à jour la configuration du cycle de vie de l'instance de bloc-notes qui a échoué si l'une des conditions suivantes est satisfaite :

  • Vous avez créé un point de terminaison de développement sous un autre nom.
  • Vous souhaitez utiliser un point de terminaison de développement que vous avez précédemment créé.

Pour mettre à jour la configuration du cycle de vie du bloc-notes, procédez comme suit :

  1. Ouvrez la console SageMaker.
  2. Dans le panneau de navigation, sous Bloc-notes, sélectionnez Configurations du cycle de vie.
  3. Sélectionnez la configuration du cycle de vie de l'instance de bloc-notes qui a échoué.
  4. Sélectionnez Modifier.
  5. Dans le script du bloc-notes, remplacez le nom du point de terminaison de développement par celui du point de terminaison que vous avez créé.

Récupérer les données du bloc-notes

Vous pouvez envisager de récupérer le bloc-notes lorsque vous avez accès à SageMaker, mais vous ne pouvez pas créer un point de terminaison de développement.

Pour récupérer les données de votre bloc-notes, procédez comme suit :

  1. Ouvrez la console SageMaker.
  2. Dans le panneau de navigation, sous Bloc-notes, sélectionnez Instances de bloc-notes.
  3. Sélectionnez le bloc-notes que vous souhaitez récupérer.
  4. Si l'état de votre bloc-notes n'est pas Arrêté, sélectionnez Actions, puis Arrêter pour arrêter l'instance de bloc-notes.
    Vous pouvez voir que l'état de l'instance de bloc-notes change pour Arrêt. Attendez que l'état soit Arrêté pour effectuer le reste des étapes.
  5. Sélectionnez Actions, puis Mettre à jour les paramètres.
  6. Sur la page Modifier l'instance de bloc-notes, sous Configuration supplémentaire, pour Configuration du cycle de vie, sélectionnez Aucune configuration.
  7. Sélectionnez Mettre à jour l'instance de bloc-notes.

L'état de votre instance de bloc-notes est désormais Mise à jour. Lorsque la mise à jour de l'instance de bloc-notes est terminée, l'état devient alors Arrêté. Sélectionnez Démarrer pour démarrer l'instance. Une fois l'instance démarrée, vous pouvez accéder à Jupyter et JupyterLab pour télécharger localement vos scripts et données. Cependant, vous ne pouvez toujours pas vous connecter au point de terminaison de développement AWS Glue.

Important : vous pouvez lier vos scripts à un référentiel GitHub pour éviter la perte de données à l'avenir.

Remarque : si la configuration du cycle de vie expire lorsque vous essayer d'installer les bibliothèques, consultez la section Comment être sûr que les bibliothèques installées manuellement persistent dans Amazon SageMaker si la configuration de mon cycle de vie expire lorsque j'essaie d'installer les bibliothèques ?