Comment puis-je vérifier l'utilisation des ressources pour mon instance de bloc-notes SageMaker ?

Dernière mise à jour : 10-11-2022

J'ai créé une instance de bloc-notes Amazon SageMaker pour entraîner des modèles ou charger des ensembles de données volumineux, et l'instance de bloc-notes semble figée. Comment puis-je consulter l'utilisation des ressources de mon instance SageMaker ?

Solution

Lorsque vous utilisez les ressources des instances de bloc-notes SageMaker en tant que prototype, des modèles ou lorsque vous travaillez avec de grands ensembles de données, les instances du navigateur ou du bloc-notes de SageMaker peuvent sembler ne pas répondre. Si les instances de votre navigateur ou de votre bloc-notes ne répondent pas, vous pouvez consulter votre utilisation des ressources SageMaker pour voir l'utilisation actuelle des ressources.

Vous pouvez consulter l'utilisation de vos ressources SageMaker à l'aide de l'une des approches suivantes :

  • Exécution de commandes basées sur Linux
  • Examen des métriques Amazon CloudWatch

Affichage de l'utilisation des ressources de SageMaker avec des commandes

Les instances de bloc-notes SageMaker sont basées sur Amazon Linux. Vous pouvez exécuter des commandes Linux depuis le terminal SageMaker pour visualiser l'utilisation des ressources de SageMaker.

Pour exécuter les commandes SageMaker Linux afin de visualiser l'utilisation de vos ressources, procédez comme suit :

1. Ouvrez la console SageMaker.

2. Dans le volet de navigation, sélectionnez Instances de bloc-notes.

3. Ouvrez Jupyter ou JupyterLab à côté de l'instance de bloc-notes SageMaker de votre choix.

4. Ouvrez un terminal.

5. Exécutez les commandes suivantes pour voir l'utilisation des ressources de SageMaker :

top

La commande précédente affiche la mémoire système (RAM) disponible et la charge du processeur.

ps -ax

La commande précédente affiche les tâches en cours d'exécution et la charge du processeur.

df -h

La commande précédente affiche l'utilisation et la disponibilité de l'espace disque.

free -m

La commande précédente indique l'utilisation et la disponibilité de la mémoire système (RAM).

Affichage de l'utilisation des ressources de SageMaker avec CloudWatch

Vous pouvez utiliser CloudWatch pour visualiser l'utilisation de vos ressources SageMaker à l'aide d'un script de configuration du cycle de vie. Par exemple, le script publish-instance-metrics publie les métriques au niveau du système depuis l'instance de bloc-notes dans CloudWatch.

Pour configurer votre instance de bloc-notes SageMaker afin d'afficher toutes les métriques de CloudWatch :

1. Ouvrez la console SageMaker.

2. Dans le volet de navigation, sélectionnez Instances de bloc-notes.

3. Choisissez Open Jupyter ou Jupyterlab à côté de l'instance de bloc-notes SageMaker de votre choix.

4. Ouvrez un terminal.

5. Entrez la commande suivante pour ouvrir l'assistant de configuration amazon-cloudwatch-agent-config-wizard :

sudo /opt/aws/amazon-cloudwatch-agent/bin/amazon-cloudwatch-agent-config-wizard

6. Suivez les étapes de l'assistant. Lorsque vous y êtes invité, procédez comme suit :

  • Choisissez un hôte sur site
  • Choisissez non pour StatsD Daemon
  • Choisissez non pour CollectD

7. Lorsque l'assistant a terminé, il crée automatiquement un fichier config.json. Ce fichier est utilisé à l'étape suivante.

8. Démarrez l'agent CloudWatch sur votre serveur à l'aide de la commande suivante :

sudo /opt/aws/amazon-cloudwatch-agent/bin/amazon-cloudwatch-agent-ctl -a fetch-config -m ec2 -c file:///opt/aws/amazon-cloudwatch-agent/bin/config.json -s

9. Depuis votre console CloudWatch, choisissez Metrics, puis CWAgent.

10. Le CWAgent affiche vos métriques SageMaker actuelles.

Pour plus d'informations sur des exemples de scripts de configuration du cycle de vie AWS pour les blocs-notes SageMaker, consultez amazon-sagemaker-notebook-instance-lifecycle-config-samples.