Publié le: Sep 30, 2022
Nous sommes heureux d'annoncer qu'Amazon SageMaker Model Training prend désormais en charge les Warm Pools d'entraînement gérés SageMaker. Les utilisateurs peuvent désormais choisir de garder leurs instances matérielles d'entraînement de modèle de machine learning (ML) actives pendant une durée spécifique après la fin de la tâche. Grâce à cette fonctionnalité, les clients peuvent effectuer des expérimentations itératives ou exécuter plusieurs tâches d'entraînement de modèle consécutives à grande échelle sur les mêmes instances actives, avec jusqu'à 8 fois moins de latence au démarrage.
Amazon SageMaker Model Training est une capacité entièrement gérée qui lance les instances pour chaque tâche, entraîne un modèle, puis arrête les instances une fois la tâche effectuée. Les clients sont facturés uniquement selon la durée de la tâche. Cette capacité entièrement gérée offre aux clients la liberté de se concentrer sur leur algorithme de ML, sans avoir à s'inquiéter de la gestion de l'infrastructure lors de l'entraînement de leurs modèles. Cependant, dans la mesure où les instances matérielles sont mises en service pour chaque tâche d'entraînement, ce comportement entraîne une latence au démarrage pour les charges de travail d'entraînement répétitives. Étant donné que le processus d'entraînement de modèle nécessite des expérimentations itératives importantes, cette latence au démarrage de chaque tâche représente une charge supplémentaire pour les clients. En outre, les clients qui aiment entraîner d'importants volumes de modèles à grande échelle utilisent souvent les mêmes configurations d'instance pour plusieurs tâches d'entraînement consécutives, et trouvent cette latence au démarrage de chaque tâche particulièrement contraignante.
Grâce aux Warm Pools d'entraînement gérés SageMaker, les clients peuvent garder leurs instances matérielles d'entraînement de modèle actives après chaque tâche pendant une durée spécifique. Cela leur permet de lancer un entraînement en utilisant une instance déjà opérationnelle, afin d'effectuer des expérimentations itératives ou d'entraîner consécutivement de grands volumes de modèles. Grâce aux Warm Pools d'entraînement gérés SageMaker, les clients peuvent réduire jusqu'à 8 fois la latence de démarrage d'une tâche d'entraînement de modèle. Pour activer les Warm Pools d'entraînement gérés SageMaker, les clients peuvent spécifier une période de persistance (keep-alive) dans l'API d'entraînement. S'ils choisissent d'utiliser les Warm Pools, ils sont alors facturés selon la durée de la période de persistance des instances et des volumes EBS.
Les Warm Pools d'entraînement gérés SageMaker sont disponibles dans toutes les régions AWS publiques où est disponible Amazon SageMaker Model Training. Pour commencer, consultez la page Entraînement à l'aide des Warm Pools gérés SageMaker dans le Guide du développeur d'Amazon SageMaker.