Publié le: Aug 9, 2022
L’ajustement automatique de modèle d’Amazon SageMaker prend maintenant en charge plusieurs types d’instance d’entraînement alternés de SageMaker afin de rendre les tâches d’ajustement plus robustes lorsque le type d’instance de préférence est indisponible en raison d’un manque de capacité.
L’ajustement de modèle de SageMaker trouve la meilleure version d’un modèle en exécutant de nombreuses tâches d’entraînement sur le jeu de données en utilisant les gammes d’hyper paramètres que vous fournissez pour votre algorithme. Ensuite, il choisit les valeurs d’hyper paramètres optimales qui donnent lieu à un modèle au meilleur de ses performances, tel que mesuré par un métrique que vous choisissez.
Auparavant, lorsque vous créiez des tâches d’ajustement automatique de SageMaker, vous ne pouviez définir qu’un seul type d’instance d’entraînement de SageMaker. Si la capacité pour ce type d’instance était faible, vous feriez face à une exécution de tâche accrue et à de grands risques d’échecs de tâches d’ajustement. Ceci était particulièrement indésirable, étant donné que l’ajustement d’hyper paramètres implique d’exécuter plusieurs tâches d’entraînement de potentielle longue durée, ce qui nécessiterait un redémarrage à partir de zéro en présence de tels échecs. Grâce à ce lancement, vous pouvez maintenant spécifier jusqu’à 5 types d’instance alternées en plus, dans l’ordre que vous préférez, afin que la tâche d’ajustement des hyper paramètres puissent automatiquement revenir au type d’instance alternée suivant, en présence d’une capacité insuffisante. Cela rend les tâches d’ajustement résilientes aux scénarios de capacité insuffisante et vous permet d’ajuster vos modèles sans la moindre augmentation d’exécution ou le moindre échec dû à la faible disponibilité de certaines instances d’entraînement de SageMaker.
La capacité à spécifier plusieurs types d’instances alternées dans l’ajustement de modèle automatique de SageMaker est maintenant disponible dans toutes les régions commerciales d’AWS. Pour en apprendre davantage, veuillez consulter guide de référence API et la documentation technique.