Personnalisez les versions de votre logiciel de déploiement de modèles Amazon SageMaker et de vos pilotes
Vous pouvez désormais sélectionner les versions du logiciel et du pilote utilisées par les instances qui répondent le mieux à vos besoins lors du déploiement de modèles sur SageMaker. Amazon SageMaker simplifie le déploiement de modèles de ML, y compris des modèles de fondation (FM), afin de répondre aux demandes d’inférence au meilleur rapport prix/performances, quel que soit le cas d’utilisation.
Auparavant, les clients devaient utiliser des versions prédéfinies de logiciels et de pilotes définies par SageMaker sur les instances gérées situées derrière un terminal. Les clients peuvent désormais spécifier le paramètre « InferenceAmiVersion » lors de la configuration des points de terminaison afin de sélectionner la combinaison de versions du logiciel et du pilote (telle que le pilote Nvidia et la version CUDA) qui répond le mieux à leurs besoins. Cela vous permet de personnaliser votre environnement d'hébergement en fonction des performances, de la compatibilité, de l'évolutivité et des exigences opérationnelles de vos applications de machine learning. Grâce à ce paramètre, vous pouvez également rétrograder et mettre à niveau les versions des pilotes pour vos points de terminaison selon votre propre calendrier.
Cette fonctionnalité est disponible dans toutes les régions où SageMaker est proposé. Pour en savoir plus sur le déploiement de modèles sur SageMaker, cliquez ici et apprenez-en davantage sur cette fonctionnalité dans notre documentation.