Publié le: Mar 4, 2022
Désormais, les options d'inférence sans serveur et asynchrone d'Amazon SageMaker prennent en charge le kit SDK Python Amazon SageMaker qui élimine les étapes requises pour le déploiement et simplifie ainsi le flux du déploiement du modèle. Le kit SDK Python SageMaker est une bibliothèque open source pour déployer des modèles de machine learning sur Amazon SageMaker. Vous pouvez vous servir des cadres de machine learning optimisés, des algorithmes de première partie pris en charge par SageMaker, ou utiliser vos propres modèles pour le déploiement avec le kit SDK Python.
SageMaker offre plusieurs options d'inférence dont en temps réel, sans serveur (en version préliminaire), asynchrone et en transformation par lots afin de vous proposer la solution la plus adaptée à votre charge de travail. Le kit SDK Python SageMaker prend déjà en charge les inférences en temps réel et en transformation par lots. Désormais, avec la prise en charge des inférences sans serveur (en version préliminaire) et asynchrone, vous pouvez utiliser les mêmes méthodes d'API de kit SDK Python sur toutes les options d'inférence. Vous avez maintenant le choix entre la console de gestion AWS, le kit SDK Boto3 AWS, l'interface de ligne de commande AWS CLI et le kit SDK Python pour le déploiement de modèles.
Vous pouvez invoquer un point de terminaison d'inférence asynchrone via le kit SDK Python en transmettant la charge utile en ligne avec la requête. Le kit SDK SageMaker chargera la charge utile sur votre compartiment S3 et appellera le point de terminaison en votre nom. Le kit SDK Python permet aussi maintenant de vérifier et renvoyer périodiquement le résultat d'inférence après le traitement.
Pour commencer, veuillez lire les sections sur l'inférence sans serveur et l'inférence asynchrone de la documentation du kit SDK Python.