Publicado en: Mar 4, 2022
La inferencia asíncrona y sin servidor de Amazon SageMaker ya es compatible con el SDK de Python de Amazon SageMaker, que simplifica los pasos necesarios para la implementación y, por lo tanto, el flujo de trabajo de implementación del modelo. El SDK de Python de SageMaker es una biblioteca de código abierto para implementar modelos de machine learning en Amazon SageMaker. Puede utilizar cualquiera de los marcos optimizados de machine learning, algoritmos propios compatibles con SageMaker, o traer su propio modelo para implementar utilizando el SDK de Python.
SageMaker ofrece múltiples opciones de inferencia, tales como la inferencia en tiempo real, la inferencia sin servidor (en versión preliminar), la inferencia asíncrona y la transformación por lotes, para que pueda elegir la opción que mejor se adapte a su carga de trabajo. El SDK de SageMaker Python ya soporta la inferencia en tiempo real y la transformación por lotes. Gracias a la compatibilidad con la inferencia sin servidor (en versión preliminar) y con la inferencia asíncrona, ahora puede utilizar los mismos métodos de la API del SDK de Python en todas las opciones de inferencia. Ahora puede elegir entre la consola de administración de AWS, el SDK de AWS Boto3, la AWS CLI y el SDK de Python para la implementación del modelo.
Puede invocar un punto de conexión de inferencia asíncrona a través del SDK de Python pasando la carga en línea con la solicitud. El SDK de SageMaker cargará la información en el bucket de S3 e invocará el punto de conexión en su nombre. El SDK de Python también agrega compatibilidad con la verificación periódica y la devolución del resultado de la inferencia tras su finalización.
Para comenzar, lea la documentación del SDK de Python para inferencia sin servidor e inferencia asíncrona.