Publicado en: Apr 21, 2022
Hoy, nos complace anunciar la disponibilidad general de la inferencia sin servidor de Amazon SageMaker en todas las regiones de AWS donde SageMaker se encuentra disponible de manera general (excepto las regiones de China de AWS). Con la inferencia sin servidor de SageMaker, puede implementar de forma rápida los modelos de machine learning (ML) para inferencias sin tener que configurar o administrar la infraestructura subyacente. Al implementar los modelos de ML, tan solo seleccione la opción sin servidor y Amazon SageMaker aprovisionará, escalará y desactivará de forma automática la capacidad de computación en función del volumen de las solicitudes de inferencia. Con la inferencia sin servidor de SageMaker, solo paga por la capacidad de computación utilizada para procesar las solicitudes de inferencia, (facturada por milisegundos) y la cantidad de datos procesados; no paga por tiempo de inactividad. La inferencia sin servidor de SageMaker es ideal para aplicaciones con tráfico intermitente o impredecible.
Desde el lanzamiento de la vista previa en re:Invent 2021, agregamos compatibilidad con Amazon SageMaker Python SDK, que ofrece abstracciones para simplificar la implementación de modelos y compatibilidad con el registro de modelos, que permite integrar los puntos de conexión de inferencia sin servidor con el flujo de trabajo MLOps. Además, incrementamos el máximo de invocaciones concurrentes por límite de punto de conexión a 200 (desde 50 durante la vista previa), lo que permite que utilice la inferencia sin servidor de SageMaker para las cargas de trabajo de alto tráfico.
Puede crear un punto de conexión de inferencia sin servidor de SageMaker desde la consola de AWS, AWS SDK para Python (Boto3), SageMaker Python SDK, AWS CloudFormation o AWS Command Line Interface (AWS CLI). La inferencia sin servidor de SageMaker ahora se encuentra disponible de manera general en las siguientes 21 regiones de AWS: Este de EE. UU. (Ohio), Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), África (Ciudad del Cabo), Asia-Pacífico (Hong Kong), Asia-Pacífico (Bombay), Asia-Pacífico (Osaka), Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Tokio), Canadá (Central), Europa (Fráncfort), Europa (Irlanda), Europa (Londres), Europa (Milán), Europa (París), Europa (Estocolmo), Medio Oriente (Baréin) y América del Sur (São Paulo).
Introducción:
- Consulte la publicación de blog de la inferencia sin servidor de Amazon SageMaker
- Consulte la guía para desarrolladores de la inferencia sin servidor de SageMaker
- Descargue las muestras de bloc de notas en GitHub de la inferencia sin servidor de SageMaker
- Consulte la página de precios de Amazon SageMaker