Publicado en: Feb 28, 2018

Ahora puede configurar el Auto Scaling de sus puntos de enlace desde la consola de Amazon SageMaker, la API de AWS Auto Scaling y el SDK de AWS, facilitando las tareas de administración de la capacidad. Mediante Amazon SageMaker, puede especificar el número y el tipo de instancias por cada punto de enlace para escalar sus inferencias según sus necesidades. Si cambia el volumen de su inferencia, puede cambiar el número o el tipo de las instancias que respaldan cada punto de enlace para dar cabida a dicho cambio. Al utilizar Auto Scaling, puede ajustar automáticamente la capacidad de la inferencia para mantener un desempeño predecible a un costo reducido. Desde la consola de Amazon SageMaker, puede configurar el número mínimo y máximo de instancias para el punto de enlace y, a continuación, seleccionar la tasa de transferencia por instancia. Amazon SageMaker se encargará de monitorizar los modelos implementados para ajustar automáticamente el número de instancias y mantener la tasa de transferencia dentro de los niveles deseados, respondiendo a los cambios en el tráfico de las aplicaciones. De esta forma, resulta más fácil gestionar modelos en producción, y puede ayudar a reducir el costo de los modelos implementados.

Auto Scaling en Amazon SageMaker está disponible en las regiones de AWS EE.UU Este (Norte de Virginia y Ohio), UE (Irlanda) y EE.UU Oeste (Oregón). Visite la documentación para más conocer más detalles acerca del escalado automático de modelos en Amazon SageMaker.