Auto Scaling le permite mantener la disponibilidad de la aplicación y aumentar o reducir dinámicamente la capacidad de Amazon EC2 según las condiciones que defina. Puede usar Auto Scaling para la administración de la flota de instancias de EC2 con el fin de ayudar a mantener el estado y la disponibilidad de su flota y garantizar que ejecute la cantidad deseada de instancias de Amazon EC2. También puede usar Auto Scaling para el escalado dinámico de las instancias de EC2 con el fin de incrementar automáticamente la cantidad de instancias de Amazon EC2 durante los picos de demanda para mantener el desempeño y reducir la capacidad durante los periodos de menor demanda para reducir los costos. Auto Scaling resulta adecuado tanto para aplicaciones con patrones estables de demanda como para aquellas aplicaciones que muestran variaciones de uso según la hora, el día o la semana. Además de Auto Scaling para Amazon EC2, puede usar Auto Scaling de aplicaciones para escalar automáticamente recursos para otros servicios de AWS, incluidos Amazon ECS, flotas de subasta de Amazon EC2, clústeres de Amazon EMR, flotas de AppStream 2.0 y Amazon DynamoDB.

Comience ya a utilizar Auto Scaling
VideoThumbnail

Comience con AWS de forma gratuita

Cree una cuenta gratuita
O inicie sesión en la Consola

Disfrute de doce meses de acceso a la capa de uso gratuita de AWS y de otras características del nivel Basic de AWS Support, entre otras, un servicio ininterrumpido de soporte al cliente, foros de soporte y muchas más.


Tanto si utiliza una instancia de Amazon EC2 como miles, puede usar Auto Scaling para detectar las instancias perdidas o defectuosas de Amazon EC2 y sustituirlas sin necesidad de intervención por su parte. Así se garantiza que su aplicación obtenga la capacidad de cómputo esperada. Para automatizar la administración de la flota de instancias de EC2, Auto Scaling realiza tres funciones principales, que se describen aquí y en nuestro blog, Fleet Management Made Easy with Auto Scaling.

  • Monitorizar el estado de las instancias en ejecución
    Auto Scaling se asegura de que su aplicación pueda recibir tráfico y de que las instancias funcionen adecuadamente. Cuando Auto Scaling detecta una comprobación de estado fallida, puede sustituir la instancia automáticamente.
  • Sustitución automática de instancias en mal estado
    Cuando una instancia en mal estado no supera una comprobación de estado, Auto Scaling la elimina automáticamente y la sustituye por otra. Por lo tanto, no tiene que responder manualmente cuando es necesario sustituir una instancia.
  • Equilibrar la capacidad entre las zonas de disponibilidad
    Auto Scaling equilibra automáticamente las instancias de EC2 entre zonas cuando hay varias zonas configuradas, y siempre implementa instancias nuevas de manera que estén equilibradas entre zonas de la manera más uniforme posible en toda la flota.   

Auto Scaling le permite seguir de cerca la curva de la demanda de sus aplicaciones, lo que reduce la necesidad de aprovisionar capacidad de Amazon EC2 manualmente por adelantado. Por ejemplo, puede utilizar políticas de escalado de seguimiento del objetivo para seleccionar una métrica de carga para su aplicación, como el uso de la CPU. O podría elegir un valor objetivo usando la nueva métrica “Recuento de solicitudes por objetivo” del balanceador de carga de aplicaciones, una opción de balanceo del servicio Elastic Load Balancing. A continuación, Auto Scaling ajustará automáticamente la cantidad de instancias de EC2 necesarias para mantener su objetivo. También puede usar políticas de escalado sencillas y configurar una condición para añadir nuevas instancias de Amazon EC2 en incrementos al grupo de Auto Scaling cuando el uso medio de su flota de Amazon EC2 es elevado. Del mismo modo, puede definir una condición para eliminar instancias de Amazon EC2 en los mismos incrementos cuando la utilización de la CPU sea baja. Si los cambios en la carga son predecibles, también puede utilizar Auto Scaling para programar las actividades de escalado. También puede utilizar Auto Scaling con Amazon CloudWatch, que puede enviar alarmas para activar actividades de escalado, y Elastic Load Balancing para ayudar a distribuir el tráfico a sus instancias en grupos de Auto Scaling.

AutoScaling
NASA JPL analiza el escalado dinámico en re:Invent 2016

Con el Auto Scaling de aplicaciones, puede escalar recursos automáticamente para otros servicios además de Amazon EC2. La experiencia es similar a la de Auto Scaling. Puede usar Auto Scaling de aplicaciones para definir políticas de escalado que le permitan escalar automáticamente recursos de AWS, escalar recursos en respuesta a alarmas de CloudWatch y ver el historial de los eventos de escalado.

Auto Scaling de aplicaciones puede escalar los siguientes recursos de AWS:

  • Servicios de Amazon ECS: Su servicio de Amazon ECS se puede configurar de manera opcional para que use Auto Scaling de servicios con el fin de incrementar o reducir el recuento deseado como respuesta a alarmas de CloudWatch. Para obtener más información, lea la documentación.
  • Flotas de subasta de Amazon EC2: Una flota de subasta puede implementar instancias (aumentar la capacidad) o eliminar instancias (reducir la capacidad) en el rango que elija y como respuesta a una o más políticas de escalado. Para obtener más detalles, consulte la documentación de .
  • Clústeres de Amazon EMR: Auto Scaling en Amazon EMR le permite escalar de manera programática nodos principales y nodos de tarea en un clúster en función de las reglas que especifique en una política de escalado. Para obtener más información, lea la documentación.
  • Flotas de AppStream 2.0: Puede definir políticas de escalado que se ajusten al tamaño de la flota automáticamente en función de una gran variedad de métricas de uso y optimizar el número de instancias ejecutadas para satisfacer la demanda de los usuarios. También puede elegir desactivar el escalado automático y hacer que la flota se ejecute con un tamaño fijo. Para obtener más información, consulte la documentación.
  • Amazon DynamoDB: Puede ajustar dinámicamente la capacidad de desempeño aprovisionada como respuesta a patrones del tráfico real. Eso permite a una tabla o índice secundario global incrementar su capacidad de lectura y escritura aprovisionada para abastecer incrementos repentinos del tráfico sin limitaciones. Cuando la carga de trabajo disminuye, Auto Scaling de aplicaciones reduce el desempeño para que no pague por capacidad aprovisionada no utilizada. Para obtener más información, consulte la documentación de . También puede leer nuestro blog, Auto Scaling for Amazon DynamoDB.
  • ¡Novedad! Réplicas de Amazon Aurora: puede añadir o eliminar automáticamente réplicas de Aurora en respuesta a modificaciones realizadas en métricas predefinidas, como uso promedio de CPU o conexiones activas promedio. También puede crear métricas personalizadas y ajustar la escala en ellas. Las réplicas de Aurora comparten el mismo volumen subyacente que la instancia principal en un clúster de base de datos y son adecuadas para el escalado de lecturas. Esta capacidad está disponible para clústeres de base de datos compatibles con Aurora MySQL. Para obtener más información, consulte la documentación.