Aspectos generales

P: ¿Qué es AWS Auto Scaling?

AWS Auto Scaling es un servicio nuevo de AWS que lo ayuda a optimizar el nivel de rendimiento de las aplicaciones y, simultáneamente, a bajar los costos de infraestructura mediante el escalado sencillo y seguro de varios recursos de AWS. Simplifica el proceso de escalado al permitirle escalar grupos de recursos relacionados que respaldan aplicaciones con unos pocos clics. AWS Auto Scaling lo ayuda a configurar políticas de escalado uniformes y coherentes en toda la pila de infraestructura que respalda las aplicaciones. AWS Auto Scaling escalará automáticamente recursos según sea necesario para adaptarse a la estrategia de escalado seleccionada, a los fines de que pueda conservar el nivel de rendimiento y pagar únicamente por los recursos que realmente necesite.

P: ¿Cuáles son los beneficios de usar AWS Auto Scaling?

AWS Auto Scaling es una manera rápida y sencilla de optimizar el rendimiento y los costos de sus aplicaciones.

  • Configure el escalado rápidamente: AWS Auto Scaling ofrece una experiencia de escalado unificada para todos los recursos escalables que respaldan el funcionamiento de su aplicación. Puede ver el nivel de uso promedio de todos los recursos escalables y definir rápidamente valores de uso meta para cada grupo de recursos similares, a partir de una única interfaz intuitiva.
  • Tome decisiones de escalado inteligentes: AWS Auto Scaling le permite automatizar la manera en la que grupos de recursos diferentes responderán ante modificaciones en el nivel de la demanda. Las estrategias de escalado que son fáciles de comprender le permiten elegir entre optimizar la disponibilidad, los costos o un equilibrio entre ambos. AWS Auto Scaling crea todas las políticas de escalado y define los valores meta por usted automáticamente en función de sus preferencias.
  • Conserve el nivel de rendimiento automáticamente: AWS Auto Scaling monitorea de manera automática los recursos subyacentes a la aplicación para garantizar que estén funcionando de acuerdo con los niveles de rendimiento definidos. Cuando se producen picos en la demanda, AWS Auto Scaling aumenta automáticamente la capacidad de los recursos limitados para poder conservar el alto nivel de calidad del servicio.
  • Anticipe los costos y evite los gastos innecesarios: AWS Auto Scaling lo ayuda a optimizar el uso y los costos al consumir servicios de AWS para que pague únicamente los recursos que realmente necesite. Cuando la demanda disminuya, AWS Auto Scaling quitará automáticamente la capacidad excedente de los recursos para evitar gastos innecesarios.

P: ¿Cuándo debería usar AWS Auto Scaling?

Debería usar AWS Auto Scaling si tiene una aplicación que usa uno o más recursos escalables y cuya carga varía. Un buen ejemplo sería una aplicación web de e-commerce que recibe tráfico variable durante el día. Cuenta con una arquitectura de tres capas estándar con Elastic Load Balancing para la distribución del tráfico entrante, Amazon EC2 para la capa informática y DynamoDB para la capa de datos. En este caso, AWS Auto Scaling escalará uno o más grupos de EC2 Auto Scaling y las tablas de DynamoDB que respaldan la aplicación en respuesta a la curva de demanda.

P: ¿Cómo puedo comenzar a usar AWS Auto Scaling?

AWS Auto Scaling le permite seleccionar aplicaciones en función de etiquetas de recursos o pilas de AWS CloudFormation. Con unos pocos clics, puede crear un plan de escalado para su aplicación que definirá de qué manera debe escalarse cada recurso de la misma. Para cada recurso, AWS Auto Scaling crea una política de escalado de seguimiento de valores meta con las métricas más utilizadas para dicho tipo de recurso y conserva un valor meta en función de la estrategia de escalado que haya seleccionado. A fin de definir valores meta para las métricas de los recursos, puede elegir a partir de tres recomendaciones de escalado predefinidas que optimizan la disponibilidad y los costos, o equilibran ambos. O bien, si lo prefiere, puede definir sus propios valores meta. AWS Auto Scaling también define automáticamente los valores mínimos y máximos para los recursos.

Opciones de escalado

P: ¿Cuáles son las diferentes maneras en las que puedo ajustar la escala de los recursos de AWS?

Los clientes de AWS tienen varias opciones para ajustar la escala de los recursos. Amazon EC2 Auto Scaling lo ayuda a garantizar que cuenta con la cantidad correcta de instancias Amazon EC2 disponibles para controlar la carga de su aplicación. EC2 Auto Scaling también puede detectar cuando una instancia presenta un error, finalizarla y lanzar una nueva de reemplazo. Cuando usa EC2 Auto Scaling, sus aplicaciones cuentan con un mejor nivel de tolerancia a errores, una mayor disponibilidad y una mejor administración de costos.

Si desea ajustar la escala de un recurso diferente a EC2, puede usar la API Application Auto Scaling, que le permite definir políticas de escalado a fin de ajustar automáticamente la escala de sus recursos de AWS o programar acciones de escalado únicas o recurrentes. Application Auto Scaling puede ajustar la escala de servicios ECS de Amazon, flotas de Amazon EC2 Spot, clústeres Amazon EMR, flotas de Amazon AppStream 2.0; también puede aprovisionar capacidad de lectura y escritura para tablas e índices secundarios globales de Amazon DynamoDB, réplicas de Amazon Aurora y variantes de puntos de enlace de Amazon SageMaker.

Si desea configurar el escalado automático para varios recursos de diferentes servicios, use AWS Auto Scaling a fin de crear un plan de escalado para los recursos subyacentes a la aplicación. AWS Auto Scaling también se utiliza para crear escalas predictivas para los recursos de EC2.

P: ¿Cuándo debería usar AWS Auto Scaling en lugar de Amazon EC2 Auto Scaling?

Debe usar AWS Auto Scaling para administrar el escalado de varios recursos en diferentes servicios. AWS Auto Scaling le permite definir políticas de escalado dinámico para varios grupos de EC2 Auto Scaling u otros recursos mediante estrategias de escalado predefinidas. Usar AWS Auto Scaling para configurar políticas de escalado para todos los recursos escalables de su aplicación es más rápido que administrar las políticas de escalado para cada recurso a través de su consola de servicio individual. También es más fácil, ya que AWS Auto Scaling incluye estrategias de escalado predefinidas que simplifican la configuración de las políticas de escalado. También debería utilizar AWS Auto Scaling si desea crear escalas predictivas para los recursos de EC2.

Debe usar EC2 Auto Scaling si solo necesita escalar grupos de Amazon EC2 Auto Scaling o si únicamente quiere conservar el funcionamiento correcto de la flota de EC2. También debe usar EC2 Auto Scaling si necesita crear o configurar grupos de Amazon EC2 Auto Scaling, o si necesita configurar políticas de escalado programadas o escalonadas (ya que AWS Auto Scaling solo admite políticas de escalado de seguimiento de valores meta).

Los grupos de EC2 Auto Scaling deben crearse y configurarse fuera de AWS Auto Scaling, como a través de la consola de EC2, la API Auto Scaling o mediante CloudFormation. AWS Auto Scaling puede ayudarlo a configurar políticas de escalado dinámicas para sus grupos de EC2 Auto Scaling existentes.

P: ¿Cuándo debería usar AWS Auto Scaling en lugar de Auto Scaling para los servicios individuales?

Debe usar AWS Auto Scaling para administrar el escalado de varios recursos en diferentes servicios. AWS Auto Scaling hace posible ajustar la escala de varios recursos de manera unificada y cuenta con una guía predefinida que facilita y agiliza la configuración del escalado. Si lo prefiere, en su lugar puede usar las consolas de servicio individual, la API Auto Scaling o la API Application Auto Scaling para ajustar la escala de los servicios de AWS individuales. También debe usar las consolas individuales o las API si desea configurar políticas de escalado escalonadas o escalado programado, ya que AWS Auto Scaling solo crea políticas de escalado de seguimiento de valores meta.

P: ¿Qué es el escalado predictivo?

El escalado predictivo es una característica de AWS Auto Scaling que observa los patrones de tráfico históricos y los predice en el futuro para programar cambios en la cantidad de instancias EC2 en los momentos apropiados. El escalado predictivo utiliza los modelos de aprendizaje automático para predecir los patrones diarios y semanales.

La mejora de Auto Scaling con el escalado predictivo ofrece un aprovisionamiento de capacidad más rápido, sencillo y preciso, lo que se traduce en un menor costo y en aplicaciones con mayor capacidad de respuesta. Al predecir los cambios de tráfico, el escalado predictivo proporciona instancias EC2 antes de los cambios de tráfico, lo que hace que Auto Scaling sea más rápido y preciso.

P: ¿Con qué servicios puedo usar el escalado predictivo?

En este momento, el escalado predictivo solo genera programas para instancias EC2.

P: ¿Cómo puedo usar el escalado predictivo con el seguimiento de valores meta?

El escalado predictivo funciona junto con el seguimiento de valores meta para que los cambios de capacidad de EC2 respondan mejor al tráfico entrante de las aplicaciones. Mientras que el escalado predictivo establece la capacidad mínima para su aplicación basada en el tráfico previsto, el seguimiento de valores meta cambia la capacidad real basada en el tráfico real en ese momento. El seguimiento de valores meta trabaja para rastrear los niveles de utilización de capacidad deseados en condiciones de tráfico variables y aborda los picos de tráfico imprevistos y otras fluctuaciones. El escalado predictivo y el seguimiento de valores meta son configurados conjuntamente por un usuario para generar un plan de escalado.

P: ¿Qué es un plan de escalado?

Un plan de escalado es una recopilación de instrucciones de escalado para múltiples recursos de AWS. Se configura un plan de escalado seleccionando primero todos los recursos de EC2 subyacentes a su aplicación en AWS Auto Scaling. A continuación, se selecciona la métrica de utilización de recursos que se desea rastrear, como la utilización de la CPU, y se configura el valor para rastrear, por ejemplo, 50%. Por último, se selecciona la métrica de CloudWatch que representa el flujo de tráfico de entrada; es posible que haya que configurarlo si aún no se ha hecho.

La métrica de utilización de recursos y la métrica de tráfico de entrada son los parámetros clave para el plan de escalado. El escalado predictivo utiliza la métrica de tráfico de entrada para generar predicciones de tráfico. Basándose en estas predicciones, el escalado predictivo programa futuras acciones de escalado para configurar la capacidad mínima. El escalado dinámico utiliza la métrica de utilización de recursos y su valor meta para cambiar de manera dinámica la capacidad de EC2 de su aplicación a lo largo del tiempo a medida que el tráfico varía.

P: ¿Puedo configurar el plan de escalado sin el escalado predictivo?

Sí, puede configurar un plan de escalado solo con el escalado dinámico y desactivar el escalado predictivo. Por otro lado, también puede activar el escalado predictivo sin configurar el escalado dinámico.

P: ¿Cuántos datos históricos necesita el escalado predictivo para generar el plan de escalado?

El escalado predictivo necesita hasta dos semanas de datos históricos, pero puede generar un programa de escalado predictivo con tan solo un día de datos.

P: ¿Cuánto tiempo a futuro alcanza a realizar predicciones el escalado predictivo del tráfico?

Cada 24 horas, el escalado predictivo predice el tráfico 48 horas a futuro y programa cambios de capacidad para esas 48 horas.

P: ¿Puedo configurar el escalado predictivo para el aprovisionamiento de las instancias antes de que se produzca un pico real en el tráfico?

Sí, puede configurar de manera opcional el tiempo de búfer para aprovisionar instancias en algún momento antes de un cambio de tráfico previsto. Esto es útil para aplicaciones cuyas instancias EC2 necesitan algún tiempo de “calentamiento” antes de que estén listas para servir al tráfico de aplicaciones.

P: ¿Cuánto cuesta el escalado predictivo?

Al igual que con otras funciones de Auto Scaling, el escalado predictivo es de uso gratuito. Se paga por los recursos que se utilizan para ejecutar las aplicaciones.

P: ¿Qué diferencias existen entre AWS Auto Scaling y las capacidades de escalado de los servicios individuales?

La siguiente tabla muestra una comparación entre las opciones de escalado de AWS.

  AWS
Auto Scaling
Amazon EC2
Auto Scaling
Auto Scaling
para otros servicios
Recursos que puede escalar Grupos de EC2 Auto Scaling
Flotas de EC2 Spot
Servicios de ECS
Capacidad de DynamoDB aprovisionada para tablas y GSI
Réplicas de Aurora
Grupos de EC2 Auto Scaling Flotas de EC2 Spot
Servicios de ECS
Capacidad de DynamoDB aprovisionada para tablas y GSI
Réplicas de Aurora
Clústeres EMR
Flota de Appstream 2.0
Variantes de puntos de enlace de SageMaker
Método de escalado Escalado de todas las aplicaciones con una interfaz unificada
Un grupo de Auto Scaling a la vez Un recurso a la vez
Escalado predictivo Sí (solo con EC2) No No
Detección automática de todos los
recursos escalables de su aplicación
No No
Capacidad para escalar varios recursos en diferentes servicios con una interfaz unificada No
No
Asesoramiento y recomendaciones
para configurar políticas de escalado
No No
Capacidad para crear y configurar
Grupos de Auto Scaling
No
No corresponde
Capacidad para usar Auto Scaling únicamente para
Administración de flotas de EC2  
No No corresponde
Configuración de
políticas de escalado de seguimiento de valores meta inteligentes y de optimización automática*
Configuración de acciones de escalado programadas No
Configuración de políticas de escalado escalonadas No
Configurar una política de escalado con límites y métricas diferentes para cada recurso No

* Recomendación en lugar de las políticas de escalado escalonadas

Características

P: ¿Qué recursos puedo escalar con AWS Auto Scaling?

Puede usar AWS Auto Scaling para configurar el escalado de los siguientes recursos de su aplicación, mediante una sola interfaz unificada:

P: ¿En qué parámetros se basa AWS Auto Scaling para hacer recomendaciones de escalado?

Las recomendaciones de escalado de AWS Auto Scaling se basan en las métricas y los límites de escalado más utilizados para Auto Scaling. También recomienda límites de escalado seguros mediante el suministro de recomendaciones para los tamaños mínimos y máximos de los recursos. De esta manera, puede comenzar a usar el servicio rápidamente y, con el transcurso del tiempo, ajustar la estrategia de escalado.

P: ¿De qué manera selecciono una pila de aplicaciones dentro de AWS Auto Scaling?

Puede seleccionar una pila de AWS CloudFormation o recursos en función de etiquetas de recursos comunes. Tenga en cuenta que, actualmente, los servicios de ECS no se pueden detectar con etiquetas.

P: ¿De qué manera AWS Auto Scaling detecta los recursos que se pueden escalar?

AWS Auto Scaling analizará la pila de AWS CloudFormation seleccionada o los recursos con las etiquetas especificadas para identificar los tipos de recursos de AWS admitidos que se pueden escalar. Tenga en cuenta que, actualmente, los servicios de ECS no se pueden detectar con etiquetas.

Disponibilidad y precios

P: ¿En qué regiones se encuentra disponible AWS Auto Scaling?

AWS Auto Scaling está disponible en las regiones públicas de AWS de EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), UE (Irlanda) y Asia Pacífico (Singapur), a las que pronto se añadirán otras.

P: ¿Cuánto cuesta el servicio AWS Auto Scaling?

Al igual que el servicio de Auto Scaling en recursos de AWS individuales, el uso de AWS Auto Scaling es gratuito. Amazon CloudWatch activa AWS Auto Scaling, por lo que se aplican las tarifas para CloudWatch y los recursos de su aplicación (como instancias Amazon EC2, los balanceadores de carga de Elastic Load Balancing, etc.).

Obtenga más información sobre los precios de AWS Auto Scaling

Visite la página de precios
¿Listo para comenzar?
Inscribirse
¿Tiene más preguntas?
Contacte con nosotros