O Auto Scaling ajuda a manter a disponibilidade das aplicações e permite aumentar ou reduzir, automaticamente e de modo dinâmico, a escala vertical da capacidade do Amazon EC2, de acordo com condições definidas. É possível usar o Auto Scaling para fazer o gerenciamento de frotas de instâncias EC2 para ajudar a manter a integridade e a disponibilidade da sua frota, além de garantir que o número desejado de instâncias do Amazon EC2 esteja sendo executado. Também é possível usar o Auto Scaling para a escalabilidade dinâmica de instâncias EC2 com o objetivo de aumentar automaticamente o número de instâncias do Amazon EC2 durante picos de demanda, mantendo a performance e reduzindo a capacidade durante interrupções para diminuir custos. O Auto Scaling é ideal para aplicações com padrões de demanda estáveis ou que passam por variações de utilização horárias, diárias ou semanais. Além do Auto Scaling para Amazon EC2, você pode usar o Application Auto Scaling para ajustar automaticamente a escala de recursos de outros Serviços da AWS, como o Amazon ECS, as frotas spot do Amazon EC2, os clusters do Amazon EMR, as frotas do AppStream 2.0 e o Amazon DynamoDB.

Comece a usar agora o Auto Scaling
VideoThumbnail

Comece a usar a AWS gratuitamente

Crie uma conta gratuita
Ou faça login no Console

Receba doze meses de acesso ao nível de uso gratuito da AWS e aproveite os recursos do AWS Basic Support incluindo atendimento ao cliente 24 horas por dia, todos os dias do ano, e fóruns de suporte, entre outros recursos.


Independentemente de executar uma instância do Amazon EC2, ou milhares, você pode usar o Auto Scaling para detectar instâncias deficientes e aplicativos não saudáveis do Amazon EC2 e substituir essas instâncias sem intervenção manual. Isso garante que a aplicação receberá a capacidade computacional esperada. Para automatizar o gerenciamento de frotas de instâncias EC2, o Auto Scaling executará três funções principais, que estão descritas aqui e na publicação Fleet Management Made Easy with Auto Scaling do nosso blog.

  • Monitoramento da integridade de instâncias em execução
    O Auto Scaling garante que a sua aplicação esteja apta a receber tráfego e que as próprias instâncias estejam funcionando corretamente. Quando o Auto Scaling detecta uma verificação de integridade com falha, ele pode substituir a instância automaticamente.
  • Substituição automática de instâncias com falha
    Quando uma instância com falha é reprovada em uma verificação de integridade, o Auto Scaling a encerra automaticamente e a substitui por uma nova. Isso significa que não é necessário responder manualmente quando uma instância precisa ser substituída.
  • Capacidade de balanceamento nas zonas de disponibilidade
    O Auto Scaling balanceia automaticamente instâncias EC2 entre zonas, quando várias delas estiverem configuradas, e sempre executa novas instâncias, de modo que estejam balanceadas entre zonas o mais uniformemente possível em toda a frota.   

O Auto Scaling permite acompanhar de perto a curva da demanda por aplicações, reduzindo a necessidade de provisionar antecipada e manualmente a capacidade do Amazon EC2. Por exemplo, é possível usar as políticas de escalabilidade de rastreamento de destino para selecionar uma métrica de carregamento para aplicações, como a utilização de CPU. Também existe a possibilidade de definir um valor de destino usando a nova métrica "Request Count Per Target" do Application Load Balancer, que é uma opção de balanceamento de carga do serviço Elastic Load Balancing. Depois disso, o Auto Scaling ajustará automaticamente o número de instâncias EC2, conforme for necessário para manter seu destino. Também é possível usar políticas simples de escalabilidade para definir uma condição para adicionar novas instâncias do Amazon EC2 em incrementos quando a utilização média da frota do Amazon EC2 for elevada. Da mesma forma, é possível estabelecer uma condição para remover instâncias usando os mesmos incrementos quando a utilização de CPU for baixa. Se você tiver alterações de carga previsíveis, também poderá definir um agendamento no Auto Scaling para planejar ações de escalabilidade. O Auto Scaling também pode ser usado com o Amazon CloudWatch, que pode enviar alarmes para acionar ações de escalabilidade, e o Elastic Load Balancing, para ajudar a distribuir o tráfego para suas instâncias dentro dos grupos de Auto Scaling.

AutoScaling
NASA JPL discute escalabilidade dinâmica no re:Invent 2016

Com o Application Auto Scaling, é possível ajustar automaticamente a escala de recursos de outros Serviços da AWS, além do Amazon EC2. A experiência é similar à do Auto Scaling. Você pode usar o Application Auto Scaling para definir as políticas de escalabilidade a fim de escalar automaticamente recursos da AWS, escalar recursos em resposta a alarmes do CloudWatch e ver o histórico de eventos de escalabilidade.

O Application Auto Scaling pode ajustar a escala dos seguintes recursos da AWS:

  • Serviços Amazon ECS: o Amazon ECS service pode, como opção, ser configurado para usar o Service Auto Scaling para aumentar ou reduzir sua contagem desejada em resposta aos alarmes do CloudWatch. Para obter mais informações, leia a nossa documentação.
  • Frotas spot do Amazon EC2: uma frota spot pode executar instâncias (aumentar a escala horizontal) ou encerrar instâncias (reduzir a escala horizontal), dentro do intervalo que você desejar, em resposta a uma ou mais políticas de escalabilidade. Para obter mais detalhes, consulte a documentação.
  • Clusters do Amazon EMR: o Auto Scaling no Amazon EMR permite aumentar e reduzir a escala horizontal, de modo programático, nos nós core e de tarefa em um cluster com base nas regras especificadas em uma política de escalabilidade. Para obter mais informações, leia a nossa documentação.
  • Frotas do AppStream 2.0: é possível definir políticas de escalabilidade que ajustem automaticamente o tamanho da sua frota com base em várias métricas de utilização, bem como otimizem o número de instâncias em execução para que correspondam à demanda dos usuários. Também é possível optar por desativar a escalabilidade automática e determinar que a frota seja executada com um tamanho fixo. Para saber mais, consulte a documentação.
  • Amazon DynamoDB: é possível ajustar de modo dinâmico a capacidade de throughput provisionado em resposta aos padrões de tráfego atuais. Isso permite que uma tabela ou um índice secundário global aumente a capacidade provisionada de leitura e gravação para processar aumentos repentinos no tráfego, sem limitações. Quando a carga de trabalho diminui, o Application Auto Scaling reduz o throughput para que não seja necessário pagar por capacidade provisionada não utilizada. Para obter mais detalhes, consulte a documentação. Você também pode ler a publicação Auto Scaling for Amazon DynamoDB do nosso blog.
  • Novo! Réplicas do Amazon Aurora: você pode adicionar ou remover automaticamente réplicas do Aurora como resposta a mudanças em métricas predefinidas como utilização média de CPU ou média de conexões ativas. Você também pode criar métricas personalizadas e escalar de acordo com essas métricas. As réplicas do Aurora compartilham o mesmo volume subjacente da instância principal em um cluster de banco de dados e são ideais para escalabilidade de leitura. Esse recurso está disponível para clusters de banco de dados compatíveis como Aurora MySQL. Para obter mais detalhes, consulte a documentação.