Auto Scaling consente di sostenere la disponibilità delle applicazioni e di ricalibrare in modo dinamico la capacità di Amazon EC2 in base a condizioni personalizzate. Inoltre, Auto Scaling può essere utilizzato per gestire i parchi istanze EC2 e semplificare la gestione di integrità e disponibilità dei parchi, in modo da garantire sempre l'esecuzione del numero desiderato di istanze EC2. Anche la scalabilità dinamica delle istanze può essere gestita tramite Auto Scaling, così da aumentare automaticamente il numero di istanze EC2 durante i picchi di domanda per mantenere elevate le prestazioni e diminuire la capacità automaticamente quando la domanda scende per ridurre i costi. Auto Scaling è adatto sia per le applicazioni con una domanda stabile sia per le applicazioni con variazioni di utilizzo orarie, giornaliere o settimanali. Oltre ad Auto Scaling per Amazon EC2, è possibile impiegare Application Auto Scaling per ricalibrare automaticamente le risorse per altri servizi AWS, inclusi Amazon ECS, parchi istanze Spot di Amazon EC2, cluster Amazon EMR, parchi istanze AppStream 2.0 e Amazon DynamoDB.

Inizia a usare subito Auto Scaling
VideoThumbnail

Inizia a usare AWS gratis

Crea un account gratuito
Oppure accedi alla console

Ricevi dodici mesi di accesso al piano di utilizzo gratuito di AWS e sfrutta le funzionalità di supporto di base di AWS, inclusi l'assistenza al cliente 24x7x365, i forum di supporto e molto altro.


Auto Scaling può essere impiegato per rilevare le applicazioni non funzionanti e le istanze Amazon EC2 inattive, anche se le istanze in uso sono migliaia, sostituendole senza l'intervento dell'utente. In questo modo l'applicazione è sempre supportata dalla capacità di elaborazione richiesta. Per automatizzare la gestione dei parchi istanze per le istanze EC2, Auto Scaling dispone di tre funzionalità descritte in questa pagina e nel blog, nel post Gestione di parchi istanze più semplice con Auto Scaling.

  • Monitoraggio dell'integrità delle istanze in esecuzione
    Auto Scaling verifica che l'applicazione sia in grado di ricevere traffico e che le istanze funzionino correttamente. Quando rileva un controllo dello stato che non è andato a buon fine, sostituisce automaticamente l'istanza colpita.
  • Sostituzione automatica delle istanze con errori
    Quando in seguito a un controllo dello stato viene rilevata un'istanza con errori, Auto Scaling la termina automaticamente sostituendola con una nuova. Questo significa che non è necessaria alcuna operazione manuale quando è necessario sostituire un'istanza.
  • Bilanciamento della capacità su più zone di disponibilità
    Se previsto dalla configurazione, Auto Scaling bilancia automaticamente le istanze EC2 su più zone di disponibilità e lancia sempre nuove istanze in modo da evitare squilibri tra zone sull'intero parco istanze.   

Auto Scaling consente di seguire sempre la curva di domanda delle tue applicazioni, riducendo la necessità di effettuare manualmente il provisioning della capacità di Amazon EC2 in anticipo. Ad esempio, è possibile utilizzare le policy di scalabilità Target Tracking per selezionare un parametro di caricamento per l'applicazione, ad esempio l'utilizzo della CPU. In alternativa, è possibile impostare un valore target utilizzando il nuovo parametro "Request Count Per Target" da Application Load Balancer, un'opzione di bilanciamento del carico del servizio Elastic Load Balancing. Auto Scaling regolerà automaticamente il numero di istanze EC2 necessarie per mantenere il valore scelto. Inoltre, è possibile utilizzare le policy di scalabilità per impostare una condizione con cui aggiungere nuove istanze Amazon EC2 secondo incrementi predefiniti quando l'utilizzo medio del parco istanze è elevato e, analogamente, impostare una condizione per rimuoverle secondo le stesse proporzioni quando l'utilizzo della CPU è basso. Se le variazioni di carico sono prevedibili, le attività di ridimensionamento possono anche essere pianificate con Auto Scaling. Auto Scaling opera inoltre in sinergia con Amazon CloudWatch, servizio che permette di inviare allarmi per attivare attività di ricalibrazione, e con Elastic Load Balancing, per distribuire il traffico alle istanze nell'ambito di gruppi Auto Scaling.

AutoScaling
NASA JPL discute di scalabilità dinamica presso il re:Invent 2016

Con Application Auto Scaling, è possibile ricalibrare automaticamente le risorse per gli altri servizi AWS. Il funzionamento è simile a quello di Auto Scaling. È possibile utilizzare Application Auto Scaling per definire le policy di scalabilità e ridimensionare automaticamente le risorse di AWS, ricalibrarle in risposta ad allarmi di CloudWatch e visualizzare lo storico degli eventi di ricalibrazione.

Application Auto Scaling permette di ridimensionare le seguenti risorse AWS:

  • Servizio Amazon ECS: il servizio Amazon ECS può essere configurato in modo da utilizzare Auto Scaling per ridurre o potenziare le risorse in risposta ad allarmi di CloudWatch. Per ulteriori informazioni, consulta la documentazione.
  • Parchi istanze Spot di Amazon EC2: in un parco istanze Spot è possibile lanciare o terminare istanze in quantità personalizzate in risposta a una o più policy di scalabilità. Per ulteriori dettagli, consulta la documentazione.
  • Cluster Amazon EMR: Auto Scaling in Amazon EMR permette di ricalibrare in modo programmatico nodi principali e nodi di task in cluster specificati nell'apposita policy. Per ulteriori informazioni, consulta la documentazione.
  • Parchi istanze di AppStream 2.0: è possibile definire policy di dimensionamento che modificano automaticamente il parco in base a una serie di parametri di utilizzo e ottimizzano il numero di istanze in esecuzione in base alla richiesta degli utenti. È anche possibile scegliere di disattivare la scalabilità automatica e lasciare che i parchi istanze proseguano secondo dimensioni fisse. Per ulteriori informazioni, consulta la documentazione.
  • Amazon DynamoDB: è possibile modificare dinamicamente la capacità di throughput assegnata in risposta alle variazioni del traffico. In questo modo vengono aumentate le capacità di lettura e scrittura di tabelle e indici secondari globali in caso di improvvisi picchi di traffico senza throttling. Quando il carico di lavoro si alleggerisce, Application Auto Scaling riduce il throughput per non fatturare la capacità inutilizzata. Per ulteriori dettagli, consulta la documentazione. Leggi anche il post del nostro blog Auto Scaling per Amazon DynamoDB.
  • Novità! Repliche di Amazon Aurora: è possibile aggiungere o rimuovere automaticamente repliche di Aurora in risposta alle modifiche di parametri predefiniti quale l'utilizzo medio della CPU o le connessioni attive medie. È inoltre possibile creare parametri personalizzati e dimensionarli. Le repliche di Amazon Aurora condividono lo stesso volume sottostante come istanza primaria in un cluster database e sono adatte al dimensionamento della lettura. Questa capacità è disponibile per cluster database Aurora compatibili con MySQL. Per ulteriori dettagli, consulta la documentazione.