Mit Auto Scaling ist die Anwendungsverfügbarkeit einfacher zu erhalten und können Sie Ihre Amazon EC2-Kapazitäten entsprechend der von Ihnen festgelegten Bedingungen nach oben oder nach unten automatisch skalieren. Sie können Auto Scaling für die Flottenverwaltung von EC2-Instances verwenden, um den Status und die Verfügbarkeit Ihrer Flotte zu gewährleisten und sicherzustellen, dass Sie die gewünschte Anzahl von Amazon EC2-Instances ausführen. Sie können Auto Scaling außerdem für das dynamische Skalieren von EC2-Instances verwenden, um die Anzahl von Amazon EC2-Instances in Spitzenauslastungszeiten automatisch zu erhöhen und so die Leistung aufrechtzuerhalten und um die Kapazität in Zeiten geringerer Auslastung zu reduzieren und so die Kosten zu senken. Auto Scaling eignet sich sowohl für Anwendungen mit stabilem Anforderungsmuster, als auch für Anwendungen, bei denen es stündlich, täglich oder wöchentlich zu Unterschieden bei der Nutzung kommt. Außer für das Auto Scaling von Amazon EC2-Instances können Sie das Auto Scaling von Anwendungen auch für das automatische Skalieren von Ressourcen anderer AWS-Services verwenden, darunter Amazon ECS, Amazon EC2 Spot-Flotten, Amazon EMR-Cluster, AppStream 2.0-Flotten und Amazon DynamoDB.

Jetzt mit Auto Scaling beginnen
VideoThumbnail

Kostenlos bei AWS einsteigen

Kostenloses Konto erstellen
Oder bei der Konsole anmelden

Erhalten Sie 12 Monate lang Zugriff auf das kostenlose Nutzungskontingent für AWS sowie AWS Support-Funktionen der Stufe "Basic" mit Kundenservice rund um die Uhr, Support-Foren und vielen weiteren Vorteilen.


Gleich, ob Sie eine oder tausende Amazon EC2-Instances laufen haben: Mit Auto Scaling lassen sich beschädigte oder fehlerhafte Anwendungen erkennen und die betroffenen Instances ersetzen, ohne dass Sie eingreifen müssen. So ist sichergestellt, dass für Ihre Anwendung immer die erwartete Rechenkapazität zur Verfügung steht. Zum Automatisieren der Flottenverwaltung für EC2-Instances führt Auto Scaling drei Hauptfunktionen aus, die hier und in unserem Blog zur vereinfachten Flottenverwaltung mit Auto Scaling beschrieben werden.

  • Überwachen des Zustands ausgeführter Instances
    Durch Auto Scaling wird sichergestellt, dass Ihre Anwendung Datenverkehr empfangen kann und dass die Instances ordnungsgemäß funktionieren. Wenn Auto Scaling eine fehlgeschlagene Zustandsprüfung erkennt, kann die Instance automatisch ersetzt werden.
  • Automatisches Ersetzen fehlerhafter Instances
    Wenn die Zustandsprüfung einer fehlerhaften Instance scheitert, wird sie von Auto Scaling automatisch beendet und durch eine neue ersetzt. Sie müssen also nicht manuell reagieren, wenn eine Instance ersetzt werden muss.
  • Ausgleichen der Kapazität zwischen Availability Zones
    Auto Scaling gleicht EC2-Instances zwischen Availability Zones automatisch aus, wenn mehrere Zonen konfiguriert werden, und startet ständig neue Instances, sodass sie möglichst gleichmäßig auf die Zonen und Ihre gesamte Flotte verteilt sind.   

Mit Auto Scaling können Sie Ihre Kapazität genau an die Nachfragekurve für Ihre Anwendungen anpassen, sodass im Vorfeld weniger Amazon EC2-Kapazität manuell bereitgestellt werden muss. Sie können beispielsweise Target Tracking-Skalierungsrichtlinien verwenden, um eine Lastmetrik wie etwa CPU-Auslastung für Ihre Anwendung auszuwählen. Sie können aber auch einen Zielwert mithilfe der neuen Metrik "Request Count Per Target" aus Application Load Balancer festlegen, eine Lastausgleichsoption für den Elastic Load Balancing-Service. Auto Scaling passt dann die Anzahl der EC2-Instances entsprechend des Bedarfs zum Aufrechterhalten Ihres Ziels an. Sie können auch einfache Skalierungsrichtlinien verwenden, um eine Bedingung festzulegen, dass schrittweise neue Amazon EC2-Instances hinzugefügt werden, wenn die durchschnittliche Auslastung Ihrer Amazon EC2-Flotte hoch ist. Ähnlich können Sie auch die Bedingung festlegen, Instances auf dieselbe Weise zu entfernen, wenn die CPU-Auslastung gering ist. Wenn Sie vorhersehbare Auslastungsänderungen haben, können Sie auch Ihre Skalierungsaktivitäten über Auto Scaling planen. Auto Scaling kann auch zusammen mit Amazon CloudWatch verwendet werden, um Alarme zum Auslösen von Skalierungsaktivitäten zu senden, und zusammen mit Elastic Load Balancing, um den Datenverkehr auf Ihre Instances innerhalb von Auto Scaling-Gruppen zu verteilen.

AutoScaling
"NASA JPL Discusses Dynamic Scaling" auf der re:Invent 2016

Mit dem Auto Scaling von Anwendungen können Sie automatisch Ressourcen für andere AWS-Services als Amazon EC2 skalieren. Die Erfahrung ähnelt der von Auto Scaling. Sie können Application Auto Scaling verwenden, um Skalierungsrichtlinien zum automatischen Skalieren Ihrer AWS-Ressourcen, zum Skalieren Ihrer Ressourcen als Reaktion auf CloudWatch-Alarme und zum Anzeigen des Verlaufs Ihrer Skalierungsereignisse zu definieren.

Das Auto Scaling von Anwendungen kann die folgenden AWS-Ressourcen skalieren:

  • Amazon ECS-Services: Ihr Amazon ECS-Service kann optional so konfiguriert werden, dass Auto Scaling von Services verwendet wird, um die gewünschte Anzahl als Reaktion auf CloudWatch-Alarms nach oben oder unten anzupassen. Weitere Informationen finden Sie in unserer Dokumentation.
  • Amazon EC2 Spot-Flotten: Eine Spot-Flotte kann innerhalb des ausgewählten Bereichs als Reaktion auf eine oder mehrere Skalierungsrichtlinien Instances starten (Anzahl erhöhen) oder Instances beenden (Anzahl reduzieren). Weitere Informationen finden Sie in der Dokumentation.
  • Amazon EMR-Cluster: Auto Scaling in Amazon EMR ermöglicht Ihnen das programmgesteuerte horizontale und vertikale Skalieren in Kernknoten und Aufgabenknoten in einem Cluster basierend auf Regeln, die Sie in einer Skalierungsrichtlinie angeben. Weitere Informationen finden Sie in unserer Dokumentation.
  • AppStream 2.0-Flotten: Sie können Skalierungsrichtlinien definieren, die die Größe Ihrer Flotte automatisch basierend auf einer Vielzahl von Auslastungsmetriken regulieren und die Anzahl der ausgeführten Instances an die Nachfrage durch Benutzer angleicht. Sie können Auto Scaling auch deaktivieren und die Flotte mit einer festgelegten Größe ausführen lassen. Weitere Informationen finden Sie in der Dokumentation.
  • Amazon DynamoDB: Sie können die bereitgestellte Durchsatzkapazität als Reaktion auf tatsächliche Datenverkehrsmuster dynamisch anpassen. Auf diese Weise kann eine Tabelle oder ein globaler sekundärer Index die bereitgestellte Lese- und Schreibkapazität zum Verarbeiten eines plötzlichen Datenverkehrsanstiegs ohne Drosselung erhöhen. Wenn die Auslastung abnimmt, reduziert das Auto Scaling von Anwendungen den Durchsatz, damit Sie nicht für ungenutzte bereitstellte Kapazität zahlen. Weitere Informationen finden Sie in der Dokumentation. Sie können auch unseren Blog zum Thema Auto Scaling für Amazon DynamoDB lesen.
  • Neu! Amazon Aurora Replicas: Sie können automatisch Aurora Replicas als Reaktion auf Änderungen in vordefinierten Metriken wie die durchschnittliche CPU-Auslastung oder die durchschnittlichen aktiven Verbindungen hinzufügen oder entfernen. Sie können zusätzlich benutzerdefinierte Metriken erstellen und auf deren Grundlage Skalierungen vornehmen. Aurora Replicas nutzen dasselbe zugrundeliegende Volume als primäre Instance in einem DB-Cluster und sind gut für die Leseskalierung geeignet. Diese Funktion ist für Aurora MySQL-kompatible DB-Cluster verfügbar. Weitere Informationen finden Sie in der Dokumentation.