Funktionsweise von Skalierungsplänen

AWS Auto Scaling ermöglicht es Ihnen, Skalierungspläne zu verwenden, um eine Reihe von Anweisungen für die Skalierung Ihrer Ressourcen zu konfigurieren. Wenn Sie mit skalierbaren Ressourcen arbeiten AWS CloudFormation oder Tags zu diesen hinzufügen, können Sie Skalierungspläne für verschiedene Gruppen von Ressourcen pro Anwendung einrichten. Die AWS Auto Scaling Konsole bietet Empfehlungen für Skalierungsstrategien, die auf jede Ressource zugeschnitten sind. Nachdem Sie Ihren Skalierungsplan erstellt haben, kombiniert es dynamische Skalierungsmethoden und prädiktive Skalierungsmethoden, um Ihre Skalierungsstrategie zu unterstützen.

Was ist eine Skalierungsstrategie?

In der Skalierungsstrategie erfahren Sie, AWS Auto Scaling wie Sie die Nutzung der Ressourcen in Ihrem Skalierungsplan optimieren können. Sie können die Optimierung auf Verfügbarkeit, auf Kosten oder ein ausgewogenes Verhältnis aus beidem festlegen. Alternativ können Sie auch Ihre eigene benutzerdefinierte Strategie mit Ihren definierten Metriken und Schwellenwerten erstellen. Sie können separate Strategien für die einzelnen Ressourcen oder Ressourcentypen festlegen.

Zu den Skalierungsstrategien gehört die Optimierung im Hinblick auf Verfügbarkeit und Kosten oder ein ausgewogenes Verhältnis zwischen beiden.

Was ist dynamische Skalierung?

Mit der dynamischen Skalierung werden für die Ressourcen in Ihrem Skalierungsplan Skalierungsrichtlinien für die Zielnachverfolgung erstellt. Mithilfe dieser Skalierungsrichtlinien wird die Ressourcenkapazität als Reaktion auf Live-Änderungen in der Ressourcennutzung angepasst. Auf diese Weise soll ausreichend Kapazität bereitgestellt werden, um die Auslastung auf dem von der Skalierungsstrategie festgelegten Zielwert zu halten. Dies ähnelt der Art und Weise, wie ein Thermostat die Temperatur in Ihrem Zuhause konstant hält. Sie können eine Temperatur auswählen und der Thermostat erledigt den Rest.

Diagramme zum Vergleich von Auslastung und Kapazität mit und ohne dynamische Skalierung.

Sie können beispielsweise Ihren Skalierungsplan so konfigurieren, dass die Anzahl der Aufgaben, die Ihr Amazon Elastic Container Service (Amazon ECS)-Service ausführt, bei 75 Prozent der CPU-Auslastung bleibt. Wenn die CPU-Auslastung Ihres Services 75 Prozent überschreitet (was bedeutet, dass mehr als 75 Prozent der für den Service reservierten CPU verwendet wird), fügt Ihre Skalierungsrichtlinie Ihrem Service eine weitere Aufgabe hinzu, um bei der erhöhten Last zu helfen.

Was ist prädiktive Skalierung?

Die prädiktive Skalierung verwendet Machine Learning, um den historischen Workload jeder Ressource zu analysieren und prognostiziert regelmäßig die zukünftige Belastung. Dies ähnelt der Funktionsweise von Wettervorhersagen. Mit der Prognose erstellt die prädiktive Skalierung geplante Skalierungsaktionen, um sicherzustellen, dass die Ressourcenkapazität verfügbar ist, bevor Ihre Anwendung sie benötigt. Wie bei der dynamischen Skalierung wird bei der prädiktiven Skalierung die Auslastung auf dem von der Skalierungsstrategie vorgegebenen Zielwert gehalten.

Diagramme, die die historische Auslastung, die generierte Prognose und die ergriffenen Skalierungsmaßnahmen zeigen.

Sie können beispielsweise die prädiktive Skalierung aktivieren und Ihre Skalierungsstrategie so konfigurieren, dass die durchschnittliche CPU-Auslastung Ihrer Auto-Scaling-Gruppe bei 50 Prozent gehalten wird. Ihre Prognose sieht vor, dass täglich um 8:00 Uhr Verkehrsspitzen auftreten. Ihr Skalierungsplan erstellt die zukünftigen geplanten Skalierungsaktionen, um sicherzustellen, dass Ihre Auto-Scaling-Gruppe rechtzeitig bereit ist, den Datenverkehr zu bewältigen. Auf diese Weise kann die Anwendungsleistung konstant gehalten werden, mit dem Ziel, stets die erforderliche Kapazität bereitzustellen, um die Ressourcenauslastung jederzeit so nahe wie möglich bei 50 Prozent zu halten.

Die wichtigsten Komponenten zum Verständnis für die prädikative Skalierung sind folgende:

Lastprognose: AWS Auto Scaling Analysiert den Verlauf von bis zu 14 Tagen für eine bestimmte Lastkennzahl und prognostiziert den future Bedarf für die nächsten zwei Tage. Diese Daten werden in 1-Stunden-Intervallen zur Verfügung gestellt und täglich aktualisiert.
Geplante Skalierungsaktionen: AWS Auto Scaling plant die Skalierungsaktionen, mit denen die Kapazität proaktiv erhöht und verringert wird, um der Lastprognose zu entsprechen. AWS Auto Scaling Aktualisiert die Mindestkapazität zum geplanten Zeitpunkt mit dem Wert, der durch die geplante Skalierungsaktion angegeben wurde. Auf diese Weise soll die Ressourcenauslastung auf dem von der Skalierungsstrategie festgelegten Zielwert gehalten werden. Wenn Ihre Anwendung mehr Kapazität benötigt als vorhergesagt, lassen sich mit der dynamischen Skalierung zusätzliche Kapazitäten hinzufügen.
Verhalten bei max. Kapazität: Die minimalen und maximalen Kapazitätsgrenzen für die automatische Skalierung gelten für jede Ressource. Sie können jedoch steuern, ob Ihre Anwendung die Kapazität über die maximale Kapazität hinaus erhöhen kann, wenn die prognostizierte Kapazität die maximale Kapazität überschreitet.

Anmerkung

Sie können jetzt stattdessen die Richtlinien zur vorausschauenden Skalierung von Auto-Scaling-Gruppen verwenden. Weitere Informationen finden Sie unter Prädiktive Skalierung von Cooldowns für Amazon EC2 Auto Scaling im Amazon EC2 Auto Scaling-Benutzerhandbuch.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Was ist ein Skalierungsplan?

Bewährte Methoden