So funktioniert Auto Scaling - Amazon EC2 Auto Scaling

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So funktioniert Auto Scaling

In diesem Thema wird erklärt, wie Predictive Scaling funktioniert, und es wird beschrieben, was bei der Erstellung einer Predictive Scaling-Richtlinie zu beachten ist.

Funktionsweise

Um Predictive Scaling zu verwenden, erstellen Sie eine Predictive Scaling-Richtlinie, die die zu überwachende und zu analysierende CloudWatch Metrik festlegt. Damit die prädiktive Skalierung mit der Prognose future Werte beginnen kann, muss diese Metrik Daten für mindestens 24 Stunden enthalten.

Nachdem Sie die Richtlinie erstellt haben, beginnt die prädiktive Skalierung mit der Analyse von Metrikdaten der letzten 14 Tage, um Muster zu identifizieren. Anhand dieser Analyse wird eine stündliche Prognose des Kapazitätsbedarfs für die nächsten 48 Stunden erstellt. Die Prognose wird alle 6 Stunden anhand der neuesten CloudWatch Daten aktualisiert. Wenn neue Daten eintreffen, kann die prädiktive Skalierung die Genauigkeit zukünftiger Prognosen kontinuierlich verbessern.

Wenn Sie die prädiktive Skalierung zum ersten Mal aktivieren, wird sie nur im Prognosemodus ausgeführt. In diesem Modus werden Kapazitätsprognosen generiert, Ihre Auto Scaling-Gruppe jedoch nicht auf der Grundlage dieser Prognosen skaliert. Auf diese Weise können Sie die Genauigkeit und Eignung der Prognose bewerten. Sie können Prognosedaten mithilfe der GetPredictiveScalingForecast API Operation oder der AWS Management Console anzeigen.

Nachdem Sie die Prognosedaten überprüft und beschlossen haben, mit der Skalierung auf der Grundlage dieser Daten zu beginnen, schalten Sie die Skalierungsrichtlinie in den Prognose- und Skalierungsmodus um. In diesem Modus:

  • Wenn in der Prognose ein Anstieg der Auslastung erwartet wird, wird Amazon EC2 Auto Scaling die Kapazität durch Skalierung erhöhen.

  • Wenn in der Prognose ein Rückgang der Auslastung erwartet wird, wird sie nicht skaliert, um Kapazität zu verringern. Wenn Sie nicht mehr benötigte Kapazität entfernen möchten, müssen Sie dynamische Skalierungsrichtlinien erstellen.

Standardmäßig skaliert Amazon EC2 Auto Scaling Ihre Auto Scaling Scaling-Gruppe zu Beginn jeder Stunde auf der Grundlage der Prognose für diese Stunde. Sie können optional eine frühere Startzeit angeben, indem Sie die SchedulingBufferTime Eigenschaft im PutScalingPolicy API Vorgang oder die Einstellung Pre-Launch Instances in der AWS Management Console verwenden. Dies veranlasst Amazon EC2 Auto Scaling, neue Instances vor dem prognostizierten Bedarf zu starten, sodass sie Zeit haben, zu starten und bereit zu sein, den Datenverkehr zu verarbeiten.

Um das Starten neuer Instances vor dem prognostizierten Bedarf zu unterstützen, empfehlen wir Ihnen dringend, das Standard-Instance-Warmup für Ihre Auto Scaling Scaling-Gruppe zu aktivieren. Dies gibt einen Zeitraum nach einer Scale-Out-Aktivität an, in dem Amazon EC2 Auto Scaling nicht skaliert, auch wenn dynamische Skalierungsrichtlinien darauf hinweisen, dass die Kapazität reduziert werden sollte. Auf diese Weise können Sie sicherstellen, dass neu gestartete Instances ausreichend Zeit haben, um mit der Bearbeitung des erhöhten Datenverkehrs zu beginnen, bevor sie für Scale-In-Operationen in Betracht gezogen werden. Weitere Informationen finden Sie unter Legen Sie die standardmäßige Instance-Vorbereitung für eine Auto-Scaling-Gruppe fest.

Maximales Kapazitätslimit

Auto Scaling Scaling-Gruppen haben eine maximale Kapazitätseinstellung, die die maximale Anzahl von EC2 Instances begrenzt, die für die Gruppe gestartet werden können. Wenn Skalierungsrichtlinien festgelegt sind, können sie die Kapazität standardmäßig nicht über die maximale Kapazität hinaus erhöhen.

Alternativ können Sie zulassen, dass die maximale Kapazität der Gruppe automatisch erhöht wird, wenn sich die prognostizierte Kapazität der Auto Scaling-Gruppe der maximalen Kapazität der Auto Scaling Scaling-Gruppe nähert oder diese überschreitet. Um dieses Verhalten zu aktivieren, verwenden Sie die MaxCapacityBuffer Eigenschaften MaxCapacityBreachBehavior und in der PutScalingPolicy API Operation oder die Einstellung für das Verhalten „Max. Kapazität“ in AWS Management Console.

Warnung

Gehen Sie vorsichtig vor, wenn Sie zulassen, dass die maximale Kapazität automatisch erhöht wird. Dies kann dazu führen, dass mehr Instances gestartet werden als beabsichtigt, wenn die erhöhte maximale Kapazität nicht überwacht und verwaltet wird. Die erhöhte maximale Kapazität wird dann zur neuen normalen maximalen Kapazität für die Auto Scaling Scaling-Gruppe, bis Sie sie manuell aktualisieren. Die maximale Kapazität wird nicht automatisch wieder auf das ursprüngliche Maximum reduziert.

Überlegungen

  • Bestätigen Sie, ob die prädiktive Skalierung für Ihren Workload geeignet ist. Ein Workload eignet sich gut für die prädiktive Skalierung, wenn er wiederkehrende Lastmuster aufweist, die spezifisch für den Wochentag oder die Tageszeit sind. Um dies zu überprüfen, konfigurieren Sie die Richtlinien für prädiktive Skalierung im Modus Nur Prognose und lesen dann die Empfehlungen in der Konsole. Amazon EC2 Auto Scaling bietet Empfehlungen, die auf Beobachtungen zur potenziellen Leistung von Richtlinien basieren. Bewerten Sie die Prognose und die Empfehlungen, bevor Sie Ihre Anwendung durch prädiktive Skalierung aktiv skalieren lassen.

  • Für die prädiktive Skalierung werden mindestens 24 Stunden an historischen Daten benötigt, damit mit der Prognose begonnen werden kann. Prognosen sind jedoch effektiver, wenn Verlaufsdaten für zwei volle Wochen zur Verfügung stehen. Wenn Sie Ihre Anwendung aktualisieren, indem Sie eine neue Auto-Scaling-Gruppe erstellen und die alte löschen, benötigt die neue Auto-Scaling-Gruppe 24 Stunden an historischen Lastdaten, bevor die prädiktive Skalierung wieder Prognosen generieren kann. Sie können benutzerdefinierte Metriken verwenden, um Metriken über alte und neue Auto-Scaling-Gruppen hinweg zu aggregieren. Andernfalls müssen Sie möglicherweise einige Tage auf eine genauere Prognose warten.

  • Wählen Sie eine Auslastungsmetrik, die die volle Auslastung Ihrer Anwendung genau wiedergibt und den Aspekt Ihrer Anwendung darstellt, auf den die Skalierung am wichtigsten ist.

  • Die dynamische Skalierung mit vorausschauender Skalierung hilft Ihnen dabei, die Nachfragekurve für Ihre Anwendung genau zu verfolgen. Sie skalieren in Zeiten mit geringem Datenverkehr ein und skalieren wieder heraus, wenn der Verkehr höher als erwartet ist. Wenn mehrere Skalierungsrichtlinien aktiv sind, bestimmt jede Richtlinie die gewünschte Kapazität unabhängig, und die gewünschte Kapazität wird auf das Maximum dieser Richtlinien festgelegt. Wenn beispielsweise 10 Instances an der Zielauslastung in einer Skalierungsrichtlinie für Zielverfolgung verbleiben müssen und acht Instances in einer Richtlinie zur prädiktiven Skalierung an der Zielauslastung bleiben müssen, wird die gewünschte Kapazität der Gruppe auf zehn festgelegt. Wenn Sie mit dynamischer Skalierung noch nicht vertraut sind, empfehlen wir die Verwendung von Skalierungsrichtlinien für die Zielverfolgung. Weitere Informationen finden Sie unter Dynamische Skalierung für Amazon EC2 Auto Scaling.

  • Eine zentrale Annahme der vorausschauenden Skalierung ist, dass die Auto-Scaling-Gruppe homogen ist und alle Instances von gleicher Kapazität sind. Wenn dies für Ihre Gruppe nicht zutrifft, kann die prognostizierte Kapazität ungenau sein. Seien Sie daher vorsichtig, wenn Sie Richtlinien zur vorausschauenden Skalierung für Gruppen mit gemischten Instanzen erstellen, da Instances verschiedener Typen mit ungleicher Kapazität bereitgestellt werden können. Im Folgenden finden Sie einige Beispiele, bei denen die prognostizierte Kapazität ungenau sein wird:

    • Ihre Predictive Scaling-Richtlinie basiert auf der CPU Auslastung, aber die Anzahl der vCPUs auf jeder Auto Scaling Scaling-Instance ist je nach Instance-Typ unterschiedlich.

    • Ihre Richtlinie zur vorausschauenden Skalierung basiert auf einem Netzwerk-In- oder Netzwerkausgang, aber der Netzwerkbandbreitendurchsatz für jede Auto-Scaling-Instance variiert je nach Instance-Typen. Zum Beispiel ähneln sich die Instance-Typen M5 und M5n, der M5n-Instance-Typ liefert jedoch einen deutlich höheren Netzwerkdurchsatz.

Unterstützte Regionen

  • USA Ost (Nord-Virginia)

  • USA Ost (Ohio)

  • USA West (Nordkalifornien)

  • USA West (Oregon)

  • Africa (Cape Town)

  • Asia Pacific (Hongkong)

  • Asien-Pazifik (Jakarta)

  • Asien-Pazifik (Mumbai)

  • Asia Pacific (Osaka)

  • Asia Pacific (Seoul)

  • Asien-Pazifik (Singapur)

  • Asien-Pazifik (Sydney)

  • Asien-Pazifik (Tokio)

  • Canada (Central)

  • China (Peking)

  • China (Ningxia)

  • Europe (Frankfurt)

  • Europa (Irland)

  • Europa (London)

  • Europa (Milan)

  • Europe (Paris)

  • Europe (Stockholm)

  • Middle East (Bahrain)

  • Naher Osten () UAE

  • Südamerika (São Paulo)

  • AWS GovCloud (US-Ost)

  • AWS GovCloud (US-West)