Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Sie können wichtige Kennzahlen überwachen, z. B. die Cache-Trefferquote, um eine optimale DAX-Cluster-Leistung sicherzustellen, Probleme zu diagnostizieren und zu bestimmen, wann Sie den Cluster skalieren müssen. Durch die regelmäßige Überprüfung der wichtigsten Kennzahlen können Sie Leistung, Stabilität und Kosteneffizienz aufrechterhalten, indem Sie den Cluster entsprechend Ihren Workload-Anforderungen skalieren. Weitere Informationen zur Überwachung von DAX finden Sie unterProduktionsüberwachung.
In der folgenden Liste sind einige der wichtigsten Kennzahlen aufgeführt, die Sie überwachen sollten:
-
Cache-Trefferquote — Zeigt, wie effektiv DAX zwischengespeicherte Daten bereitstellt, sodass weniger auf die zugrunde liegenden DynamoDB-Tabellen zugegriffen werden muss. Wenige Cache-Fehlschläge für den Cluster deuten auf eine gute Caching-Effizienz hin. Wenige Cache-Treffer deuten jedoch darauf hin, dass Sie möglicherweise die TTL-Einstellung für das Zwischenspeichern erneut überprüfen müssen, da der Workload sonst nicht für das Caching geeignet ist.
Verwenden Sie Amazon CloudWatch , um die Cache-Trefferquote Ihres DAX-Clusters zu berechnen. Vergleichen Sie die
QueryCacheMisses
MetrikenItemCacheHits
ItemCacheMisses
QueryCacheHits
,, und, um dieses Verhältnis zu erhalten. Die folgende Formel zeigt, wie die Cache-Trefferquote berechnet wird. Um das Verhältnis anhand dieser Formel zu berechnen, dividieren Sie Ihre Cache-Treffer durch die Summe Ihrer Cache-Treffer und Fehlschläge.Cache hit ratio = Cache hits / (Cache hits + Cache misses)
Die Cache-Trefferquote ist eine Zahl zwischen 0 und 1, die als Prozentsatz dargestellt wird. Ein höherer Prozentsatz weist auf eine insgesamt bessere Cache-Auslastung hin.
-
ErrorRequestCount— Anzahl der Anfragen, die zu Benutzerfehlern geführt haben, die vom Knoten oder Cluster gemeldet wurden.
ErrorRequestCount
umfasst Anfragen, die vom Knoten oder Cluster gedrosselt wurden. Durch die Überwachung von Benutzerfehlern können Sie Fehlkonfigurationen bei der Skalierung oder häufig verwendete Element-/Partitionsmuster in Ihrer Anwendung identifizieren. -
Betriebslatenzen — Die Überwachung der Latenz von Lese- und Schreibvorgängen zum und vom DAX-Cluster kann Ihnen dabei helfen, Leistungsengpässe zu identifizieren. Zunehmende Latenzen können auf Probleme mit Ihrer DAX-Clusterkonfiguration, Ihrem Netzwerk oder der Notwendigkeit einer Skalierung hinweisen.
-
Netzwerkverbrauch — Behalten Sie die
NetworkBytesIn
undNetworkBytesOut
-Metriken im Auge, um den Netzwerkverkehr Ihres DAX-Clusters zu überwachen. Ein unerwarteter Anstieg des Netzwerkdurchsatzes könnte zu mehr Kundenanfragen oder ineffizienten Abfragemustern führen, die dazu führen, dass mehr Daten übertragen werden.Durch die Überwachung des Netzwerkverbrauchs können Sie die Kosten für Ihren DAX-Cluster verwalten. Außerdem wird so sichergestellt, dass das Netzwerk nicht zu einem Engpass für die Cluster-Leistung wird.
-
Räumungsrate — Zeigt an, wie oft Elemente aus Ihrem Cache entfernt werden, um Platz für neue Elemente zu schaffen. Wenn die Entfernungsrate im Laufe der Zeit zunimmt, ist Ihr Cache möglicherweise zu klein oder Ihre Caching-Strategie ist nicht effektiv.
Überwachen Sie die
EvictedSize
Metrik CloudWatch , um festzustellen, ob Ihre Cachegröße für Ihre Arbeitslast ausreichend ist. Wenn die Gesamtgröße, die entfernt wird, weiter zunimmt, müssen Sie Ihren DAX-Cluster möglicherweise vergrößern, um einen größeren Cache aufnehmen zu können. -
CPU-Auslastung — Bezieht sich auf den Prozentsatz der CPU-Auslastung des Knotens oder Clusters. Dies ist eine wichtige Metrik, die für jede Datenbank oder jedes Caching-System überwacht werden muss. Eine hohe CPU-Auslastung kann bedeuten, dass Ihr DAX-Cluster möglicherweise überlastet ist und skaliert werden muss, um der gestiegenen Nachfrage gerecht zu werden.
Überwachen Sie die
CPUUtilization
Metrik für Ihren DAX-Cluster. Wenn sich Ihre CPU-Auslastung kontinuierlich 70-80% nähert oder diese überschreitet, sollten Sie erwägen, Ihren DAX-Cluster wie im folgenden Abschnitt beschrieben zu skalieren.Wenn die Anzahl der an DAX gesendeten Anfragen die Kapazität eines Knotens überschreitet, begrenzt DAX die Geschwindigkeit, mit der zusätzliche Anfragen akzeptiert werden. Dazu gibt es a zurück ThrottlingException. DAX bewertet kontinuierlich die CPU-Auslastung Ihres Clusters, um das Anforderungsvolumen zu ermitteln, das verarbeitet werden kann, ohne dass der Clusterstatus beeinträchtigt wird.
Sie können die
ThrottledRequestCount
Metrik überwachen, für die DAX veröffentlicht. CloudWatch Wenn diese Ausnahmen regelmäßig angezeigt werden, sollten Sie die Skalierung des Clusters in Erwägung ziehen.
Skalierung Ihres DAX-Clusters mithilfe von Überwachungsdaten
Sie können feststellen, ob Sie Ihren DAX-Cluster nach oben oder unten skalieren müssen, indem Sie dessen Leistungskennzahlen überwachen.
-
Nach oben oder nach unten skalieren — Wenn Ihr DAX-Cluster eine hohe CPU-Auslastung, geringe Cache-Treffer (nach der Optimierung der Caching-Strategie) oder hohe Betriebslatenzen aufweist, sollten Sie Ihren Cluster hochskalieren. Das Hinzufügen weiterer Knoten, auch Scaling Out genannt, kann dazu beitragen, die Last gleichmäßiger zu verteilen. Für Workloads mit steigenden Schreibvorgängen pro Sekunde müssen Sie möglicherweise leistungsstärkere Knoten wählen (Hochskalierung).
-
Herunterskalieren — Wenn Sie durchweg eine niedrige CPU-Auslastung und Betriebslatenzen unter Ihren Schwellenwerten feststellen, stehen Ihnen möglicherweise zu viele Ressourcen zur Verfügung. In solchen Fällen sollten Sie die Knoten herunterskalieren, um die Kosten zu senken. Sie können die Anzahl der Knoten in Zeiten geringer Auslastung auf 1 reduzieren, aber Sie können den Cluster nicht vollständig herunterfahren.