Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Nutzen Sie die folgenden Abschnitte, um Probleme zu beheben, die Amazon Managed Service für Prometheus aufweist.
Themen
Fehler 429 oder Limit überschritten
Wenn Sie einen 429-Fehler ähnlich dem folgenden Beispiel sehen, haben Ihre Anfragen die Erfassungskontingente von Amazon Managed Service für Prometheus überschritten.
ts=2020-10-29T15:34:41.845Z caller=dedupe.go:112 component=remote level=error remote_name=e13b0c url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: ingestion rate limit (6666.666666666667) exceeded while adding 499 samples and 0 metadata
Wenn Sie einen 429-Fehler ähnlich dem folgenden Beispiel sehen, haben Ihre Anfragen das Kontingent von Amazon Managed Service für Prometheus für die Anzahl der aktiven Metriken in einem Workspace überschritten.
ts=2020-11-05T12:40:33.375Z caller=dedupe.go:112 component=remote level=error remote_name=aps url=http://iamproxy-external.prometheus.uswest2-prod.eks:9090/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=500 err="server returned HTTP status 429 Too Many Requests: user=accountid
_workspace_id
: per-user series limit (local limit: 0 global limit: 3000000 actual local limit: 500000) exceeded
Wenn Sie einen 429-Fehler ähnlich dem folgenden Beispiel sehen, haben Ihre Anfragen das Amazon Managed Service for Prometheus-Kontingent für die Rate (Transaktionen pro Sekunde) überschritten, mit der Sie Daten über die RemoteWrite
Prometheus-kompatible API an Ihren Workspace senden können.
ts=2024-03-26T16:50:21.780708811Z caller=dedupe.go:112 component=remote level=error remote_name=ab123c url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=1000 exemplarCount=0 err="server returned HTTP status 429 Too Many Requests: {\"message\":\"Rate exceeded\"}"
Wenn Sie einen 400-Fehler ähnlich dem folgenden Beispiel sehen, haben Ihre Anfragen das Amazon Managed Service for Prometheus-Kontingent für aktive Zeitreihen überschritten. Einzelheiten darüber, wie aktive Zeitreihenkontingente behandelt werden, finden Sie unter. Aktive Serien (Standard)
ts=2024-03-26T16:50:21.780708811Z caller=push.go:53 level=warn url=https://aps-workspaces.us-east-1.amazonaws.com/workspaces/
workspace_id
/api/v1/remote_write msg="non-recoverable error" count=500 exemplarCount=0 err="server returned HTTP status 400 Bad Request: maxFailure (quorum) on a given error family, rpc error: code = Code(400) desc = addr=10.1.41.23:9095 state=ACTIVE zone=us-east-1a, rpc error: code = Code(400) desc = user=accountid
_workspace_id
: per-user series limit of 10000000 exceeded, Capacity from 2,000,000 to 10,000,000 is automatically adjusted based on the last 30 min of usage. If throttled above 10,000,000 or in case of incoming surges, please contact administrator to raise it. (local limit: 0 global limit: 10000000 actual local limit: 92879)"
Weitere Informationen zum Servicekontingent von Amazon Managed Service für Prometheus und dazu, wie Sie Erhöhungen beantragen können, finden Sie unter Servicekontingente von Amazon Managed Service für Prometheus
Ich sehe doppelte Beispiele
Wenn Sie eine Prometheus Gruppe mit hoher Verfügbarkeit verwenden, müssen Sie externe Labels auf Ihren Prometheus-Instances verwenden, um die Deduplizierung einzurichten. Weitere Informationen finden Sie unter Deduplizierung von Hochverfügbarkeitsmetriken, die an Amazon Managed Service für Prometheus gesendet werden.
Weitere Probleme im Zusammenhang mit duplizierten Daten werden im nächsten Abschnitt behandelt.
Ich sehe Fehler bei Beispielzeitstempeln
Amazon Managed Service for Prometheus nimmt die Daten der Reihe nach auf und erwartet, dass jede Probe einen Zeitstempel hat, der nach der vorherigen Probe liegt.
Wenn Ihre Daten nicht in der richtigen Reihenfolge ankommen, werden Ihnen Fehler zuout-of-order
samples
, oder angezeigt. duplicate sample for timestamp
samples with
different value but same timestamp
Diese Probleme werden in der Regel durch eine falsche Einrichtung des Clients verursacht, der Daten an Amazon Managed Service for Prometheus sendet. Wenn Sie einen Prometheus-Client verwenden, der im Agentenmodus ausgeführt wird, überprüfen Sie die Konfiguration auf Regeln mit doppelten Seriennamen oder doppelten Zielen. Wenn Ihre Metriken den Zeitstempel direkt angeben, überprüfen Sie, ob sie nicht in der richtigen Reihenfolge sind.
Weitere Informationen darüber, wie das funktioniert oder wie Sie Ihr Setup überprüfen können, finden Sie im Blogbeitrag Understanding Duplicate Samples and Out-of-order Timestamp Errors in Prometheus von Prom
Mir wird eine Fehlermeldung im Zusammenhang mit einem Limit angezeigt
Anmerkung
Amazon Managed Service for Prometheus bietet CloudWatch Nutzungsmetriken zur Überwachung der Prometheus-Ressourcennutzung. Mithilfe der Alarmfunktion für CloudWatch Nutzungsmetriken können Sie die Ressourcen und die Nutzung von Prometheus überwachen, um Limitfehler zu vermeiden.
Wenn Sie eine der folgenden Fehlermeldungen sehen, können Sie eine Erhöhung eines der Kontingente von Amazon Managed Service für Prometheus beantragen, um das Problem zu lösen. Weitere Informationen finden Sie unter Servicekontingente von Amazon Managed Service für Prometheus.
-
Das Serienlimit pro Benutzer
<value>
wurde überschritten. Bitte wenden Sie sich an den Administrator, um es zu erhöhen -
Das Limit pro metrischer Datenreihe
<value>
wurde überschritten. Bitte wenden Sie sich an den Administrator, um es zu erhöhen -
Limit für die Erfassungsrate (...) überschritten
-
Serie: Serie hat zu viele Etiketten (...): '%s'
-
der Abfragezeitbereich überschreitet das Limit (Abfragelänge: xxx, Limit: yyy)
-
Die Abfrage hat beim Erfassen von Chunks von Ingestern die maximale Anzahl von Chunks erreicht
-
Limit überschritten. Maximale Workspaces pro Konto.
Ihre lokale Prometheus-Server-Ausgabe überschreitet das Limit.
Amazon Managed Service für Prometheus verfügt über Servicekontingente für die Datenmenge, die ein Workspace von Prometheus-Servern empfangen kann. Um die Datenmenge zu ermitteln, die Ihr Prometheus-Server an Amazon Managed Service für Prometheus sendet, können Sie die folgenden Abfragen auf Ihrem Prometheus-Server ausführen. Wenn Sie feststellen, dass Ihre Prometheus-Ausgabe ein Limit von Amazon Managed Service für Prometheus überschreitet, können Sie eine Erhöhung des entsprechenden Servicekontingents beantragen. Weitere Informationen finden Sie unter Servicekontingente von Amazon Managed Service für Prometheus.
Datentyp | Zu verwendende Abfragen |
---|---|
Aktuelle aktive Serie |
|
Aktuelle Erfassungsrate |
|
Most-to-least Liste der aktiven Serien pro Metrikname |
|
Anzahl der Etiketten pro metrischer Serie |
|
Einige meiner Daten werden nicht angezeigt
Daten, die an Amazon Managed Service for Prometheus gesendet werden, können aus verschiedenen Gründen verworfen werden. Die folgende Tabelle zeigt Gründe, warum Daten möglicherweise verworfen und nicht aufgenommen werden.
Mit Amazon können Sie die Menge und die Gründe dafür verfolgen, warum Daten verworfen wurden. CloudWatch Weitere Informationen finden Sie unter Verwenden Sie CloudWatch Metriken, um die Ressourcen von Amazon Managed Service for Prometheus zu überwachen.
Grund |
Bedeutung |
---|---|
greater_than_max_sample_age |
Logzeilen, die älter als die aktuelle Uhrzeit sind, werden gelöscht |
new-value-for-timestamp |
Doppelte Beispiele werden mit einem anderen Zeitstempel als dem, der zuvor aufgezeichnet wurde, gesendet |
per_metric_series_limit |
Der Benutzer hat das Limit für aktive Serien pro Metrik erreicht |
per_user_series_limit |
Der Benutzer hat das Limit für die Gesamtzahl der aktiven Serien erreicht |
rate_limited |
Erfassungsrate begrenzt |
sample-out-of-order |
Beispiele werden nicht in der richtigen Reihenfolge versandt und können nicht bearbeitet werden |
label_value_too_long |
Der Labelwert ist länger als die zulässige Zeichenbeschränkung |
max_label_names_per_series |
Der Benutzer hat die Etikettennamen pro Metrik erreicht |
missing_metric_name |
Der Name der Metrik wurde nicht angegeben |
metric_name_invalid |
Ungültiger Metrikname angegeben |
label_invalid |
Ungültiges Etikett angegeben |
duplicate_label_names |
Doppelte Etikettennamen angegeben |