Überwachung von Step Functions Functions-Metriken mit Amazon CloudWatch - AWS Step Functions

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von Step Functions Functions-Metriken mit Amazon CloudWatch

Die Überwachung ist ein wichtiger Bestandteil der Aufrechterhaltung der Zuverlässigkeit, Verfügbarkeit und Leistung von AWS Step Functions und dein AWS Lösungen. Sie sollten so viele Überwachungsdaten wie möglich von der sammeln AWS Dienste, die Sie verwenden, um Fehler an mehreren Punkten zu debuggen.

Bevor Sie mit der Überwachung von Step Functions beginnen, sollten Sie einen Überwachungsplan erstellen, der die folgenden Fragen beantwortet:

  • Was sind Ihre Ziele bei der Überwachung?

  • Welche Ressourcen werden überwacht?

  • Wie oft werden diese Ressourcen überwacht?

  • Welche Überwachungstools werden verwendet?

  • Wer soll die Überwachungsaufgaben ausführen?

  • Wer soll benachrichtigt werden, wenn Fehler auftreten?

Der nächste Schritt besteht darin, eine Baseline für normale -Performance in Ihrer Umgebung aufzustellen. Dafür sollten Sie die Performance zu verschiedenen Zeiten und unter verschiedenen Belastungsbedingungen messen. Denken Sie bei der Überwachung von Step Functions darüber nach, historische Überwachungsdaten zu speichern. Solche Daten können eine Basis für den Vergleich mit aktuellen Leistungsdaten bieten, um normale Leistungsmuster und Leistungsanomalien zu identifizieren sowie Verfahren für den Umgang mit Problemen zu entwickeln.

Mit Step Functions können Sie beispielsweise überwachen, wie viele Aktivitäten oder AWS Lambda Aufgaben schlagen aufgrund eines Heartbeat-Timeouts fehl. Wenn die Performance außerhalb Ihrer festgelegten Baseline fällt, müssen Sie eventuell Ihr Heartbeat-Intervall ändern.

Zur Festlegung einer Baseline sollten Sie mindestens die folgenden Metriken überwachen:

  • ActivitiesStarted

  • ActivitiesTimedOut

  • ExecutionsStarted

  • ExecutionsTimedOut

  • LambdaFunctionsStarted

  • LambdaFunctionsTimedOut

Step Functions Functions-Metriken für CloudWatch

Step Functions stellt Amazon die folgenden Arten von Metriken zur Verfügung CloudWatch. Mit diesen Metriken können Sie Ihren Zustandsautomaten und Aktivitäten überwachen sowie Alarme für Schwellenwerte festlegen. Sie können Metriken anzeigen, indem Sie AWS Management Console.

CloudWatch Bereitstellung von Metriken

CloudWatch Metriken werden nach bestem Wissen und Gewissen bereitgestellt.

Die Vollständigkeit und Rechtzeitigkeit der Metriken ist nicht garantiert. Der Datenpunkt für eine bestimmte Anforderung wird möglicherweise mit einem Zeitstempel zurückgegeben, der nach der tatsächlichen Anforderungsverarbeitung liegt. Der Datenpunkt kann sich um eine Minute verzögern, bevor er verfügbar ist CloudWatch, oder er wird möglicherweise gar nicht übermittelt. CloudWatch Anforderungsmetriken geben Ihnen nahezu in Echtzeit einen Überblick über die Ausführung der State-Machine-Vorgänge. Es handelt sich nicht um eine vollständige Erfassung aller Ausführungskennzahlen.

Aufgrund des Best-Effort-Charakters dieser Funktion können die im Billing & Cost Management-Dashboard verfügbaren Berichte eine oder mehrere Zugriffsanforderungen enthalten, die nicht in den Ausführungskennzahlen enthalten sind.

Metriken, die ein Zeitintervall angeben

Einige der Step Functions CloudWatch Functions-Metriken sind Zeitintervalle, die immer in Millisekunden gemessen werden. Diese Metriken entsprechen im Allgemeinen Phasen Ihrer Ausführung, für die Sie Timeouts für Zustandsmaschinen, Aktivitäten und Lambda-Funktionen mit aussagekräftigen Namen festlegen können.

Die Metrik ActivityRunTime misst die Zeit für die Ausführung einer Aktivität vom Beginn bis zum Abschluss. Sie können einen Timeout-Wert für den gleichen Zeitraum festlegen.

In der CloudWatch Konsole können Sie die besten Ergebnisse erzielen, wenn Sie Durchschnitt als Anzeigestatistik für Zeitintervallmetriken wählen.

Metriken, die eine Anzahl melden

Einige der Step Functions CloudWatch Functions-Metriken geben Ergebnisse als Zählung an. Beispielsweise erfasst ExecutionsFailed die Anzahl fehlgeschlagener Ausführungen von Zustandsautomaten.

Step Functions gibt zwei ExecutionsStarted Metriken für jede State-Machine-Ausführung aus. Dadurch zeigt die SampleCountStatistik für die ExecutionsStarted Metrik für jede Zustandsmaschinen-Ausführung den Wert 2 an. Die SampleCount Statistik zeigt an, ExecutionStarted=0 wann ExecutionStarted=1 die Ausführung abgeschlossen ist.

Tipp

Wir empfehlen, Summe als Anzeigestatistik für Metriken auszuwählen, die eine Anzahl in der CloudWatch Konsole melden.

Ausführungsmetriken

Der AWS/States Namespace enthält die folgenden Metriken für alle Step Functions Functions-Ausführungen. Dies sind dimensionslose Metriken, die für Ihr gesamtes Konto in einer Region gelten.

Metrik Beschreibung
OpenExecutionCount

Ungefähre Anzahl der derzeit offenen Ausführungen — Workflows, die derzeit in Ihrem Konto ausgeführt werden.

Ziel ist es, Ihnen einen Einblick zu geben, wann sich Ihre Workflows dem maximalen Ausführungslimit nähern, um ExecutionLimitExceededFehler beim Aufrufen StartExecution oder RedriveExecution bei Standard-Workflows zu vermeiden.

OpenExecutionCountist eine ungefähre Anzahl offener Workflows. Diese Metrik wird niedriger sein als die beobachtete Anzahl laufender Workflows. Wenn die Anzahl offener Workflows unter 10.000 liegt, werden möglicherweise keine offenen Ausführungen angezeigt. Wir empfehlen, die Statistik Maximum mit einem Schwellenwert von 100.000 oder höher zu verwendenOpenExecutionLimit, da das Standardlimit für offene Workflows bei 1.000.000 Ausführungen liegt, damit ein Alarm ausgelöst wird, wenn Sie sich Ihrem Wert nähern.

OpenExecutionLimit

Maximale Anzahl offener Ausführungen. Weitere Informationen finden Sie unter Kontingente im Zusammenhang mit Konten.

Dieses Limit gilt nicht für Express Workflows.

Ausführungsmetriken für State Machine mit Version oder Alias

Wenn Sie eine State-Machine-Ausführung mit einer Version oder einem Alias ausführen, gibt Step Functions die folgenden Metriken aus. Die ExecutionThrottled Metrik wird nur bei gedrosselter Ausführung ausgegeben. Zu diesen Metriken gehört auch eineStateMachineArn, mit der ein bestimmter Zustandsmaschine identifiziert werden kann.

Metrik Beschreibung
ExecutionTime Intervall in Millisekunden zwischen dem Start der Ausführung und dem Zeitpunkt, zu dem sie beendet wird.
ExecutionThrottled Anzahl der StateEntered Ereignisse und Wiederholungen, die gedrosselt wurden. Dies hängt mit der StateTransition-Ablehnung zusammen. Weitere Informationen finden Sie unter Kontingente im Zusammenhang mit staatlicher Drosselung.
ExecutionsAborted Anzahl der abgebrochenen oder abgebrochenen Ausführungen.
ExecutionsFailed Anzahl der fehlgeschlagenen Ausführungen.
ExecutionsStarted Anzahl der gestarteten Ausführungen.
ExecutionsSucceeded Anzahl der erfolgreich abgeschlossenen Ausführungen.
ExecutionsTimedOut Anzahl der Ausführungen, bei denen aus irgendeinem Grund ein Timeout aufgetreten ist.

Ausführungsmetriken für Express Workflows

Der AWS/States Namespace enthält die folgenden Metriken für die Ausführung von Step Functions Express Workflows.

Metrik Beschreibung
ExpressExecutionMemory

Der gesamte Arbeitsspeicher, der von einem Express-Workflow verbraucht wird.

ExpressExecutionBilledDuration

Die Dauer, für die ein Express-Workflow berechnet wird.

ExpressExecutionBilledMemory

Die Menge an verbrauchtem Speicher, für die ein Express-Workflow berechnet wird.

Redrive Ausführungsmetriken für Standard-Workflows

Wenn du redriveStep Functions gibt bei der Ausführung einer Zustandsmaschine die folgenden Metriken aus.

Für alle redriven Bei Ausführungen wird die Executions* Metrik ausgegeben. Sagen wir zum Beispiel a redriven Die Ausführung wird abgebrochen. Diese Ausführung gibt Datenpunkte ungleich Null für sowohl als auch aus. RedrivenExecutionsAborted ExecutionsAborted

Metrik Beschreibung
ExecutionsRedriven Anzahl von redriven Hinrichtungen.
RedrivenExecutionsAborted Anzahl von redriven Ausführungen, die abgebrochen oder beendet wurden.
RedrivenExecutionsTimedOut Anzahl von redriven Hinrichtungen, bei denen aus irgendeinem Grund eine Zeitüberschreitung eintritt.
RedrivenExecutionsSucceeded Anzahl von redriven Ausführungen, die erfolgreich abgeschlossen wurden.
RedrivenExecutionsFailed Anzahl von redriven Fehlgeschlagene Hinrichtungen.

Dimension für die Ausführungsmetriken von Step Functions

Dimension Beschreibung
StateMachineArn

Der Amazon-Ressourcenname (ARN) der Zustandsmaschine für die fragliche Ausführung.

Abmessungen für Ausführungen mit Version

Dimension Beschreibung
StateMachineArn

Der Amazon-Ressourcenname (ARN) der Zustandsmaschine, deren Ausführung durch eine Version gestartet wurde.

Version

State-Machine-Version, mit der die Ausführung gestartet wurde.

Dimensionen für Ausführungen mit einem Alias

Dimension Beschreibung
StateMachineArn

Der Amazon-Ressourcenname (ARN) der Zustandsmaschine, deren Ausführung durch einen Alias gestartet wurde.

Alias

Alias der Zustandsmaschine, der zum Starten der Ausführung verwendet wurde.

Metriken zur Anzahl der Ressourcen für Versionen und Aliase

Der AWS/States Namespace umfasst die folgenden Metriken für die Anzahl der Versionen und Aliase einer Zustandsmaschine.

Metrik Beschreibung
AliasCount

Anzahl der Aliase, die für den Zustandsmaschine erstellt wurden.

Sie können bis zu 100 Aliase für jede Zustandsmaschine erstellen.

VersionCount

Anzahl der für den State Machine veröffentlichten Versionen.

Sie können bis zu 1000 Versionen einer State Machine veröffentlichen.

Dimension für die Anzahl der Ressourcen, Metriken für Versionen und Aliase

Dimension Beschreibung
ResourceArn

Der Amazon-Ressourcenname (ARN) der Zustandsmaschine mit einer Version oder einem Alias.

Metriken für Aktivitäten

Der AWS/States Namespace enthält die folgenden Metriken für Step Functions Functions-Aktivitäten.

Metrik Beschreibung
ActivityRunTime Intervall in Millisekunden zwischen dem Start der Aktivität und dem Zeitpunkt, zu dem sie endet.
ActivityScheduleTime Intervall in Millisekunden, für das die Aktivität im Zeitplanstatus verbleibt.
ActivityTime Intervall in Millisekunden zwischen dem Zeitpunkt, zu dem die Aktivität geplant ist, und dem Zeitpunkt, zu dem sie endet.
ActivitiesFailed Anzahl der fehlgeschlagenen Aktivitäten.
ActivitiesHeartbeatTimedOut Anzahl der Aktivitäten, bei denen aufgrund eines Heartbeat-Timeouts ein Timeout auftritt.
ActivitiesScheduled Anzahl der geplanten Aktivitäten.
ActivitiesStarted Anzahl der gestarteten Aktivitäten.
ActivitiesSucceeded Anzahl der erfolgreich abgeschlossenen Aktivitäten.
ActivitiesTimedOut Anzahl der Aktivitäten, bei denen das Timeout beim Abschluss abgelaufen ist.

Dimension für Step Functions, Aktivitätsmetriken

Dimension Beschreibung

ActivityArn

Die ARN der Aktivität.

Metriken für die Lambda-Funktion

Der AWS/States Namespace enthält die folgenden Metriken für Step Functions Lambda-Funktionen.

Metrik Beschreibung
LambdaFunctionRunTime Intervall in Millisekunden zwischen dem Start der Lambda-Funktion und dem Zeitpunkt, zu dem sie geschlossen wird.
LambdaFunctionScheduleTime Intervall in Millisekunden, für das die Lambda-Funktion im Zeitplanstatus verbleibt.
LambdaFunctionTime Intervall in Millisekunden zwischen dem Zeitpunkt, zu dem die Lambda-Funktion geplant ist, und dem Zeitpunkt, zu dem sie geschlossen wird.
LambdaFunctionsFailed Anzahl der fehlgeschlagenen Lambda-Funktionen.
LambdaFunctionsScheduled Anzahl der geplanten Lambda-Funktionen.
LambdaFunctionsStarted Anzahl der gestarteten Lambda-Funktionen.
LambdaFunctionsSucceeded Anzahl der erfolgreich abgeschlossenen Lambda-Funktionen.
LambdaFunctionsTimedOut Anzahl der Lambda-Funktionen, bei denen beim Schließen ein Timeout auftritt.

Dimension für Step Functions Lambda-Funktionsmetriken

Dimension Beschreibung

LambdaFunctionArn

Die ARN der Lambda-Funktion.

Anmerkung

Lambda-Funktionsmetriken werden für Task-Status ausgegeben, die die Lambda-Funktion ARN im Resource Feld angeben. Aufgabenstatus, die stattdessen Service Integration-Metriken verwenden"Resource": "arn:aws:states:::lambda:invoke", werden ausgegeben. Weitere Informationen finden Sie unter Rufen Sie eine auf AWS Lambda Funktion mit Step Functions.

Serviceintegrationsmetriken

Der AWS/States Namespace enthält die folgenden Metriken für Step Functions Functions-Dienstintegrationen. Weitere Informationen finden Sie unter Integration von Diensten mit Step Functions.

Metrik Beschreibung
ServiceIntegrationRunTime Intervall in Millisekunden zwischen dem Start der Service-Task und dem Zeitpunkt, zu dem sie geschlossen wird.
ServiceIntegrationScheduleTime Intervall in Millisekunden, für das der Service-Task im Zeitplanstatus verbleibt.
ServiceIntegrationTime Intervall in Millisekunden zwischen dem Zeitpunkt, zu dem der Service Task geplant ist, und dem Zeitpunkt, zu dem er geschlossen wird.
ServiceIntegrationsFailed Anzahl der fehlgeschlagenen Serviceaufgaben.
ServiceIntegrationsScheduled Anzahl der geplanten Serviceaufgaben.
ServiceIntegrationsStarted Anzahl der gestarteten Serviceaufgaben.
ServiceIntegrationsSucceeded Anzahl der erfolgreich abgeschlossenen Serviceaufgaben.
ServiceIntegrationsTimedOut Anzahl der Serviceaufgaben, bei denen beim Abschluss ein Timeout auftritt.

Dimension für Step Functions — Serviceintegrationsmetriken

Dimension Beschreibung

ServiceIntegrationResourceArn

Die Ressource ARN des integrierten Dienstes.

Servicemetriken

Der AWS/States Namespace umfasst die folgenden Metriken für den Step Functions Functions-Dienst.

Metrik Beschreibung
ThrottledEvents

Anzahl der Anfragen, die gedrosselt wurden.

ProvisionedBucketSize

Anzahl der verfügbaren Anfragen pro Sekunde.

ProvisionedRefillRate

Anzahl der Anfragen pro Sekunde, die in den Bucket aufgenommen werden dürfen.

ConsumedCapacity

Anzahl der Anfragen pro Sekunde.

Dimension für Step Functions Servicemetriken

Dimension Beschreibung

ServiceMetric

Filtert Daten, um Zustandsübergang-Metriken anzuzeigen.

APIMetriken

Der AWS/States Namespace enthält die folgenden Metriken für die Step FunctionsAPI.

Metrik Beschreibung
ThrottledEvents

Anzahl der Anfragen, die gedrosselt wurden.

ProvisionedBucketSize

Anzahl der verfügbaren Anfragen pro Sekunde.

ProvisionedRefillRate

Anzahl der Anfragen pro Sekunde, die in den Bucket aufgenommen werden dürfen.

ConsumedCapacity

Anzahl der Anfragen pro Sekunde.

Dimension für Step Functions API Functions-Metriken

Dimension Beschreibung

APIName

Filtert Daten nach einem API Wert mit dem angegebenen API Namen.

Step Functions Functions-Metriken anzeigen in CloudWatch

Sie können die CloudWatch Konsole verwenden, um Step Functions Functions-Metriken für Ausführungen, Aktivitäten, Funktionen und Serviceintegrationen anzuzeigen.

  1. Melden Sie sich an bei AWS Management Console und öffne die CloudWatch Konsole.

  2. Wählen Sie Metrics (Metriken) und auf der Registerkarte All Metrics (Alle Metriken) States (Zustände) aus.

    Wenn Sie in letzter Zeit Ausführungen ausgeführt haben, werden Ihnen bis zu vier Arten von Metriken angezeigt:

    • Execution Metrics (Ausführungsmetriken)

    • Activity Function Metrics (Aktivitätsfunktionsmetriken)

    • Lambda-Funktionsmetriken

    • Kennzahlen zur Serviceintegration

  3. Wählen Sie einen Metriktyp aus, um eine Liste der Metriken zu sehen.

    • Um Ihre Metriken nach Metrikname oder zu sortieren StateMachineArn, verwenden Sie die Spaltenüberschriften.

    • Um Diagramme für eine Metrik anzuzeigen, aktivieren Sie das Kontrollkästchen neben der Metrik auf der Liste. Sie können die Graph-Parameter mithilfe der Zeitraumsteuerungen oberhalb der Diagrammansicht ändern.

      Sie können benutzerdefinierte Zeiträume mit relativen oder absoluten Werten auswählen (bestimmte Tage und Zeiten). Sie können auch die Drop-down-Liste verwenden, um Werte wie Zeilen, gestapelte Bereiche oder Zahlen (Werte) anzuzeigen.

    • Um die Details zu einem Diagramm anzuzeigen, bewegen Sie den Mauszeiger über den metrischen Farbcode, der unter dem Diagramm angezeigt wird, um die Metrikdetails anzuzeigen.

Weitere Informationen zur Arbeit mit CloudWatch Metriken finden Sie unter Using Amazon CloudWatch Metrics im CloudWatch Amazon-Benutzerhandbuch.

Einstellung von Alarmen für Step Functions Functions-Metriken in CloudWatch

Sie können CloudWatch Amazon-Alarme verwenden, um Aktionen auszuführen. Wenn Sie beispielsweise wissen möchten, wann ein Alarmschwellenwert erreicht ist, können Sie einen Alarm so einrichten, dass eine Benachrichtigung an ein SNS Amazon-Thema gesendet wird oder dass eine E-Mail gesendet wird, wenn die StateMachinesFailed Metrik einen bestimmten Schwellenwert überschreitet.

Einrichten eines Alarms zu einer Metrik

  1. Melden Sie sich an bei AWS Management Console und öffne die CloudWatch Konsole.

  2. Wählen Sie Metrics (Metriken) und auf der Registerkarte All Metrics (Alle Metriken) States (Zustände) aus.

    Wenn Sie in letzter Zeit Ausführungen ausgeführt haben, werden Ihnen bis zu vier Arten von Metriken angezeigt:

    • Execution Metrics (Ausführungsmetriken)

    • Activity Function Metrics (Aktivitätsfunktionsmetriken)

    • Lambda-Funktionsmetriken

    • Kennzahlen zur Serviceintegration

  3. Wählen Sie einen Metriktyp aus, um eine Liste der Metriken zu sehen.

  4. Wählen Sie eine Metrik und anschließend Graphed metrics (Grafisch dargestellte Metriken) aus.

  5. Wählen Sie das glockenförmige Symbol neben einer Metrik in der Liste, um die Seite „Alarm erstellen“ aufzurufen.

  6. Geben Sie die Werte für Alarm threshold (Alarmschwellenwert) und Actions (Aktionen) ein und wählen Sie dann Create Alarm (Alarm erstellen) aus.

Weitere Informationen zum Einstellen und Verwenden von CloudWatch Alarmen finden Sie unter CloudWatch Amazon-Alarme erstellen im CloudWatch Amazon-Benutzerhandbuch.