Überwachung mit CloudWatch Logs (Protokolle)

Alarme und Protokolle zur Verfolgung von Metriken von serverlosen Endpunkten

Um Ihren serverlosen Endpunkt zu überwachen, können Sie CloudWatch Amazon-Alarme verwenden. CloudWatch ist ein Service, der in Echtzeit Metriken aus Ihren AWS Anwendungen und Ressourcen sammelt. Ein Alarm überwacht die erfassten Messwerte und gibt Ihnen die Möglichkeit, vorab einen Schwellenwert und die Maßnahmen festzulegen, die bei einer Überschreitung dieses Schwellenwerts zu ergreifen sind. Ihr CloudWatch Alarm kann Ihnen beispielsweise eine Benachrichtigung senden, wenn Ihr Endpunkt einen Fehlerschwellenwert überschreitet. Durch die Einrichtung von CloudWatch Alarmen erhalten Sie einen Überblick über die Leistung und Funktionalität Ihres Endgeräts. Weitere Informationen zu CloudWatch Alarmen finden Sie unter Verwenden von CloudWatch Amazon-Alarmen im CloudWatch Amazon-Benutzerhandbuch.

Überwachung mit CloudWatch

Die folgenden Metriken sind eine vollständige Liste von Metriken für serverlose Endgeräte. Alle unten nicht aufgeführten Metriken werden nicht für serverlose Endgeräte veröffentlicht. Informationen zu den folgenden Metriken finden Sie unter Überwachen von Amazon SageMaker AI mit Amazon CloudWatch.

Allgemeine Endpunktmetriken

Diese CloudWatch Metriken entsprechen den für Echtzeit-Endpunkte veröffentlichten Metriken.

Die OverheadLatency Metrik erfasst alle zusätzlichen Latenzen, die SageMaker KI hinzugefügt hat, einschließlich der Kaltstartzeit für den Start neuer Rechenressourcen für Ihren serverlosen Endpunkt. Im Vergleich zu serverlosen On-Demand-Endpunkten ist die OverheadLatency bei serverlosen Endpunkten mit paralleler Bereitstellung im Allgemeinen deutlich geringer.

Serverlose Endgeräte können auch die Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime und MemoryUtilization Metriken verwenden. Weitere Informationen zu diesen Metriken finden Sie unter SageMaker Metriken zum Aufrufen von KI-Endpunkten.

Metriken für serverlose Endgeräte

Diese CloudWatch Metriken werden sowohl für serverlose On-Demand-Endpoints als auch für serverlose Endpoints mit Provisioned Concurrency veröffentlicht.

Metrikname Beschreibung Einheit/Statistik

Metrikname	Beschreibung	Einheit/Statistik
`ServerlessConcurrentExecutionsUtilization`	Die Anzahl der gleichzeitigen Ausführungen geteilt durch die maximale Gleichzeitigkeit.	Einheiten: keine Gültige Statistiken: Durchschnitt, Maximum und Minimum

ServerlessConcurrentExecutionsUtilization

Die Anzahl der gleichzeitigen Ausführungen geteilt durch die maximale Gleichzeitigkeit.

Einheiten: keine

Gültige Statistiken: Durchschnitt, Maximum und Minimum

Serverloser Endpunkt mit Metriken für Provisioned Concurrency

Diese CloudWatch Metriken werden für serverlose Endpunkte mit Provisioned Concurrency veröffentlicht.

Metrikname	Beschreibung	Einheit/Statistik
`ServerlessProvisionedConcurrencyExecutions`	Die Anzahl der gleichzeitigen Ausführungen, die vom Endpunkt verarbeitet werden.	Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Maximum und Minimum
`ServerlessProvisionedConcurrencyUtilization`	Die Anzahl der gleichzeitigen Ausführungen geteilt durch die zugewiesene Provisioned Concurrency.	Einheiten: keine Gültige Statistiken: Durchschnitt, Maximum und Minimum
`ServerlessProvisionedConcurrencyInvocations`	Die Anzahl der `InvokeEndpoint` Anfragen, die von Provisioned Concurrency bearbeitet wurden.	Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Maximum und Minimum
`ServerlessProvisionedConcurrencySpilloverInvocations`	Die Anzahl der `InvokeEndpoint` Anfragen, die nicht von Provisioned Concurrency, sondern von On-Demand-serverlose Inferenz bearbeitet werden.	Einheiten: Anzahl Gültige Statistiken: Durchschnitt, Maximum und Minimum

Logs (Protokolle)

Wenn Sie die Protokolle von Ihrem Endpunkt aus zum Debuggen oder zur Fortschrittsanalyse überwachen möchten, können Sie Amazon CloudWatch Logs verwenden. Die von SageMaker KI bereitgestellte Protokollgruppe, die Sie für serverlose Endpunkte verwenden können, ist. /aws/sagemaker/Endpoints/[EndpointName] Weitere Informationen zur Verwendung von CloudWatch Logs in SageMaker AI finden Sie unter. Protokollgruppen und Streams, die Amazon SageMaker AI an Amazon CloudWatch Logs sendet Weitere Informationen zu CloudWatch Logs finden Sie unter Was ist Amazon CloudWatch Logs? im Amazon CloudWatch Logs-Benutzerhandbuch.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

So löschen Sie einen Serverless-Endpunkt

Automatische Skalierung der bereitgestellten Gleichzeitigkeit für einen Serverless Endpunkt