Alarme und Protokolle zur Verfolgung von Metriken von serverlosen Endpunkten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Alarme und Protokolle zur Verfolgung von Metriken von serverlosen Endpunkten

Um Ihren serverlosen Endpunkt zu überwachen, können Sie CloudWatch Amazon-Alarme verwenden. CloudWatch ist ein Service, der in Echtzeit Metriken aus Ihren AWS Anwendungen und Ressourcen sammelt. Ein Alarm überwacht die erfassten Messwerte und gibt Ihnen die Möglichkeit, vorab einen Schwellenwert und die Maßnahmen festzulegen, die bei einer Überschreitung dieses Schwellenwerts zu ergreifen sind. Ihr CloudWatch Alarm kann Ihnen beispielsweise eine Benachrichtigung senden, wenn Ihr Endpunkt einen Fehlerschwellenwert überschreitet. Durch die Einrichtung von CloudWatch Alarmen erhalten Sie einen Überblick über die Leistung und Funktionalität Ihres Endgeräts. Weitere Informationen zu CloudWatch Alarmen finden Sie unter Verwenden von CloudWatch Amazon-Alarmen im CloudWatch Amazon-Benutzerhandbuch.

Überwachung mit CloudWatch

Die folgenden Metriken sind eine vollständige Liste von Metriken für serverlose Endgeräte. Alle unten nicht aufgeführten Metriken werden nicht für serverlose Endgeräte veröffentlicht. Informationen zu den folgenden Metriken finden Sie unter Überwachen von Amazon SageMaker AI mit Amazon CloudWatch.

Allgemeine Endpunktmetriken

Diese CloudWatch Metriken entsprechen den für Echtzeit-Endpunkte veröffentlichten Metriken.

Die OverheadLatency Metrik erfasst alle zusätzlichen Latenzen, die SageMaker KI hinzugefügt hat, einschließlich der Kaltstartzeit für den Start neuer Rechenressourcen für Ihren serverlosen Endpunkt. Im Vergleich zu serverlosen On-Demand-Endpunkten ist die OverheadLatency bei serverlosen Endpunkten mit paralleler Bereitstellung im Allgemeinen deutlich geringer.

Serverlose Endgeräte können auch die Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime und MemoryUtilization Metriken verwenden. Weitere Informationen zu diesen Metriken finden Sie unter SageMaker Metriken zum Aufrufen von KI-Endpunkten.

Metriken für serverlose Endgeräte

Diese CloudWatch Metriken werden sowohl für serverlose On-Demand-Endpoints als auch für serverlose Endpoints mit Provisioned Concurrency veröffentlicht.

Metrikname Beschreibung Einheit/Statistik
ServerlessConcurrentExecutionsUtilization Die Anzahl der gleichzeitigen Ausführungen geteilt durch die maximale Gleichzeitigkeit.

Einheiten: keine

Gültige Statistiken: Durchschnitt, Maximum und Minimum

Serverloser Endpunkt mit Metriken für Provisioned Concurrency

Diese CloudWatch Metriken werden für serverlose Endpunkte mit Provisioned Concurrency veröffentlicht.

Metrikname Beschreibung Einheit/Statistik
ServerlessProvisionedConcurrencyExecutions Die Anzahl der gleichzeitigen Ausführungen, die vom Endpunkt verarbeitet werden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Maximum und Minimum

ServerlessProvisionedConcurrencyUtilization Die Anzahl der gleichzeitigen Ausführungen geteilt durch die zugewiesene Provisioned Concurrency.

Einheiten: keine

Gültige Statistiken: Durchschnitt, Maximum und Minimum

ServerlessProvisionedConcurrencyInvocations Die Anzahl der InvokeEndpoint Anfragen, die von Provisioned Concurrency bearbeitet wurden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Maximum und Minimum

ServerlessProvisionedConcurrencySpilloverInvocations Die Anzahl der InvokeEndpoint Anfragen, die nicht von Provisioned Concurrency, sondern von On-Demand-serverlose Inferenz bearbeitet werden.

Einheiten: Anzahl

Gültige Statistiken: Durchschnitt, Maximum und Minimum

Logs (Protokolle)

Wenn Sie die Protokolle von Ihrem Endpunkt aus zum Debuggen oder zur Fortschrittsanalyse überwachen möchten, können Sie Amazon CloudWatch Logs verwenden. Die von SageMaker KI bereitgestellte Protokollgruppe, die Sie für serverlose Endpunkte verwenden können, ist. /aws/sagemaker/Endpoints/[EndpointName] Weitere Informationen zur Verwendung von CloudWatch Logs in SageMaker AI finden Sie unter. Protokollgruppen und Streams, die Amazon SageMaker AI an Amazon CloudWatch Logs sendet Weitere Informationen zu CloudWatch Logs finden Sie unter Was ist Amazon CloudWatch Logs? im Amazon CloudWatch Logs-Benutzerhandbuch.