Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Allarmi e registri per tracciare le metriche dagli endpoint serverless
Per monitorare il tuo endpoint serverless, puoi utilizzare Amazon CloudWatch alarms. CloudWatch è un servizio che raccoglie metriche in tempo reale dalle tue applicazioni e risorse. AWS Un allarme controlla i parametri man mano che vengono raccolti e ti dà la possibilità di specificare in anticipo una soglia e le azioni da intraprendere in caso di superamento di tale soglia. Ad esempio, l' CloudWatch allarme può inviare una notifica se l'endpoint supera una soglia di errore. Configurando gli CloudWatch allarmi, ottieni visibilità sulle prestazioni e sulla funzionalità del tuo endpoint. Per ulteriori informazioni sugli CloudWatch allarmi, consulta Using Amazon CloudWatch alarms nella Amazon CloudWatch User Guide.
Monitoraggio con CloudWatch
I parametri riportati di seguito sono un elenco esaustivo di parametri per gli endpoint serverless. Qualsiasi parametro non elencato di seguito non viene pubblicato per gli endpoint serverless. Per informazioni sui seguenti parametri, consulta Monitorare Amazon SageMaker AI con Amazon CloudWatch.
Parametri degli endpoint comuni
Queste CloudWatch metriche sono le stesse pubblicate per gli endpoint in tempo reale.
La OverheadLatency
metrica tiene traccia di tutta la latenza aggiuntiva aggiunta dall' SageMaker IA, inclusa l'ora di avvio a freddo per il lancio di nuove risorse di elaborazione per gli endpoint serverless. Rispetto agli endpoint serverless on-demand, OverheadLatency
per gli endpoint serverless con provisioning di simultaneità sono generalmente significativamente inferiori.
Gli endpoint serverless possono anche utilizzare i parametri Invocations4XXErrors
, Invocations5XXErrors
, Invocations
, ModelLatency
, ModelSetupTime
e MemoryUtilization
. Per ulteriori informazioni su questi parametri, consulta SageMaker Metriche di invocazione degli endpoint AI.
Parametri comuni degli endpoint serverless
Queste CloudWatch metriche sono pubblicate sia per gli endpoint serverless on-demand che per gli endpoint serverless con Provisioned Concurrency.
Nome parametro | Descrizione | Unità/statistiche |
---|---|---|
ServerlessConcurrentExecutionsUtilization |
Il numero di esecuzioni simultanee diviso per il numero massimo di simultaneità. | Unità: nessuna Statistiche valide: medio, massimo, minimo |
Endpoint serverless con parametri di provisioning di simultaneità
Queste CloudWatch metriche sono pubblicate per gli endpoint serverless con Provisioned Concurrency.
Nome parametro | Descrizione | Unità/statistiche |
---|---|---|
ServerlessProvisionedConcurrencyExecutions |
Il numero di esecuzioni simultanee gestite dall'endpoint. | Unità: numero Statistiche valide: medio, massimo, minimo |
ServerlessProvisionedConcurrencyUtilization |
Il numero di esecuzioni simultanee diviso per il numero di simultaneità allocato. | Unità: nessuna Statistiche valide: medio, massimo, minimo |
ServerlessProvisionedConcurrencyInvocations |
Il numero di richieste InvokeEndpoint gestite dal provisioning di simultaneità. |
Unità: numero Statistiche valide: medio, massimo, minimo |
ServerlessProvisionedConcurrencySpilloverInvocations |
Il numero di richieste InvokeEndpoint non gestite dal provisioning di simultaneità, ovvero gestite da Inferenza Serverless on-demand. |
Unità: numero Statistiche valide: medio, massimo, minimo |
Log
Se desideri monitorare i log dal tuo endpoint per il debug o l'analisi dei progressi, puoi utilizzare Amazon Logs. CloudWatch Il gruppo di log SageMaker fornito dall'intelligenza artificiale che puoi usare per gli endpoint serverless è. /aws/sagemaker/Endpoints/[EndpointName]
Per ulteriori informazioni sull'utilizzo dei CloudWatch log in AI, consulta. SageMaker Gruppi di log e stream inviati da Amazon SageMaker AI ad Amazon CloudWatch Logs Per ulteriori informazioni sui CloudWatch log, consulta What is Amazon CloudWatch Logs? nella Amazon CloudWatch Logs User Guide.