Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Metriche per il monitoraggio di Amazon SageMaker con Amazon CloudWatch
Puoi monitorare Amazon SageMaker utilizzando Amazon CloudWatch, che raccoglie dati grezzi e li elabora in metriche leggibili quasi in tempo reale. Queste statistiche vengono conservate per 15 mesi. Con loro, puoi accedere alle informazioni storiche e avere una prospettiva migliore sulle prestazioni della tua applicazione o del tuo servizio web. Tuttavia, la CloudWatch console Amazon limita la ricerca alle metriche aggiornate nelle ultime 2 settimane. Questa limitazione consente di visualizzare nello spazio dei nomi i processi più aggiornati.
Per rappresentare graficamente i parametri senza utilizzare una ricerca, specifica il nome esatto nella visualizzazione di origine. È anche possibile impostare allarmi che controllano determinate soglie e inviare notifiche o intraprendere azioni quando queste soglie vengono raggiunte. Per ulteriori informazioni, consulta la Amazon CloudWatch User Guide.
SageMaker Metriche e dimensioni
- SageMaker metriche di invocazione degli endpoint
- SageMaker metriche dei componenti di inferenza
- SageMaker metriche degli endpoint multimodello
- SageMaker metriche relative ai lavori e agli endpoint
- SageMaker Metriche dei lavori di Inference Recommender
- SageMaker Metriche di Ground Truth
- Metriche SageMaker di Amazon Feature Store
- SageMaker metriche delle pipeline
SageMaker metriche di invocazione degli endpoint
Il AWS/SageMaker
namespace include le seguenti metriche di richiesta provenienti da chiamate a. InvokeEndpoint
I parametri sono disponibili a una frequenza di 1 minuto.
L'illustrazione seguente mostra come un SageMaker endpoint interagisce con Amazon Runtime. SageMaker API Il tempo complessivo tra l'invio di una richiesta a un endpoint e la ricezione di una risposta dipende dai seguenti tre componenti.
-
Latenza di rete: il tempo che intercorre tra l'invio di una richiesta e la ricezione di una risposta dal Runtime Runtime. SageMaker API
-
Latenza di sovraccarico: il tempo necessario per trasportare una richiesta al container del modello e riportare la risposta al Runtime Runtime. SageMaker API
-
Latenza del modello: il tempo impiegato dal container del modello per elaborare la richiesta e restituire una risposta.
Per ulteriori informazioni sulla latenza totale, consulta Best practice for load testing degli endpoint di inferenza SageMaker in tempo reale di Amazon
Parametri di invocazione dell'endpoint
Parametro | Descrizione |
---|---|
ConcurrentRequestsPerCopy |
Il numero di richieste simultanee ricevute dal componente di inferenza, normalizzato da ogni copia di un componente di inferenza. Statistiche valide: Min, Max |
ConcurrentRequestsPerModel |
Il numero di richieste simultanee ricevute dal modello. Statistiche valide: Min, Max |
Invocation4XXErrors |
Il numero di Unità: nessuna Statistiche valide: Average, Sum |
Invocation5XXErrors |
Il numero di Unità: nessuna Statistiche valide: Average, Sum |
InvocationModelErrors |
Il numero di richieste di invocazione del modello che non hanno prodotto una risposta 2XX. HTTP Ciò include codici di stato 4XX/5XX, errori di socket di basso livello, risposte non corrette e timeout delle richieste. HTTP Per ogni risposta di errore, viene inviato 1; altrimenti, viene inviato 0. Unità: nessuna Statistiche valide: Average, Sum |
Invocations |
Il numero delle richieste Per ottenere il numero totale di richieste inviate a un endpoint di un modello, utilizza la statistica Sum. Unità: nessuna Statistiche valide: somma |
InvocationsPerCopy |
Il numero di invocazioni normalizzate da ogni copia di un componente di inferenza. Statistiche valide: somma |
InvocationsPerInstance |
Il numero di chiamate inviate a un modello, normalizzato da Unità: nessuna Statistiche valide: somma |
ModelLatency |
L'intervallo di tempo impiegato da un modello per rispondere a una SageMaker richiesta di Runtime. API Questo intervallo include i tempi di comunicazione locali necessari per inviare la richiesta e recuperare la risposta dal contenitore del modello. Include anche il tempo impiegato per completare l'inferenza nel contenitore. Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
ModelSetupTime |
Il tempo necessario per lanciare nuove risorse di calcolo per un endpoint serverless. Il tempo può variare a seconda delle dimensioni del modello, del tempo necessario per scaricare il modello e dal tempo di avvio del container. Unità: microsecondi Statistiche valide: media, minimo, massimo, numero di esempi, percentili |
OverheadLatency |
L'intervallo di tempo aggiunto al tempo impiegato per rispondere a una richiesta del cliente in base SageMaker alle spese generali. Questo intervallo viene misurato dal momento in cui SageMaker riceve la richiesta fino a quando questa restituisce una risposta al client, meno il. Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
Dimensioni dei parametri di invocazione dell'endpoint
Dimensione | Descrizione |
---|---|
EndpointName, VariantName |
Filtra i parametri di invocazione dell'endpoint per il valore |
InferenceComponentName |
Filtra le metriche di invocazione dei componenti di inferenza. |
SageMaker metriche dei componenti di inferenza
Lo spazio dei /aws/sagemaker/InferenceComponents
nomi include le seguenti metriche relative alle chiamate agli endpoint che ospitano componenti InvokeEndpointdi inferenza.
I parametri sono disponibili a una frequenza di 1 minuto.
Parametro | Descrizione |
---|---|
CPUUtilizationNormalized |
Il valore della |
GPUMemoryUtilizationNormalized |
Il valore della |
GPUUtilizationNormalized |
Il valore della |
MemoryUtilizationNormalized |
Il valore |
Dimensioni per le metriche dei componenti di inferenza
Dimensione | Descrizione |
---|---|
InferenceComponentName |
Filtra le metriche dei componenti di inferenza. |
SageMaker metriche degli endpoint multimodello
Il AWS/SageMaker
namespace include il seguente modello di caricamento delle metriche dalle chiamate a. InvokeEndpoint
I parametri sono disponibili a una frequenza di 1 minuto.
Per informazioni sulla durata di conservazione CloudWatch delle metriche, consulta Amazon GetMetricStatistics CloudWatch APIReference.
Parametri di caricamento del modello di endpoint multi-modello
Parametro | Descrizione |
---|---|
ModelLoadingWaitTime |
L'intervallo di tempo in cui una richiesta di chiamata ha atteso prima che il modello di destinazione venga scaricato, caricato o entrambi per eseguire l'inferenza. Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
ModelUnloadingTime |
L'intervallo di tempo impiegato per scaricare il modello tramite la chiamata del contenitore. Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
ModelDownloadingTime |
L'intervallo di tempo impiegato per scaricare il modello da Amazon Simple Storage Service (Amazon S3). Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
ModelLoadingTime |
L'intervallo di tempo impiegato per caricare il modello tramite la chiamata del contenitore. Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
ModelCacheHit |
Numero di richieste La statistica media mostra il rapporto tra richieste per le quali il modello è già stato caricato. Unità: nessuna Statistiche valide: media, somma, numero di esempi |
Dimensioni per i parametri di caricamento del modello endpoint a più modelli
Dimensione | Descrizione |
---|---|
EndpointName, VariantName |
Filtra i parametri di invocazione dell'endpoint per il valore |
I /aws/sagemaker/Endpoints
namespace includono le seguenti metriche di istanza relative alle chiamate a. InvokeEndpoint
I parametri sono disponibili a una frequenza di 1 minuto.
Per informazioni sulla durata di conservazione CloudWatch delle metriche, consulta Amazon GetMetricStatistics CloudWatch APIReference.
Parametri dell'istanza del modello endpoint a più modelli
Parametro | Descrizione |
---|---|
LoadedModelCount |
Numero di modelli caricati nei container dell'endpoint a più modelli. Questo parametro viene emesso per istanza. La statistica media con un periodo di 1 minuto indica il numero medio di modelli caricati per istanza. La statistica somma indica il numero totale di modelli caricati in tutte le istanze dell'endpoint. I modelli tracciati da questo parametro non sono necessariamente univoci perché un modello potrebbe essere caricato in più container dell'endpoint. Unità: nessuna Statistiche valide: media, somma, minimo, massimo, numero di esempi |
Dimensioni per i parametri di caricamento del modello endpoint a più modelli
Dimensione | Descrizione |
---|---|
EndpointName, VariantName |
Filtra i parametri di invocazione dell'endpoint per il valore |
SageMaker metriche relative ai lavori e agli endpoint
I /aws/sagemaker/Endpoints
namespace /aws/sagemaker/ProcessingJobs
/aws/sagemaker/TrainingJobs
,/aws/sagemaker/TransformJobs
, e includono le seguenti metriche per i job di formazione e le istanze degli endpoint.
I parametri sono disponibili a una frequenza di 1 minuto.
Nota
Amazon CloudWatch supporta metriche personalizzate ad alta risoluzione e la sua risoluzione massima è di 1 secondo. Tuttavia, maggiore è la risoluzione, minore è la durata delle metriche. CloudWatch Per la risoluzione di frequenza di 1 secondo, le CloudWatch metriche sono disponibili per 3 ore. Per ulteriori informazioni sulla risoluzione e sulla durata delle CloudWatch metriche, consulta Amazon GetMetricStatisticsReference. CloudWatch API
Suggerimento
Per profilare il tuo lavoro di formazione con una risoluzione più precisa con una granularità fino a 100 millisecondi (0,1 secondi) e archiviare i parametri di formazione a tempo indeterminato in Amazon S3 per analisi personalizzate in qualsiasi momento, prendi in considerazione l'utilizzo di Amazon Debugger. SageMaker SageMaker Debugger fornisce regole integrate per rilevare automaticamente i problemi di formazione più comuni. Rileva i problemi di utilizzo delle risorse hardware (ad esempioCPU, GPU e i colli di bottiglia di I/O). Rileva inoltre problemi non convergenti del modello (ad esempio sovradimensionamento, gradienti spariti e tensori esplosivi). SageMaker Debugger fornisce anche visualizzazioni tramite Studio Classic e il relativo rapporto di profilazione. Per esplorare le visualizzazioni del Debugger, consulta Debugger Insights Dashboard Walkthrough, SageMaker Debugger Profiling Report Walkthrough e Analyze Data Using the Client Library. SMDebug
Processi di elaborazione, processi di addestramento, processi di trasformazione in batch e parametri di istanza endpoint
Parametro | Descrizione |
---|---|
CPUReservation |
La CPUs somma dei contenitori riservati per istanza. Il valore è compreso tra 0% e 100%. Nelle impostazioni di un componente di inferenza, si imposta la CPU prenotazione con il |
CPUUtilization |
La somma dell'utilizzo di ogni singolo CPU core. L'CPUutilizzo di ogni intervallo di core è compreso tra 0 e 100. Ad esempio, se ce ne sono quattroCPUs, l'CPUUtilization intervallo è compreso tra 0% e 400%. Per i processi di elaborazione, il valore è l'CPUutilizzo del contenitore di elaborazione sull'istanza.Per i lavori di formazione, il valore è l'CPUutilizzo del contenitore dell'algoritmo sull'istanza. Per i lavori di trasformazione in batch, il valore è l'CPUutilizzo del contenitore di trasformazione sull'istanza. Per le varianti di endpoint, il valore è la somma dell'CPUutilizzo dei contenitori primari e supplementari sull'istanza. NotaPer i lavori a più istanze, ogni istanza riporta le metriche di utilizzo. CPU Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'CPUutilizzo medio in tutte le istanze. Unità: percentuale |
CPUUtilizationNormalized |
La somma normalizzata dell'utilizzo di ogni singolo core. CPU Il valore è compreso tra 0% e 100%. Ad esempio, se ce ne sono quattro CPUs e la |
DiskUtilization |
Percentuale di spazio su disco utilizzata dai container su un'istanza. Questo intervallo di valori è compreso tra 0% e 100%. Questo parametro non è supportato per i processi di trasformazione in batch. Per le attività di elaborazione, il valore è l'utilizzo dello spazio su disco del container di elaborazione nell'istanza.Per i processi di addestramento, il valore corrisponde all'utilizzo dello spazio su disco del container di algoritmi sull'istanza. Per le varianti dell'endpoint, il valore è la somma dell'utilizzo dello spazio su disco dei container principali e supplementari sull'istanza. Unità: percentuale NotaIn caso di processi multi-istanza, ogni istanza riferisce i parametri di utilizzo del disco. Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio del disco in tutte le istanze. |
GPUMemoryUtilization |
La percentuale di GPU memoria utilizzata dai contenitori su un'istanza. L'intervallo di valori è compreso tra 0 e 100 e viene moltiplicato per il numero di. GPUs Ad esempio, se ce ne sono quattroGPUs, l' Per i processi di formazione, il valore è l'utilizzo della GPU memoria del contenitore dell'algoritmo sull'istanza. Per i processi di trasformazione in batch, il valore è l'utilizzo della GPU memoria del contenitore di trasformazione sull'istanza. Per le varianti degli endpoint, il valore è la somma dell'utilizzo della GPU memoria dei contenitori primari e supplementari sull'istanza. NotaPer i lavori a più istanze, ogni istanza riporta GPU le metriche di utilizzo della memoria. Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio della GPU memoria in tutte le istanze. Unità: percentuale |
GPUMemoryUtilizationNormalized |
La percentuale normalizzata di GPU memoria utilizzata dai contenitori su un'istanza. Il valore è compreso tra 0% e 100%. Ad esempio, se ce ne sono quattro GPUs e la |
GPUReservation |
La somma dei dati GPUs riservati per container su un'istanza. Il valore è compreso tra 0% e 100%. Nelle impostazioni per un componente di inferenza, si imposta la GPU prenotazione per |
GPUUtilization |
La percentuale di GPU unità utilizzate dai contenitori su un'istanza. Il valore può essere compreso tra 0 e 100 e viene moltiplicato per il numero di. GPUs Ad esempio, se ce ne sono quattroGPUs, l' Per i lavori di formazione, il valore è l'GPUutilizzo del contenitore dell'algoritmo sull'istanza. Per i lavori di trasformazione in batch, il valore è l'GPUutilizzo del contenitore di trasformazione sull'istanza. Per le varianti di endpoint, il valore è la somma dell'GPUutilizzo dei contenitori primari e supplementari sull'istanza. NotaPer i lavori a più istanze, ogni istanza riporta le metriche di utilizzo. GPU Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'GPUutilizzo medio in tutte le istanze. Unità: percentuale |
GPUUtilizationNormalized |
La percentuale normalizzata di GPU unità utilizzate dai contenitori su un'istanza. Il valore è compreso tra 0% e 100%. Ad esempio, se ce ne sono quattro GPUs e la |
MemoryReservation |
La somma della memoria riservata dai contenitori su un'istanza. Il valore è compreso tra 0% e 100%. Nelle impostazioni di un componente di inferenza, si imposta la prenotazione della memoria con il |
MemoryUtilization |
Percentuale di memoria utilizzata dai container su un'istanza. Questo intervallo di valori è compreso tra 0% e 100%. Per le attività di elaborazione, il valore è l'utilizzo della memoria del container di elaborazione nell'istanza.Per i processi di addestramento, il valore corrisponde all'utilizzo della memoria del container di algoritmi sull'istanza. Per i processi di trasformazione in batch, il valore corrisponde all'utilizzo della memoria del container di trasformazione sull'istanza. Per le varianti dell'endpoint, il valore è la somma dell'utilizzo di memoria dei container principali e supplementari sull'istanza. Unità: percentuale NotaIn caso di processi multi-istanza, ogni istanza riferisce i parametri di utilizzo della memoria. Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio della memoria in tutte le istanze. |
Dimensioni del processo di elaborazione, processo di addestramento e parametri delle istanze processo di trasformazione in batch
Dimensione | Descrizione |
---|---|
Host |
Per le attività di elaborazione, il valore di questa dimensione ha il formato Per i processi di addestramento, il valore di questa dimensione ha il formato Per i processi di trasformazione in batch, il valore di questa dimensione ha il formato |
SageMaker Metriche dei lavori di Inference Recommender
Lo spazio dei nomi /aws/sagemaker/InferenceRecommendationsJobs
include i seguenti parametri per i processi di raccomandazione dell'inference.
Parametri del Suggeritore di inferenza
Parametro | Descrizione |
---|---|
ClientInvocations |
Il numero di richieste Unità: nessuna Statistiche valide: somma |
ClientInvocationErrors |
Il numero di richieste Unità: nessuna Statistiche valide: somma |
ClientLatency |
L'intervallo di tempo impiegato tra l'invio di una chiamata Unità: millisecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi, percentili |
NumberOfUsers |
Il numero di utenti simultanei che inviano richieste Unità: nessuna Statistiche valide: massimo, minimo, medio |
Dimensioni dei parametri per i processi del Suggeritore di inferenza
Dimensione | Descrizione |
---|---|
JobName |
Filtra i parametri del processo del Suggeritore di inferenza per il processo del Suggeritore di inferenza specificato. |
EndpointName |
Filtra i parametri del processo del Suggeritore di inferenza per l’endpoint specificato. |
SageMaker Metriche di Ground Truth
Parametri di Ground Truth
Parametro | Descrizione |
---|---|
ActiveWorkers |
Un singolo worker attivo in un team di lavoro privato ha inviato, rilasciato o rifiutato un'attività. Per ottenere il numero totale di worker attivi, utilizza la statistica Sum (Somma). Ground Truth cerca di fornire ogni singolo Unità: nessuna Statistiche valide: Sum, Sample Count |
DatasetObjectsAutoAnnotated |
Il numero di oggetti del set di dati annotati automaticamente in un processo di etichettatura. Questo parametro viene emesso solo quando è abilitata l'etichettatura automatizzata. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max. Unità: nessuna Statistiche valide: Max |
DatasetObjectsHumanAnnotated |
Il numero di oggetti del set di dati annotati da persone in un processo di etichettatura. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max. Unità: nessuna Statistiche valide: Max |
DatasetObjectsLabelingFailed |
Il numero di oggetti del set di dati in cui si è verificato un errore di etichettatura in un processo di etichettatura. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max. Unità: nessuna Statistiche valide: Max |
JobsFailed |
Un singolo processo di etichettatura non è riuscito. Per ottenere il numero totale di processi di etichettatura non riusciti, utilizza la statistica Sum. Unità: nessuna Statistiche valide: Sum, Sample Count |
JobsSucceeded |
Un singolo processo di etichettatura è riuscito. Per ottenere il numero totale di processi di etichettatura riusciti, utilizza la statistica Sum. Unità: nessuna Statistiche valide: Sum, Sample Count |
JobsStopped |
Un singolo processo di etichettatura è stato interrotto. Per ottenere il numero totale di processi di etichettatura interrotti, utilizza la statistica Sum. Unità: nessuna Statistiche valide: Sum, Sample Count |
TasksAccepted |
Un singolo compito è stato accettato da un worker. Per ottenere il numero totale di attività accettate dai worker, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento Unità: nessuna Statistiche valide: Sum, Sample Count |
TasksDeclined |
Un singolo compito è stato rifiutato da un worker. Per ottenere il numero totale di attività rifiutate dai worker, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento Unità: nessuna Statistiche valide: Sum, Sample Count |
TasksReturned |
È stata restituita una singola attività. Per ottenere il numero totale di attività restituite, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento Unità: nessuna Statistiche valide: Sum, Sample Count |
TasksSubmitted |
Una singola attività è stata inviata/completata da un worker privato. Per ottenere il numero totale di attività inviate dai worker, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento Unità: nessuna Statistiche valide: Sum, Sample Count |
TimeSpent |
Tempo trascorso su un'attività completata da un worker privato. Questo parametro non include il tempo in cui un worker si è fermato o si è preso una pausa. Ground Truth tenta di fornire ogni evento Unità: secondi Statistiche valide: Sum, Sample Count |
TotalDatasetObjectsLabeled |
Il numero di oggetti del set di dati completati correttamente in un processo di etichettatura. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max. Unità: nessuna Statistiche valide: Max |
Dimensioni per i parametri degli oggetti del set di dati
Dimensione | Descrizione |
---|---|
LabelingJobName |
Filtra i parametri per il conteggio degli oggetti del set di dati per un processo di etichettatura. |
Metriche SageMaker di Amazon Feature Store
Parametri di utilizzo dell'archivio funzionalità
Parametro | Descrizione |
---|---|
ConsumedReadRequestsUnits |
Il numero di unità di lettura consumate nel periodo di tempo specificato. È possibile recuperare le unità di lettura consumate da un'operazione di runtime dell'archivio funzionalità e il relativo gruppo di funzionalità corrispondente. Unità: nessuna Statistiche valide: tutte |
ConsumedWriteRequestsUnits |
Il numero di unità di scrittura consumate nel periodo di tempo specificato. È possibile recuperare le unità di scrittura consumate da un'operazione di runtime dell'archivio funzionalità e il relativo gruppo di funzionalità corrispondente. Unità: nessuna Statistiche valide: tutte |
ConsumedReadCapacityUnits |
Il numero di unità di capacità di lettura assegnate consumate nel periodo di tempo specificato. È possibile recuperare le unità di capacità di lettura consumate per un'operazione di runtime del feature store e il relativo gruppo di funzionalità corrispondente. Unità: nessuna Statistiche valide: tutte |
ConsumedWriteCapacityUnits |
Il numero di unità di capacità di scrittura assegnate utilizzate nel periodo di tempo specificato. È possibile recuperare le unità di capacità di scrittura consumate per un'operazione di runtime del feature store e il relativo gruppo di funzionalità corrispondente. Unità: nessuna Statistiche valide: tutte |
Dimensioni dei parametri di utilizzo dell'archivio funzionalità
Dimensione | Descrizione |
---|---|
FeatureGroupName , OperationName |
Filtra i parametri di utilizzo del runtime dell'archivio funzionalità del gruppo di funzionalità e dell'operazione che hai specificato. |
Parametri operativi dell'archivio funzionalità
Parametro | Descrizione |
---|---|
Invocations |
Il numero di richieste effettuate alle operazioni di runtime dell'archivio funzionalità nel periodo di tempo specificato. Unità: nessuna Statistiche valide: somma |
Operation4XXErrors |
Il numero di richieste effettuate alle operazioni di runtime del Feature Store in cui l'operazione ha restituito un codice di HTTP risposta 4xx. Per ogni risposta 4xx, viene inviata 1; in caso contrario, viene inviato 0. Unità: nessuna Statistiche valide: Average, Sum |
Operation5XXErrors |
Il numero di richieste effettuate alle operazioni di runtime del feature store in cui l'operazione ha restituito un codice di HTTP risposta 5xx. Per ogni risposta 5xx, viene inviata 1; in caso contrario, viene inviato 0. Unità: nessuna Statistiche valide: Average, Sum |
ThrottledRequests |
Il numero di richieste effettuate alle operazioni di runtime dell'archivio funzionalità in cui la richiesta è stata limitata. Per ogni richiesta limitata, viene inviata 1; in caso contrario, viene inviato 0. Unità: nessuna Statistiche valide: Average, Sum |
Latency |
L'intervallo di tempo per l'elaborazione delle richieste effettuate alle operazioni di runtime dell'archivio funzionalità. Questo intervallo viene misurato dal momento in cui SageMaker riceve la richiesta fino a quando non restituisce una risposta al client. Unità: microsecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi, percentili |
Dimensioni dei parametri operativi dell'archivio funzionalità
Dimensione | Descrizione |
---|---|
|
Filtra i parametri operativi del runtime dell'archivio funzionalità del gruppo di funzionalità e dell'operazione che hai specificato. È possibile utilizzare queste dimensioni per operazioni non batch, ad esempio GetRecord PutRecord, e DeleteRecord. |
OperationName |
Filtra i parametri operativi del runtime dell'archivio funzionalità dell'operazione che hai specificato. È possibile utilizzare questa dimensione per operazioni batch come BatchGetRecord. |
SageMaker metriche delle pipeline
Lo spazio dei nomi AWS/Sagemaker/ModelBuildingPipeline
include i seguenti parametri per le esecuzioni di pipeline.
Sono disponibili due categorie di parametri di esecuzione di Pipeline:
-
Parametri di esecuzione su tutte le Pipeline: parametri di esecuzione di pipeline a livello di account (per tutte le pipeline dell'account corrente)
-
Parametri di esecuzione per pipeline: parametri di esecuzione di pipeline per pipeline
I parametri sono disponibili a una frequenza di 1 minuto.
Parametri di esecuzione di pipeline
Parametro | Descrizione |
---|---|
ExecutionStarted |
Il numero di esecuzioni di pipeline avviate. Unità: numero Statistiche valide: Average, Sum |
ExecutionFailed |
Il numero di esecuzioni di pipeline non riuscite. Unità: numero Statistiche valide: Average, Sum |
ExecutionSucceeded |
Il numero di esecuzioni di pipeline che hanno avuto esito positivo. Unità: numero Statistiche valide: Average, Sum |
ExecutionStopped |
Il numero di esecuzioni di pipeline arrestate. Unità: numero Statistiche valide: Average, Sum |
ExecutionDuration |
La durata in millisecondi dell'esecuzione della pipeline. Unità: millisecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
Dimensioni dei parametri di esecuzione per pipeline
Dimensione | Descrizione |
---|---|
PipelineName |
Filtra i parametri di esecuzione di pipeline per una pipeline specificata. |
Parametri della fase di pipeline
Lo spazio dei nomi AWS/Sagemaker/ModelBuildingPipeline
include i seguenti parametri per le fasi di pipeline.
I parametri sono disponibili a una frequenza di 1 minuto.
Parametro | Descrizione |
---|---|
StepStarted |
Il numero di fasi di esecuzione del flusso avviate. Unità: numero Statistiche valide: Average, Sum |
StepFailed |
Il numero di fasi non riuscite. Unità: numero Statistiche valide: Average, Sum |
StepSucceeded |
Il numero di fasi che hanno avuto esito positivo. Unità: numero Statistiche valide: Average, Sum |
StepStopped |
Il numero di fasi arrestate. Unità: numero Statistiche valide: Average, Sum |
StepDuration |
La durata in millisecondi dell'esecuzione della fase. Unità: millisecondi Statistiche valide: media, somma, minimo, massimo, numero di esempi |
Dimensioni per i parametri delle fasi di pipeline
Dimensione | Descrizione |
---|---|
PipelineName , StepName |
Filtra i parametri delle fasi per una pipeline e una fase specificate. |