Metriche per il monitoraggio di Amazon SageMaker con Amazon CloudWatch - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Metriche per il monitoraggio di Amazon SageMaker con Amazon CloudWatch

Puoi monitorare Amazon SageMaker utilizzando Amazon CloudWatch, che raccoglie dati grezzi e li elabora in metriche leggibili quasi in tempo reale. Queste statistiche vengono conservate per 15 mesi. Con loro, puoi accedere alle informazioni storiche e avere una prospettiva migliore sulle prestazioni della tua applicazione o del tuo servizio web. Tuttavia, la CloudWatch console Amazon limita la ricerca alle metriche aggiornate nelle ultime 2 settimane. Questa limitazione consente di visualizzare nello spazio dei nomi i processi più aggiornati.

Per rappresentare graficamente i parametri senza utilizzare una ricerca, specifica il nome esatto nella visualizzazione di origine. È anche possibile impostare allarmi che controllano determinate soglie e inviare notifiche o intraprendere azioni quando queste soglie vengono raggiunte. Per ulteriori informazioni, consulta la Amazon CloudWatch User Guide.

SageMaker metriche di invocazione degli endpoint

Il AWS/SageMaker namespace include le seguenti metriche di richiesta provenienti da chiamate a. InvokeEndpoint

I parametri sono disponibili a una frequenza di 1 minuto.

L'illustrazione seguente mostra come un SageMaker endpoint interagisce con Amazon Runtime. SageMaker API Il tempo complessivo tra l'invio di una richiesta a un endpoint e la ricezione di una risposta dipende dai seguenti tre componenti.

  • Latenza di rete: il tempo che intercorre tra l'invio di una richiesta e la ricezione di una risposta dal Runtime Runtime. SageMaker API

  • Latenza di sovraccarico: il tempo necessario per trasportare una richiesta al container del modello e riportare la risposta al Runtime Runtime. SageMaker API

  • Latenza del modello: il tempo impiegato dal container del modello per elaborare la richiesta e restituire una risposta.

Un'illustrazione che mostra che la latenza totale è la somma delle latenze di rete, del sovraccarico e del modello.

Per ulteriori informazioni sulla latenza totale, consulta Best practice for load testing degli endpoint di inferenza SageMaker in tempo reale di Amazon. Per informazioni sulla durata di conservazione CloudWatch delle metriche, consulta Amazon GetMetricStatistics CloudWatch APIReference.

Parametri di invocazione dell'endpoint

Parametro Descrizione
ConcurrentRequestsPerCopy

Il numero di richieste simultanee ricevute dal componente di inferenza, normalizzato da ogni copia di un componente di inferenza.

Statistiche valide: Min, Max

ConcurrentRequestsPerModel

Il numero di richieste simultanee ricevute dal modello.

Statistiche valide: Min, Max

Invocation4XXErrors

Il numero di InvokeEndpoint richieste in cui il modello ha restituito un codice di HTTP risposta 4xx. Per ogni risposta 4xx, viene inviato 1; altrimenti, viene inviato 0.

Unità: nessuna

Statistiche valide: Average, Sum

Invocation5XXErrors

Il numero di InvokeEndpoint richieste in cui il modello ha restituito un codice di HTTP risposta 5xx. Per ogni risposta 5xx, viene inviato 1; altrimenti, viene inviato 0.

Unità: nessuna

Statistiche valide: Average, Sum

InvocationModelErrors

Il numero di richieste di invocazione del modello che non hanno prodotto una risposta 2XX. HTTP Ciò include codici di stato 4XX/5XX, errori di socket di basso livello, risposte non corrette e timeout delle richieste. HTTP Per ogni risposta di errore, viene inviato 1; altrimenti, viene inviato 0.

Unità: nessuna

Statistiche valide: Average, Sum

Invocations

Il numero delle richieste InvokeEndpoint inviate a un endpoint di un modello.

Per ottenere il numero totale di richieste inviate a un endpoint di un modello, utilizza la statistica Sum.

Unità: nessuna

Statistiche valide: somma

InvocationsPerCopy

Il numero di invocazioni normalizzate da ogni copia di un componente di inferenza.

Statistiche valide: somma

InvocationsPerInstance

Il numero di chiamate inviate a un modello, normalizzato da InstanceCount in each ProductionVariant. 1/ numberOfInstances viene inviato come valore per ogni richiesta. numberOfInstancesè il numero di istanze attive per l'endpoint ProductionVariant dietro l'endpoint al momento della richiesta.

Unità: nessuna

Statistiche valide: somma

ModelLatency

L'intervallo di tempo impiegato da un modello per rispondere a una SageMaker richiesta di Runtime. API Questo intervallo include i tempi di comunicazione locali necessari per inviare la richiesta e recuperare la risposta dal contenitore del modello. Include anche il tempo impiegato per completare l'inferenza nel contenitore.

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

ModelSetupTime

Il tempo necessario per lanciare nuove risorse di calcolo per un endpoint serverless. Il tempo può variare a seconda delle dimensioni del modello, del tempo necessario per scaricare il modello e dal tempo di avvio del container.

Unità: microsecondi

Statistiche valide: media, minimo, massimo, numero di esempi, percentili

OverheadLatency

L'intervallo di tempo aggiunto al tempo impiegato per rispondere a una richiesta del cliente in base SageMaker alle spese generali. Questo intervallo viene misurato dal momento in cui SageMaker riceve la richiesta fino a quando questa restituisce una risposta al client, meno il. ModelLatency La latenza degli overhead può variare a seconda di diversi fattori, tra cui dimensioni di payload di richiesta e risposta, la frequenza delle richieste e l'autenticazione/autorizzazione della richiesta.

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

Dimensioni dei parametri di invocazione dell'endpoint

Dimensione Descrizione
EndpointName, VariantName

Filtra i parametri di invocazione dell'endpoint per il valore ProductionVariant dell'endpoint e della variante specificati.

InferenceComponentName

Filtra le metriche di invocazione dei componenti di inferenza.

SageMaker metriche dei componenti di inferenza

Lo spazio dei /aws/sagemaker/InferenceComponents nomi include le seguenti metriche relative alle chiamate agli endpoint che ospitano componenti InvokeEndpointdi inferenza.

I parametri sono disponibili a una frequenza di 1 minuto.

Parametro Descrizione
CPUUtilizationNormalized

Il valore della CPUUtilizationNormalized metrica riportata da ogni copia del componente di inferenza. Il valore è compreso tra 0% e 100%. Se imposti il NumberOfCpuCoresRequired parametro nelle impostazioni per la copia del componente di inferenza, la metrica presenta l'utilizzo rispetto alla prenotazione. Altrimenti, la metrica presenta l'utilizzo oltre il limite.

GPUMemoryUtilizationNormalized

Il valore della GPUMemoryUtilizationNormalized metrica riportata da ogni copia del componente di inferenza.

GPUUtilizationNormalized

Il valore della GPUUtilizationNormalized metrica riportata da ogni copia del componente di inferenza. Se imposti il NumberOfAcceleratorDevicesRequired parametro nelle impostazioni per la copia del componente di inferenza, la metrica presenta l'utilizzo rispetto alla prenotazione. Altrimenti, la metrica presenta l'utilizzo oltre il limite.

MemoryUtilizationNormalized

Il valore MemoryUtilizationNormalized riportato da ogni copia del componente di inferenza. Se imposti il MinMemoryRequiredInMb parametro nelle impostazioni per la copia del componente di inferenza, le metriche presentano l'utilizzo rispetto alla prenotazione. Altrimenti, le metriche indicano l'utilizzo oltre il limite.

Dimensioni per le metriche dei componenti di inferenza

Dimensione Descrizione
InferenceComponentName

Filtra le metriche dei componenti di inferenza.

SageMaker metriche degli endpoint multimodello

Il AWS/SageMaker namespace include il seguente modello di caricamento delle metriche dalle chiamate a. InvokeEndpoint

I parametri sono disponibili a una frequenza di 1 minuto.

Per informazioni sulla durata di conservazione CloudWatch delle metriche, consulta Amazon GetMetricStatistics CloudWatch APIReference.

Parametri di caricamento del modello di endpoint multi-modello

Parametro Descrizione
ModelLoadingWaitTime

L'intervallo di tempo in cui una richiesta di chiamata ha atteso prima che il modello di destinazione venga scaricato, caricato o entrambi per eseguire l'inferenza.

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

ModelUnloadingTime

L'intervallo di tempo impiegato per scaricare il modello tramite la chiamata del contenitore. UnloadModel API

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

ModelDownloadingTime

L'intervallo di tempo impiegato per scaricare il modello da Amazon Simple Storage Service (Amazon S3).

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

ModelLoadingTime

L'intervallo di tempo impiegato per caricare il modello tramite la chiamata del contenitore. LoadModel API

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

ModelCacheHit

Numero di richieste InvokeEndpoint inviate all'endpoint a più modelli per cui il modello è già stato caricato.

La statistica media mostra il rapporto tra richieste per le quali il modello è già stato caricato.

Unità: nessuna

Statistiche valide: media, somma, numero di esempi

Dimensioni per i parametri di caricamento del modello endpoint a più modelli

Dimensione Descrizione
EndpointName, VariantName

Filtra i parametri di invocazione dell'endpoint per il valore ProductionVariant dell'endpoint e della variante specificati.

I /aws/sagemaker/Endpoints namespace includono le seguenti metriche di istanza relative alle chiamate a. InvokeEndpoint

I parametri sono disponibili a una frequenza di 1 minuto.

Per informazioni sulla durata di conservazione CloudWatch delle metriche, consulta Amazon GetMetricStatistics CloudWatch APIReference.

Parametri dell'istanza del modello endpoint a più modelli

Parametro Descrizione
LoadedModelCount

Numero di modelli caricati nei container dell'endpoint a più modelli. Questo parametro viene emesso per istanza.

La statistica media con un periodo di 1 minuto indica il numero medio di modelli caricati per istanza.

La statistica somma indica il numero totale di modelli caricati in tutte le istanze dell'endpoint.

I modelli tracciati da questo parametro non sono necessariamente univoci perché un modello potrebbe essere caricato in più container dell'endpoint.

Unità: nessuna

Statistiche valide: media, somma, minimo, massimo, numero di esempi

Dimensioni per i parametri di caricamento del modello endpoint a più modelli

Dimensione Descrizione
EndpointName, VariantName

Filtra i parametri di invocazione dell'endpoint per il valore ProductionVariant dell'endpoint e della variante specificati.

SageMaker metriche relative ai lavori e agli endpoint

I /aws/sagemaker/Endpoints namespace /aws/sagemaker/ProcessingJobs/aws/sagemaker/TrainingJobs,/aws/sagemaker/TransformJobs, e includono le seguenti metriche per i job di formazione e le istanze degli endpoint.

I parametri sono disponibili a una frequenza di 1 minuto.

Nota

Amazon CloudWatch supporta metriche personalizzate ad alta risoluzione e la sua risoluzione massima è di 1 secondo. Tuttavia, maggiore è la risoluzione, minore è la durata delle metriche. CloudWatch Per la risoluzione di frequenza di 1 secondo, le CloudWatch metriche sono disponibili per 3 ore. Per ulteriori informazioni sulla risoluzione e sulla durata delle CloudWatch metriche, consulta Amazon GetMetricStatisticsReference. CloudWatch API

Suggerimento

Per profilare il tuo lavoro di formazione con una risoluzione più precisa con una granularità fino a 100 millisecondi (0,1 secondi) e archiviare i parametri di formazione a tempo indeterminato in Amazon S3 per analisi personalizzate in qualsiasi momento, prendi in considerazione l'utilizzo di Amazon Debugger. SageMaker SageMaker Debugger fornisce regole integrate per rilevare automaticamente i problemi di formazione più comuni. Rileva i problemi di utilizzo delle risorse hardware (ad esempioCPU, GPU e i colli di bottiglia di I/O). Rileva inoltre problemi non convergenti del modello (ad esempio sovradimensionamento, gradienti spariti e tensori esplosivi). SageMaker Debugger fornisce anche visualizzazioni tramite Studio Classic e il relativo rapporto di profilazione. Per esplorare le visualizzazioni del Debugger, consulta Debugger Insights Dashboard Walkthrough, SageMaker Debugger Profiling Report Walkthrough e Analyze Data Using the Client Library. SMDebug

Processi di elaborazione, processi di addestramento, processi di trasformazione in batch e parametri di istanza endpoint

Parametro Descrizione
CPUReservation

La CPUs somma dei contenitori riservati per istanza. Il valore è compreso tra 0% e 100%. Nelle impostazioni di un componente di inferenza, si imposta la CPU prenotazione con il NumberOfCpuCoresRequired parametro. Ad esempio, se 4 e 2 sono riservatiCPUs, la CPUReservation metrica è del 50%.

CPUUtilization La somma dell'utilizzo di ogni singolo CPU core. L'CPUutilizzo di ogni intervallo di core è compreso tra 0 e 100. Ad esempio, se ce ne sono quattroCPUs, l'CPUUtilizationintervallo è compreso tra 0% e 400%. Per i processi di elaborazione, il valore è l'CPUutilizzo del contenitore di elaborazione sull'istanza.

Per i lavori di formazione, il valore è l'CPUutilizzo del contenitore dell'algoritmo sull'istanza.

Per i lavori di trasformazione in batch, il valore è l'CPUutilizzo del contenitore di trasformazione sull'istanza.

Per le varianti di endpoint, il valore è la somma dell'CPUutilizzo dei contenitori primari e supplementari sull'istanza.

Nota

Per i lavori a più istanze, ogni istanza riporta le metriche di utilizzo. CPU Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'CPUutilizzo medio in tutte le istanze.

Unità: percentuale

CPUUtilizationNormalized

La somma normalizzata dell'utilizzo di ogni singolo core. CPU Il valore è compreso tra 0% e 100%. Ad esempio, se ce ne sono quattro CPUs e la CPUUtilization metrica è 200%, la CPUUtilizationNormalized metrica è 50%.

DiskUtilization

Percentuale di spazio su disco utilizzata dai container su un'istanza. Questo intervallo di valori è compreso tra 0% e 100%. Questo parametro non è supportato per i processi di trasformazione in batch.

Per le attività di elaborazione, il valore è l'utilizzo dello spazio su disco del container di elaborazione nell'istanza.

Per i processi di addestramento, il valore corrisponde all'utilizzo dello spazio su disco del container di algoritmi sull'istanza.

Per le varianti dell'endpoint, il valore è la somma dell'utilizzo dello spazio su disco dei container principali e supplementari sull'istanza.

Unità: percentuale

Nota

In caso di processi multi-istanza, ogni istanza riferisce i parametri di utilizzo del disco. Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio del disco in tutte le istanze.

GPUMemoryUtilization

La percentuale di GPU memoria utilizzata dai contenitori su un'istanza. L'intervallo di valori è compreso tra 0 e 100 e viene moltiplicato per il numero di. GPUs Ad esempio, se ce ne sono quattroGPUs, l'GPUMemoryUtilizationintervallo è compreso tra 0% e 400%.

Per i processi di elaborazione, il valore è l'utilizzo della GPU memoria del contenitore di elaborazione sull'istanza.

Per i processi di formazione, il valore è l'utilizzo della GPU memoria del contenitore dell'algoritmo sull'istanza.

Per i processi di trasformazione in batch, il valore è l'utilizzo della GPU memoria del contenitore di trasformazione sull'istanza.

Per le varianti degli endpoint, il valore è la somma dell'utilizzo della GPU memoria dei contenitori primari e supplementari sull'istanza.

Nota

Per i lavori a più istanze, ogni istanza riporta GPU le metriche di utilizzo della memoria. Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio della GPU memoria in tutte le istanze.

Unità: percentuale

GPUMemoryUtilizationNormalized

La percentuale normalizzata di GPU memoria utilizzata dai contenitori su un'istanza. Il valore è compreso tra 0% e 100%. Ad esempio, se ce ne sono quattro GPUs e la GPUMemoryUtilization metrica è 200%, la GPUMemoryUtilizationNormalized metrica è 50%.

GPUReservation

La somma dei dati GPUs riservati per container su un'istanza. Il valore è compreso tra 0% e 100%. Nelle impostazioni per un componente di inferenza, si imposta la GPU prenotazione perNumberOfAcceleratorDevicesRequired. Ad esempio, se ce ne sono 4 GPUs e 2 sono riservati, la GPUReservation metrica è del 50%.

GPUUtilization

La percentuale di GPU unità utilizzate dai contenitori su un'istanza. Il valore può essere compreso tra 0 e 100 e viene moltiplicato per il numero di. GPUs Ad esempio, se ce ne sono quattroGPUs, l'GPUUtilizationintervallo è compreso tra 0% e 400%.

Per i processi di elaborazione, il valore è l'GPUutilizzo del contenitore di elaborazione sull'istanza.

Per i lavori di formazione, il valore è l'GPUutilizzo del contenitore dell'algoritmo sull'istanza.

Per i lavori di trasformazione in batch, il valore è l'GPUutilizzo del contenitore di trasformazione sull'istanza.

Per le varianti di endpoint, il valore è la somma dell'GPUutilizzo dei contenitori primari e supplementari sull'istanza.

Nota

Per i lavori a più istanze, ogni istanza riporta le metriche di utilizzo. GPU Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'GPUutilizzo medio in tutte le istanze.

Unità: percentuale

GPUUtilizationNormalized

La percentuale normalizzata di GPU unità utilizzate dai contenitori su un'istanza. Il valore è compreso tra 0% e 100%. Ad esempio, se ce ne sono quattro GPUs e la GPUUtilization metrica è 200%, la GPUUtilizationNormalized metrica è 50%.

MemoryReservation

La somma della memoria riservata dai contenitori su un'istanza. Il valore è compreso tra 0% e 100%. Nelle impostazioni di un componente di inferenza, si imposta la prenotazione della memoria con il MinMemoryRequiredInMb parametro. Ad esempio, se un'istanza da 32 GiB è riservata a 1024 MB, la MemoryReservation metrica è del 29,8%.

MemoryUtilization

Percentuale di memoria utilizzata dai container su un'istanza. Questo intervallo di valori è compreso tra 0% e 100%.

Per le attività di elaborazione, il valore è l'utilizzo della memoria del container di elaborazione nell'istanza.

Per i processi di addestramento, il valore corrisponde all'utilizzo della memoria del container di algoritmi sull'istanza.

Per i processi di trasformazione in batch, il valore corrisponde all'utilizzo della memoria del container di trasformazione sull'istanza.

Per le varianti dell'endpoint, il valore è la somma dell'utilizzo di memoria dei container principali e supplementari sull'istanza.

Unità: percentuale

Nota

In caso di processi multi-istanza, ogni istanza riferisce i parametri di utilizzo della memoria. Tuttavia, la visualizzazione predefinita in CloudWatch mostra l'utilizzo medio della memoria in tutte le istanze.

Dimensioni del processo di elaborazione, processo di addestramento e parametri delle istanze processo di trasformazione in batch

Dimensione Descrizione
Host

Per le attività di elaborazione, il valore di questa dimensione ha il formato [processing-job-name]/algo-[instance-number-in-cluster]. Utilizza questa dimensione per filtrare i parametri di istanza per l'attività di elaborazione e l'istanza specificate. Questo formato di dimensione è presente solo nello spazio dei nomi /aws/sagemaker/ProcessingJobs.

Per i processi di addestramento, il valore di questa dimensione ha il formato [training-job-name]/algo-[instance-number-in-cluster]. Utilizza questa dimensione per filtrare i parametri di istanza per i processi di addestramento e l'istanza specificati. Questo formato di dimensione è presente solo nello spazio dei nomi /aws/sagemaker/TrainingJobs.

Per i processi di trasformazione in batch, il valore di questa dimensione ha il formato [transform-job-name]/[instance-id]. Utilizza questa dimensione per filtrare i parametri dell'istanza per il processo di trasformazione in batch e l'istanza specificati. Questo formato di dimensione è presente solo nello spazio dei nomi /aws/sagemaker/TransformJobs.

SageMaker Metriche dei lavori di Inference Recommender

Lo spazio dei nomi /aws/sagemaker/InferenceRecommendationsJobs include i seguenti parametri per i processi di raccomandazione dell'inference.

Parametri del Suggeritore di inferenza

Parametro Descrizione
ClientInvocations

Il numero di richieste InvokeEndpoint inviate a un endpoint del modello, come osservato dal Suggeritore di inferenza.

Unità: nessuna

Statistiche valide: somma

ClientInvocationErrors

Il numero di richieste InvokeEndpoint non riuscite, come osservato dal Suggeritore di inferenza.

Unità: nessuna

Statistiche valide: somma

ClientLatency

L'intervallo di tempo impiegato tra l'invio di una chiamata InvokeEndpoint e la ricezione di una risposta, come osservato dal Suggeritore di inferenza. Nota che il tempo è in millisecondi, mentre il parametro di invocazione dell'endpoint ModelLatency è in microsecondi.

Unità: millisecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi, percentili

NumberOfUsers

Il numero di utenti simultanei che inviano richieste InvokeEndpoint all'endpoint del modello.

Unità: nessuna

Statistiche valide: massimo, minimo, medio

Dimensioni dei parametri per i processi del Suggeritore di inferenza

Dimensione Descrizione
JobName

Filtra i parametri del processo del Suggeritore di inferenza per il processo del Suggeritore di inferenza specificato.

EndpointName

Filtra i parametri del processo del Suggeritore di inferenza per l’endpoint specificato.

SageMaker Metriche di Ground Truth

Parametri di Ground Truth

Parametro Descrizione
ActiveWorkers

Un singolo worker attivo in un team di lavoro privato ha inviato, rilasciato o rifiutato un'attività. Per ottenere il numero totale di worker attivi, utilizza la statistica Sum (Somma). Ground Truth cerca di fornire ogni singolo ActiveWorkers evento una volta. Se questa consegna non ha esito positivo, questa metrica potrebbe non riportare il numero totale di lavoratori attivi.

Unità: nessuna

Statistiche valide: Sum, Sample Count

DatasetObjectsAutoAnnotated

Il numero di oggetti del set di dati annotati automaticamente in un processo di etichettatura. Questo parametro viene emesso solo quando è abilitata l'etichettatura automatizzata. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max.

Unità: nessuna

Statistiche valide: Max

DatasetObjectsHumanAnnotated

Il numero di oggetti del set di dati annotati da persone in un processo di etichettatura. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max.

Unità: nessuna

Statistiche valide: Max

DatasetObjectsLabelingFailed

Il numero di oggetti del set di dati in cui si è verificato un errore di etichettatura in un processo di etichettatura. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max.

Unità: nessuna

Statistiche valide: Max

JobsFailed

Un singolo processo di etichettatura non è riuscito. Per ottenere il numero totale di processi di etichettatura non riusciti, utilizza la statistica Sum.

Unità: nessuna

Statistiche valide: Sum, Sample Count

JobsSucceeded

Un singolo processo di etichettatura è riuscito. Per ottenere il numero totale di processi di etichettatura riusciti, utilizza la statistica Sum.

Unità: nessuna

Statistiche valide: Sum, Sample Count

JobsStopped

Un singolo processo di etichettatura è stato interrotto. Per ottenere il numero totale di processi di etichettatura interrotti, utilizza la statistica Sum.

Unità: nessuna

Statistiche valide: Sum, Sample Count

TasksAccepted

Un singolo compito è stato accettato da un worker. Per ottenere il numero totale di attività accettate dai worker, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento TaskAccepted una volta. Se questa consegna non ha esito positivo, questo parametro potrebbe non riportare il numero totale di attività accettate.

Unità: nessuna

Statistiche valide: Sum, Sample Count

TasksDeclined

Un singolo compito è stato rifiutato da un worker. Per ottenere il numero totale di attività rifiutate dai worker, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento TasksDeclined una volta. Se questa consegna non ha esito positivo, questo parametro potrebbe non riportare il numero totale di attività rifiutate.

Unità: nessuna

Statistiche valide: Sum, Sample Count

TasksReturned

È stata restituita una singola attività. Per ottenere il numero totale di attività restituite, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento TasksReturned una volta. Se questa consegna non ha esito positivo, questo parametro potrebbe non riportare il numero totale di attività restituite.

Unità: nessuna

Statistiche valide: Sum, Sample Count

TasksSubmitted

Una singola attività è stata inviata/completata da un worker privato. Per ottenere il numero totale di attività inviate dai worker, utilizza la statistica Sum (Somma). Ground Truth tenta di fornire ogni singolo evento TasksSubmitted una volta. Se questa consegna non ha esito positivo, questo parametro potrebbe non riportare il numero totale di attività inviate.

Unità: nessuna

Statistiche valide: Sum, Sample Count

TimeSpent

Tempo trascorso su un'attività completata da un worker privato. Questo parametro non include il tempo in cui un worker si è fermato o si è preso una pausa. Ground Truth tenta di fornire ogni evento TimeSpent una volta. Se questa consegna non ha esito positivo, questo parametro potrebbe non riportare il totale di tempo impiegato.

Unità: secondi

Statistiche valide: Sum, Sample Count

TotalDatasetObjectsLabeled

Il numero di oggetti del set di dati completati correttamente in un processo di etichettatura. Per visualizzare l'avanzamento del processo di etichettatura, utilizza il parametro Max.

Unità: nessuna

Statistiche valide: Max

Dimensioni per i parametri degli oggetti del set di dati

Dimensione Descrizione
LabelingJobName

Filtra i parametri per il conteggio degli oggetti del set di dati per un processo di etichettatura.

Metriche SageMaker di Amazon Feature Store

Parametri di utilizzo dell'archivio funzionalità

Parametro Descrizione
ConsumedReadRequestsUnits

Il numero di unità di lettura consumate nel periodo di tempo specificato. È possibile recuperare le unità di lettura consumate da un'operazione di runtime dell'archivio funzionalità e il relativo gruppo di funzionalità corrispondente.

Unità: nessuna

Statistiche valide: tutte

ConsumedWriteRequestsUnits

Il numero di unità di scrittura consumate nel periodo di tempo specificato. È possibile recuperare le unità di scrittura consumate da un'operazione di runtime dell'archivio funzionalità e il relativo gruppo di funzionalità corrispondente.

Unità: nessuna

Statistiche valide: tutte

ConsumedReadCapacityUnits

Il numero di unità di capacità di lettura assegnate consumate nel periodo di tempo specificato. È possibile recuperare le unità di capacità di lettura consumate per un'operazione di runtime del feature store e il relativo gruppo di funzionalità corrispondente.

Unità: nessuna

Statistiche valide: tutte

ConsumedWriteCapacityUnits

Il numero di unità di capacità di scrittura assegnate utilizzate nel periodo di tempo specificato. È possibile recuperare le unità di capacità di scrittura consumate per un'operazione di runtime del feature store e il relativo gruppo di funzionalità corrispondente.

Unità: nessuna

Statistiche valide: tutte

Dimensioni dei parametri di utilizzo dell'archivio funzionalità

Dimensione Descrizione
FeatureGroupName, OperationName

Filtra i parametri di utilizzo del runtime dell'archivio funzionalità del gruppo di funzionalità e dell'operazione che hai specificato.

Parametri operativi dell'archivio funzionalità

Parametro Descrizione
Invocations

Il numero di richieste effettuate alle operazioni di runtime dell'archivio funzionalità nel periodo di tempo specificato.

Unità: nessuna

Statistiche valide: somma

Operation4XXErrors

Il numero di richieste effettuate alle operazioni di runtime del Feature Store in cui l'operazione ha restituito un codice di HTTP risposta 4xx. Per ogni risposta 4xx, viene inviata 1; in caso contrario, viene inviato 0.

Unità: nessuna

Statistiche valide: Average, Sum

Operation5XXErrors

Il numero di richieste effettuate alle operazioni di runtime del feature store in cui l'operazione ha restituito un codice di HTTP risposta 5xx. Per ogni risposta 5xx, viene inviata 1; in caso contrario, viene inviato 0.

Unità: nessuna

Statistiche valide: Average, Sum

ThrottledRequests

Il numero di richieste effettuate alle operazioni di runtime dell'archivio funzionalità in cui la richiesta è stata limitata. Per ogni richiesta limitata, viene inviata 1; in caso contrario, viene inviato 0.

Unità: nessuna

Statistiche valide: Average, Sum

Latency

L'intervallo di tempo per l'elaborazione delle richieste effettuate alle operazioni di runtime dell'archivio funzionalità. Questo intervallo viene misurato dal momento in cui SageMaker riceve la richiesta fino a quando non restituisce una risposta al client.

Unità: microsecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi, percentili

Dimensioni dei parametri operativi dell'archivio funzionalità

Dimensione Descrizione

FeatureGroupName, OperationName

Filtra i parametri operativi del runtime dell'archivio funzionalità del gruppo di funzionalità e dell'operazione che hai specificato. È possibile utilizzare queste dimensioni per operazioni non batch, ad esempio GetRecord PutRecord, e DeleteRecord.
OperationName

Filtra i parametri operativi del runtime dell'archivio funzionalità dell'operazione che hai specificato. È possibile utilizzare questa dimensione per operazioni batch come BatchGetRecord.

SageMaker metriche delle pipeline

Lo spazio dei nomi AWS/Sagemaker/ModelBuildingPipeline include i seguenti parametri per le esecuzioni di pipeline.

Sono disponibili due categorie di parametri di esecuzione di Pipeline:

  • Parametri di esecuzione su tutte le Pipeline: parametri di esecuzione di pipeline a livello di account (per tutte le pipeline dell'account corrente)

  • Parametri di esecuzione per pipeline: parametri di esecuzione di pipeline per pipeline

I parametri sono disponibili a una frequenza di 1 minuto.

Parametri di esecuzione di pipeline

Parametro Descrizione
ExecutionStarted

Il numero di esecuzioni di pipeline avviate.

Unità: numero

Statistiche valide: Average, Sum

ExecutionFailed

Il numero di esecuzioni di pipeline non riuscite.

Unità: numero

Statistiche valide: Average, Sum

ExecutionSucceeded

Il numero di esecuzioni di pipeline che hanno avuto esito positivo.

Unità: numero

Statistiche valide: Average, Sum

ExecutionStopped

Il numero di esecuzioni di pipeline arrestate.

Unità: numero

Statistiche valide: Average, Sum

ExecutionDuration

La durata in millisecondi dell'esecuzione della pipeline.

Unità: millisecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

Dimensioni dei parametri di esecuzione per pipeline

Dimensione Descrizione
PipelineName

Filtra i parametri di esecuzione di pipeline per una pipeline specificata.

Parametri della fase di pipeline

Lo spazio dei nomi AWS/Sagemaker/ModelBuildingPipeline include i seguenti parametri per le fasi di pipeline.

I parametri sono disponibili a una frequenza di 1 minuto.

Parametro Descrizione
StepStarted

Il numero di fasi di esecuzione del flusso avviate.

Unità: numero

Statistiche valide: Average, Sum

StepFailed

Il numero di fasi non riuscite.

Unità: numero

Statistiche valide: Average, Sum

StepSucceeded

Il numero di fasi che hanno avuto esito positivo.

Unità: numero

Statistiche valide: Average, Sum

StepStopped

Il numero di fasi arrestate.

Unità: numero

Statistiche valide: Average, Sum

StepDuration

La durata in millisecondi dell'esecuzione della fase.

Unità: millisecondi

Statistiche valide: media, somma, minimo, massimo, numero di esempi

Dimensioni per i parametri delle fasi di pipeline

Dimensione Descrizione
PipelineName, StepName

Filtra i parametri delle fasi per una pipeline e una fase specificate.