Amazon CloudWatch Metrics per il monitoraggio e l'analisi dei lavori di formazione - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon CloudWatch Metrics per il monitoraggio e l'analisi dei lavori di formazione

Un lavoro di SageMaker formazione su Amazon è un processo iterativo che insegna a un modello a fare previsioni presentando esempi tratti da un set di dati di formazione. In genere, un algoritmo di addestramento calcola diversi parametri, ad esempio errore di addestramento e accuratezza della previsione. Questi parametri consentono di stabilire la capacità di apprendimento e di generalizzazione del modello per fare previsioni su dati non visualizzati. L'algoritmo di addestramento scrive i valori di queste metriche nei log, che li SageMaker monitorano e li inviano ad Amazon CloudWatch in tempo reale. Per analizzare le prestazioni del tuo lavoro di formazione, puoi visualizzare i grafici di queste metriche in. CloudWatch Al termine di un processo di addestramento, puoi anche ottenere un elenco dei valori dei parametri che vengono calcolati nell'iterazione finale chiamando l'operazione DescribeTrainingJob.

Nota

Amazon CloudWatch supporta metriche personalizzate ad alta risoluzione e la sua risoluzione massima è di 1 secondo. Tuttavia, maggiore è la risoluzione, minore è la durata delle metriche. CloudWatch Per la risoluzione di frequenza di 1 secondo, le CloudWatch metriche sono disponibili per 3 ore. Per ulteriori informazioni sulla risoluzione e sulla durata delle CloudWatch metriche, consulta Amazon GetMetricStatisticsReference. CloudWatch API

Suggerimento

Se desideri profilare il tuo lavoro di formazione con una risoluzione più precisa con una granularità fino a 100 millisecondi (0,1 secondi) e archiviare i parametri di formazione a tempo indeterminato in Amazon S3 per analisi personalizzate in qualsiasi momento, prendi in considerazione l'utilizzo di Amazon Debugger. SageMaker SageMaker Debugger fornisce regole integrate per rilevare automaticamente i problemi di formazione più comuni; rileva i problemi di utilizzo delle risorse hardware (ad esempio CPUGPU, e i colli di bottiglia di I/O) e i problemi non convergenti dei modelli (come sovradimensionamento, gradienti spariti e tensori esplosivi). SageMaker Debugger fornisce anche visualizzazioni tramite Studio Classic e il relativo rapporto di profilazione. Per esplorare le visualizzazioni del Debugger, consulta Debugger Insights Dashboard Walkthrough, SageMaker Debugger Profiling Report Walkthrough e Analyze Data Using the Client Library. SMDebug