Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon CloudWatch Metrics per il monitoraggio e l'analisi dei lavori di formazione
Un lavoro di SageMaker formazione su Amazon è un processo iterativo che insegna a un modello a fare previsioni presentando esempi tratti da un set di dati di formazione. In genere, un algoritmo di addestramento calcola diversi parametri, ad esempio errore di addestramento e accuratezza della previsione. Questi parametri consentono di stabilire la capacità di apprendimento e di generalizzazione del modello per fare previsioni su dati non visualizzati. L'algoritmo di addestramento scrive i valori di queste metriche nei log, che li SageMaker monitorano e li inviano ad Amazon CloudWatch in tempo reale. Per analizzare le prestazioni del tuo lavoro di formazione, puoi visualizzare i grafici di queste metriche in. CloudWatch Al termine di un processo di addestramento, puoi anche ottenere un elenco dei valori dei parametri che vengono calcolati nell'iterazione finale chiamando l'operazione DescribeTrainingJob
.
Nota
Amazon CloudWatch supporta metriche personalizzate ad alta risoluzione e la sua risoluzione massima è di 1 secondo. Tuttavia, maggiore è la risoluzione, minore è la durata delle metriche. CloudWatch Per la risoluzione di frequenza di 1 secondo, le CloudWatch metriche sono disponibili per 3 ore. Per ulteriori informazioni sulla risoluzione e sulla durata delle CloudWatch metriche, consulta Amazon GetMetricStatisticsReference. CloudWatch API
Suggerimento
Se desideri profilare il tuo lavoro di formazione con una risoluzione più precisa con una granularità fino a 100 millisecondi (0,1 secondi) e archiviare i parametri di formazione a tempo indeterminato in Amazon S3 per analisi personalizzate in qualsiasi momento, prendi in considerazione l'utilizzo di Amazon Debugger. SageMaker SageMaker Debugger fornisce regole integrate per rilevare automaticamente i problemi di formazione più comuni; rileva i problemi di utilizzo delle risorse hardware (ad esempio CPUGPU, e i colli di bottiglia di I/O) e i problemi non convergenti dei modelli (come sovradimensionamento, gradienti spariti e tensori esplosivi). SageMaker Debugger fornisce anche visualizzazioni tramite Studio Classic e il relativo rapporto di profilazione. Per esplorare le visualizzazioni del Debugger, consulta Debugger Insights Dashboard Walkthrough, SageMaker Debugger Profiling Report Walkthrough e Analyze Data Using the Client Library. SMDebug