Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Definizione dei parametri di training

Modalità Focus
Definizione dei parametri di training - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker L'intelligenza artificiale analizza automaticamente i registri dei lavori di formazione e invia i parametri di formazione a. CloudWatch Per impostazione predefinita, l' SageMaker IA invia le metriche di utilizzo delle risorse di sistema elencate in SageMaker AI Jobs ed Endpoint Metrics. Se desideri che l' SageMaker IA analizzi i log e invii metriche personalizzate da un processo di formazione del tuo algoritmo a CloudWatch, devi specificare le definizioni delle metriche passando il nome delle metriche e delle espressioni regolari quando configuri una richiesta di lavoro di formazione sull'intelligenza artificiale. SageMaker

Puoi specificare le metriche che desideri monitorare utilizzando la console SageMaker AI, l'SDK SageMaker AI Python o l' SageMaker API AI di basso livello.

Se utilizzi il tuo algoritmo, procedi come riportato di seguito:

  • Assicurati che l'algoritmo scriva i parametri che devono essere acquisiti nei log.

  • Definisci un'espressione regolare che cerchi accuratamente nei log per acquisire i valori delle metriche a cui desideri inviare. CloudWatch

Ad esempio, supponi che l'algoritmo emetta i seguenti parametri per errore di addestramento ed errore di convalida:

Train_error=0.138318; Valid_error=0.324557;

Se desideri monitorare entrambe queste metriche CloudWatch, il dizionario per le definizioni delle metriche dovrebbe essere simile al seguente esempio:

[ { "Name": "train:error", "Regex": "Train_error=(.*?);" }, { "Name": "validation:error", "Regex": "Valid_error=(.*?);" } ]

Nell'espressione regolare per il parametro train:error definita in precedenza, la prima parte dell'espressione regolare trova il testo esatto "Train_error= " e l'espressione (.*?); acquisisce qualsiasi carattere fino al primo carattere punto e virgola. In questa espressione, la parentesi indicano alla regex di acquisire il loro contenuto, . significa qualsiasi carattere, * significa zero o più caratteri e ? significa acquisire solo fino alla prima istanza del carattere ;.

Definisci le metriche utilizzando l'SDK SageMaker AI Python

Definisci le metriche a cui desideri inviare CloudWatch specificando un elenco di nomi di metriche ed espressioni regolari come metric_definitions argomento quando inizializzi un oggetto. Estimator Ad esempio, se desideri monitorare sia le validation:error metriche che in CloudWatch, l'train:errorEstimatorinizializzazione sarà simile al seguente esempio:

import sagemaker from sagemaker.estimator import Estimator estimator = Estimator( image_uri="your-own-image-uri", role=sagemaker.get_execution_role(), sagemaker_session=sagemaker.Session(), instance_count=1, instance_type='ml.c4.xlarge', metric_definitions=[ {'Name': 'train:error', 'Regex': 'Train_error=(.*?);'}, {'Name': 'validation:error', 'Regex': 'Valid_error=(.*?);'} ] )

Per ulteriori informazioni sulla formazione utilizzando gli estimatori di Amazon SageMaker Python SDK, consulta Sagemaker Python SDK on. GitHub

SageMaker Definisci le metriche utilizzando la console AI

Se scegli l'opzione Il tuo contenitore di algoritmi in ECR come fonte dell'algoritmo nella console SageMaker AI quando crei un processo di formazione, aggiungi le definizioni delle metriche nella sezione Metriche. La schermata seguente mostra come dovrebbe funzionare dopo aver aggiunto i nomi dei parametri di esempio e le espressioni regolari corrispondenti.

Esempio di opzioni di algoritmo nella console.

Definisci le metriche utilizzando l'API AI di basso livello SageMaker

Definisci le metriche a cui desideri inviare CloudWatch specificando un elenco di nomi di metriche ed espressioni regolari nel MetricDefinitions campo del parametro di AlgorithmSpecificationinput che passi all'operazione. CreateTrainingJob Ad esempio, se desideri monitorare sia le train:error validation:error metriche che in CloudWatch, AlgorithmSpecification avresti un aspetto simile al seguente:

"AlgorithmSpecification": { "TrainingImage": your-own-image-uri, "TrainingInputMode": "File", "MetricDefinitions" : [ { "Name": "train:error", "Regex": "Train_error=(.*?);" }, { "Name": "validation:error", "Regex": "Valid_error=(.*?);" } ] }

Per ulteriori informazioni sulla definizione e l'esecuzione di un processo di formazione utilizzando l'API SageMaker AI di basso livello, consulta. CreateTrainingJob

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.