Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Abilita il checkpoint

Modalità Focus
Abilita il checkpoint - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Dopo aver abilitato il checkpoint, l' SageMaker intelligenza artificiale salva i checkpoint su Amazon S3 e sincronizza il processo di formazione con il bucket checkpoint S3. Puoi utilizzare i bucket di directory S3 generici o i bucket di directory S3 per il tuo bucket S3 checkpoint.

Diagramma architettonico della scrittura dei checkpoint durante l’addestramento.

L'esempio seguente mostra come configurare i percorsi dei checkpoint quando si costruisce uno stimatore AI. SageMaker Per abilitare il checkpoint, aggiungi i parametri checkpoint_s3_uri e checkpoint_local_path allo strumento di valutazione.

Il seguente modello di esempio mostra come creare uno stimatore SageMaker AI generico e abilitare il checkpoint. È possibile utilizzare questo modello per gli algoritmi supportati specificando il parametro image_uri. Per trovare l'immagine Docker URIs per gli algoritmi con checkpoint supportato dall' SageMaker intelligenza artificiale, vedi Docker Registry Paths and Example Code. Puoi anche sostituire estimator e utilizzare le classi principali e Estimator le classi estimator di altri framework di SageMaker intelligenza artificiale, come,, e. TensorFlow PyTorch MXNet HuggingFace XGBoost

import sagemaker from sagemaker.estimator import Estimator bucket=sagemaker.Session().default_bucket() base_job_name="sagemaker-checkpoint-test" checkpoint_in_bucket="checkpoints" # The S3 URI to store the checkpoints checkpoint_s3_bucket="s3://{}/{}/{}".format(bucket, base_job_name, checkpoint_in_bucket) # The local path where the model will save its checkpoints in the training container checkpoint_local_path="/opt/ml/checkpoints" estimator = Estimator( ... image_uri="<ecr_path>/<algorithm-name>:<tag>" # Specify to use built-in algorithms output_path=bucket, base_job_name=base_job_name, # Parameters required to enable checkpointing checkpoint_s3_uri=checkpoint_s3_bucket, checkpoint_local_path=checkpoint_local_path )

I due parametri seguenti specificano i percorsi per il checkpoint:

  • checkpoint_local_path— Specifica il percorso locale in cui il modello salva periodicamente i checkpoint in un container di addestramento. Il percorso predefinito è '/opt/ml/checkpoints'. Se stai utilizzando altri framework o state utilizzando un container di addestramento personale, assicurati che la configurazione del checkpoint dello script di addestramento specifichi il percorso verso '/opt/ml/checkpoints'.

    Nota

    Ti consigliamo di specificare i percorsi locali in modo che siano coerenti con le impostazioni '/opt/ml/checkpoints' di checkpoint AI predefinite. SageMaker Se preferisci specificare il tuo percorso locale, assicurati di abbinare il percorso di salvataggio del checkpoint nello script di addestramento e il checkpoint_local_path parametro degli stimatori AI. SageMaker

  • checkpoint_s3_uri— L'URI di un bucket S3 in cui i checkpoint sono memorizzati in tempo reale. Puoi specificare un bucket di directory S3 generico o un bucket di directory S3 per archiviare i checkpoint. Per ulteriori informazioni sui bucket di directory S3, consulta i bucket di directory nella Guida per l'utente di Amazon Simple Storage Service.

Per trovare un elenco completo dei parametri di stima SageMaker AI, consulta l'API Estimator nella documentazione di Amazon SageMaker Python SDK.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.