Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Dopo aver abilitato il checkpoint, l' SageMaker intelligenza artificiale salva i checkpoint su Amazon S3 e sincronizza il processo di formazione con il bucket checkpoint S3. Puoi utilizzare i bucket di directory S3 generici o i bucket di directory S3 per il tuo bucket S3 checkpoint.

L'esempio seguente mostra come configurare i percorsi dei checkpoint quando si costruisce uno stimatore AI. SageMaker Per abilitare il checkpoint, aggiungi i parametri checkpoint_s3_uri
e checkpoint_local_path
allo strumento di valutazione.
Il seguente modello di esempio mostra come creare uno stimatore SageMaker AI generico e abilitare il checkpoint. È possibile utilizzare questo modello per gli algoritmi supportati specificando il parametro image_uri
. Per trovare l'immagine Docker URIs per gli algoritmi con checkpoint supportato dall' SageMaker intelligenza artificiale, vedi Docker Registry Paths and Example Code. Puoi anche sostituire estimator
e utilizzare le classi principali e Estimator
le classi estimator di altri framework di SageMaker intelligenza artificiale, come,, e. TensorFlow
PyTorch
MXNet
HuggingFace
XGBoost
import sagemaker
from sagemaker.estimator
import Estimator
bucket=sagemaker.Session().default_bucket()
base_job_name="sagemaker-checkpoint-test
"
checkpoint_in_bucket="checkpoints
"
# The S3 URI to store the checkpoints
checkpoint_s3_bucket="s3://{}/{}/{}".format(bucket, base_job_name, checkpoint_in_bucket)
# The local path where the model will save its checkpoints in the training container
checkpoint_local_path="/opt/ml/checkpoints"
estimator = Estimator
(
...
image_uri="<ecr_path>
/<algorithm-name>
:<tag>
" # Specify to use built-in algorithms
output_path=bucket,
base_job_name=base_job_name,
# Parameters required to enable checkpointing
checkpoint_s3_uri=checkpoint_s3_bucket,
checkpoint_local_path=checkpoint_local_path
)
I due parametri seguenti specificano i percorsi per il checkpoint:
-
checkpoint_local_path
— Specifica il percorso locale in cui il modello salva periodicamente i checkpoint in un container di addestramento. Il percorso predefinito è'/opt/ml/checkpoints'
. Se stai utilizzando altri framework o state utilizzando un container di addestramento personale, assicurati che la configurazione del checkpoint dello script di addestramento specifichi il percorso verso'/opt/ml/checkpoints'
.Nota
Ti consigliamo di specificare i percorsi locali in modo che siano coerenti con le impostazioni
'/opt/ml/checkpoints'
di checkpoint AI predefinite. SageMaker Se preferisci specificare il tuo percorso locale, assicurati di abbinare il percorso di salvataggio del checkpoint nello script di addestramento e ilcheckpoint_local_path
parametro degli stimatori AI. SageMaker -
checkpoint_s3_uri
— L'URI di un bucket S3 in cui i checkpoint sono memorizzati in tempo reale. Puoi specificare un bucket di directory S3 generico o un bucket di directory S3 per archiviare i checkpoint. Per ulteriori informazioni sui bucket di directory S3, consulta i bucket di directory nella Guida per l'utente di Amazon Simple Storage Service.
Per trovare un elenco completo dei parametri di stima SageMaker AI, consulta l'API Estimator nella documentazione