기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
체크포인트 지정 활성화
체크포인트를 활성화하면 SageMaker AI는 체크포인트를 Amazon S3에 저장하고 훈련 작업을 체크포인트 S3 버킷과 동기화합니다. 체크포인트 S3 버킷에 S3 범용 버킷 또는 S3 디렉터리 버킷을 사용할 수 있습니다.

다음 예제에서는 SageMaker AI 예측기를 구성할 때 체크포인트 경로를 구성하는 방법을 보여줍니다. 체크포인트 지정을 활성화하려면 checkpoint_s3_uri
파라미터 및 checkpoint_local_path
파라미터를 예측기에 추가하세요.
다음 예제 템플릿은 일반 SageMaker AI 예측기를 생성하고 체크포인트를 활성화하는 방법을 보여줍니다. image_uri
파라미터를 지정하면 이 템플릿을 지원 대상 알고리즘에 사용할 수 있습니다. SageMaker AI에서 지원하는 체크포인트가 있는 알고리즘에 대한 Docker 이미지 URIs를 찾으려면 Docker 레지스트리 경로 및 예제 코드를 참조하세요. 또한 estimator
및를 , , 및 Estimator
와 같은 다른 SageMaker AI 프레임워크의 예측기 상위 클래스 및 예측기 클래스로 교체할 수 TensorFlow
PyTorch
MXNet
HuggingFace
있습니다XGBoost
.
import sagemaker from sagemaker.
estimator
importEstimator
bucket=sagemaker.Session().default_bucket() base_job_name="sagemaker-checkpoint-test
" checkpoint_in_bucket="checkpoints
" # The S3 URI to store the checkpoints checkpoint_s3_bucket="s3://{}/{}/{}".format(bucket, base_job_name, checkpoint_in_bucket) # The local path where the model will save its checkpoints in the training container checkpoint_local_path="/opt/ml/checkpoints" estimator =Estimator
( ... image_uri="<ecr_path>
/<algorithm-name>
:<tag>
" # Specify to use built-in algorithms output_path=bucket, base_job_name=base_job_name, # Parameters required to enable checkpointing checkpoint_s3_uri=checkpoint_s3_bucket, checkpoint_local_path=checkpoint_local_path )
다음 2개 파라미터는 체크포인트 지정용 경로를 지정합니다.
-
checkpoint_local_path
– 모델이 훈련 컨테이너에서 체크포인트를 주기적으로 저장하는 로컬 경로를 지정합니다. 기본 경로는'/opt/ml/checkpoints'
(으)로 설정됩니다. 다른 프레임워크를 사용하거나 자체 훈련 컨테이너를 가져오려면 훈련 스크립트의 체크포인트 구성에서 경로가'/opt/ml/checkpoints'
(으)로 지정되어 있는지 확인하세요.참고
기본 SageMaker AI 체크포인트 설정과 일치하도록 로컬 경로를 로 지정하는
'/opt/ml/checkpoints'
것이 좋습니다. 자체 로컬 경로를 지정하려면 훈련 스크립트의 체크포인트 저장 경로와 SageMaker AI 예측기의checkpoint_local_path
파라미터가 일치해야 합니다. -
checkpoint_s3_uri
– 체크포인트가 실시간으로 저장되는 S3 버킷의 URI입니다. 체크포인트를 저장할 S3 범용 버킷 또는 S3 디렉터리 버킷을 지정할 수 있습니다. S3 디렉터리 버킷에 대한 자세한 내용은 Amazon Simple Storage Service 사용 설명서의 디렉터리 버킷을 참조하세요.
SageMaker AI 예측기 파라미터의 전체 목록을 찾으려면 Amazon SageMaker Python SDK