SageMaker 환경 변수 및 훈련 스토리지 위치의 기본 경로 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker 환경 변수 및 훈련 스토리지 위치의 기본 경로

다음 표에는 훈련 플랫폼에서 관리하는 SageMaker 훈련 데이터 세트, 체크포인트, 모델 아티팩트 및 출력의 입력 및 출력 경로가 요약되어 있습니다.

SageMaker 훈련 인스턴스의 로컬 경로 SageMaker 환경 변수 용도 시작 시 S3에서 읽기 스팟 재시작 시 S3에서 읽기 훈련 중 S3에 쓰기 작업 종료 시 S3에 쓰기

/opt/ml/input/data/channel_name1

SM_CHANNEL_CHANNEL_NAME

SageMaker Python SDK Estimator 클래스 또는 CreateTrainingJob API 작업을 통해 지정된 입력 채널에서 훈련 데이터 읽기. SageMaker Python 을 사용하여 훈련 스크립트에서 이를 지정하는 방법에 대한 자세한 내용은 훈련 스크립트 준비 단원을 SDK참조하세요.

아니요 아니요

/opt/ml/output/data2

SM_OUTPUT_DIR

손실, 정확도, 중간 계층, 가중치, 그라데이션, 바이어스 및 TensorBoard호환 출력과 같은 출력 저장. 이 경로를 사용하여 원하는 임의의 출력을 저장할 수도 있습니다. 이 경로는 최종 모델 아티팩트 /opt/ml/model/를 저장하는 경로와 다르다는 점에 유의하세요.

아니요 아니요 아니요

/opt/ml/model3

SM_MODEL_DIR

최종 모델 아티팩트를 저장하는 경로입니다. 이는 SageMaker 호스팅의 실시간 추론을 위해 모델 아티팩트가 배포되는 경로이기도 합니다.

아니요 아니요 아니요

/opt/ml/checkpoints4

-

모델 체크포인트(모델 상태)를 저장하여 특정 시점부터 훈련을 재개하고, 예상치 못한 중단 또는 관리형 스팟 훈련 중단으로부터 복구할 수 있는 경로입니다.

아니요

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

훈련 스크립트, 추가 라이브러리 및 종속성을 복사하는 경로입니다.

아니요 아니요

/tmp

-

스크래치 공간인 /tmp에 대해 읽기 또는 쓰기를 수행합니다.

아니요 아니요 아니요 아니요

1 channel_name은(는) 훈련 데이터 입력에 사용할 사용자 정의 채널 이름을 지정하는 곳입니다. 각 훈련 작업에는 여러 개의 데이터 입력 채널이 포함될 수 있습니다. 훈련 입력 채널은 훈련 작업당 최대 20개까지 지정할 수 있습니다. 데이터 채널에서 소요되는 데이터 다운로드 시간은 청구 가능 시간까지 계산됩니다. 데이터 입력 경로에 대한 자세한 내용은 Amazon SageMaker에서 훈련 정보를 제공하는 방법 단원을 참조하세요. 또한 에서 SageMaker 지원하는 세 가지 유형의 데이터 입력 모드는 파일 FastFile및 파이프 모드입니다. 에서 훈련을 위한 데이터 입력 모드에 대한 자세한 내용은 훈련 데이터 액세스를 SageMaker참조하세요.

2 SageMaker 훈련 아티팩트를 압축하여 TAR 파일에 작성합니다(tar.gz). 압축 및 업로드 시간은 청구 가능 시간으로 계산됩니다. 자세한 내용은 Amazon이 훈련 출력을 SageMaker 처리하는 방법을 참조하세요.

3 SageMaker 최종 모델 아티팩트를 압축하여 TAR 파일()에 기록합니다tar.gz. 압축 및 업로드 시간은 청구 가능 시간으로 계산됩니다. 자세한 내용은 Amazon이 훈련 출력을 SageMaker 처리하는 방법을 참조하세요.

4 훈련 기간 동안 Amazon S3와 동기화하세요. TAR 파일에 압축하지 않고 있는 그대로 씁니다. 자세한 내용은 Amazon 에서 체크포인트 사용을 참조하세요 SageMaker.