기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker 환경 변수 및 훈련 스토리지 위치의 기본 경로
다음 표에는 훈련 플랫폼에서 관리하는 SageMaker 훈련 데이터 세트, 체크포인트, 모델 아티팩트 및 출력의 입력 및 출력 경로가 요약되어 있습니다.
SageMaker 훈련 인스턴스의 로컬 경로 | SageMaker 환경 변수 | 용도 | 시작 시 S3에서 읽기 | 스팟 재시작 시 S3에서 읽기 | 훈련 중 S3에 쓰기 | 작업 종료 시 S3에 쓰기 |
---|---|---|---|---|---|---|
|
SM_CHANNEL_ |
SageMaker Python SDK Estimator |
예 | 예 | 아니요 | 아니요 |
|
SM_OUTPUT_DIR |
손실, 정확도, 중간 계층, 가중치, 그라데이션, 바이어스 및 TensorBoard호환 출력과 같은 출력 저장. 이 경로를 사용하여 원하는 임의의 출력을 저장할 수도 있습니다. 이 경로는 최종 모델 아티팩트 |
아니요 | 아니요 | 아니요 | 예 |
|
SM_MODEL_DIR |
최종 모델 아티팩트를 저장하는 경로입니다. 이는 SageMaker 호스팅의 실시간 추론을 위해 모델 아티팩트가 배포되는 경로이기도 합니다. |
아니요 | 아니요 | 아니요 | 예 |
|
- |
모델 체크포인트(모델 상태)를 저장하여 특정 시점부터 훈련을 재개하고, 예상치 못한 중단 또는 관리형 스팟 훈련 중단으로부터 복구할 수 있는 경로입니다. |
예 | 예 | 예 | 아니요 |
|
SAGEMAKER_SUBMIT_DIRECTORY |
훈련 스크립트, 추가 라이브러리 및 종속성을 복사하는 경로입니다. |
예 | 예 | 아니요 | 아니요 |
|
- |
스크래치 공간인 |
아니요 | 아니요 | 아니요 | 아니요 |
1 channel_name
은(는) 훈련 데이터 입력에 사용할 사용자 정의 채널 이름을 지정하는 곳입니다. 각 훈련 작업에는 여러 개의 데이터 입력 채널이 포함될 수 있습니다. 훈련 입력 채널은 훈련 작업당 최대 20개까지 지정할 수 있습니다. 데이터 채널에서 소요되는 데이터 다운로드 시간은 청구 가능 시간까지 계산됩니다. 데이터 입력 경로에 대한 자세한 내용은 Amazon SageMaker에서 훈련 정보를 제공하는 방법 단원을 참조하세요. 또한 에서 SageMaker 지원하는 세 가지 유형의 데이터 입력 모드는 파일 FastFile및 파이프 모드입니다. 에서 훈련을 위한 데이터 입력 모드에 대한 자세한 내용은 훈련 데이터 액세스를 SageMaker참조하세요.
2 SageMaker 훈련 아티팩트를 압축하여 TAR 파일에 작성합니다(tar.gz
). 압축 및 업로드 시간은 청구 가능 시간으로 계산됩니다. 자세한 내용은 Amazon이 훈련 출력을 SageMaker 처리하는 방법을 참조하세요.
3 SageMaker 최종 모델 아티팩트를 압축하여 TAR 파일()에 기록합니다tar.gz
. 압축 및 업로드 시간은 청구 가능 시간으로 계산됩니다. 자세한 내용은 Amazon이 훈련 출력을 SageMaker 처리하는 방법을 참조하세요.
4 훈련 기간 동안 Amazon S3와 동기화하세요. TAR 파일에 압축하지 않고 있는 그대로 씁니다. 자세한 내용은 Amazon 에서 체크포인트 사용을 참조하세요 SageMaker.