Amazon에서 교육 결과를 SageMaker 처리하는 방법 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon에서 교육 결과를 SageMaker 처리하는 방법

알고리즘이 컨테이너 내에서 실행될 때 학습 작업 및 모델의 상태와 출력 아티팩트를 포함하는 출력을 생성합니다. 알고리즘은 컨테이너의 /output 디렉터리에 있는 다음 파일에 이 정보를 작성합니다. Amazon은 이 디렉터리에 포함된 정보를 다음과 같이 SageMaker 처리합니다.

  • /opt/ml/model— 알고리즘은 모든 최종 모델 아티팩트를 이 디렉터리에 작성해야 합니다. SageMaker 이 데이터를 압축된 tar 형식의 단일 객체로 CreateTrainingJob 요청에서 지정한 S3 위치에 복사합니다. 단일 교육 작업의 여러 컨테이너가 이 디렉터리에 기록하는 경우 file/directory 이름이 충돌하지 않도록 해야 합니다. SageMaker결과를 TAR 파일로 집계하고 교육 작업 종료 시 S3에 업로드합니다.

  • /opt/ml/output/data— 알고리즘은 최종 모델 외에 저장하려는 아티팩트를 이 디렉터리에 기록해야 합니다. SageMaker이 데이터를 압축된 tar 형식의 단일 객체로 CreateTrainingJob 요청에서 지정한 S3 위치에 복사합니다. 단일 교육 작업의 여러 컨테이너가 이 디렉터리에 기록하는 경우 file/directory 이름이 충돌하지 않도록 해야 합니다. SageMaker 결과를 TAR 파일로 집계하고 교육 작업 종료 시 S3에 업로드합니다.

  • /opt/ml/output/failure - 학습에 실패하는 경우 모든 알고리즘 출력(예: 로깅)이 완료된 이후 알고리즘은 이 파일에 실패에 대한 설명을 기록합니다. DescribeTrainingJob응답에서 이 파일의 처음 1024자를 로 SageMaker 반환합니다. FailureReason

훈련 결과를 저장할 S3 범용 또는 S3 디렉터리 버킷을 지정할 수 있습니다. 디렉터리 버킷은 Amazon S3 Express One Zone 스토리지 클래스만 사용합니다. 이 클래스는 10밀리초의 일관된 지연 시간이 필요한 워크로드 또는 성능이 중요한 애플리케이션을 위해 설계되었습니다. 애플리케이션 및 성능 요구 사항에 가장 적합한 버킷 유형을 선택하세요. S3 디렉터리 버킷에 대한 자세한 내용은 Amazon 심플 스토리지 서비스 사용 설명서의 디렉터리 버킷을 참조하십시오.