Amazon이 훈련 출력을 SageMaker 처리하는 방법 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon이 훈련 출력을 SageMaker 처리하는 방법

알고리즘이 컨테이너 내에서 실행될 때 훈련 작업 및 모델의 상태와 출력 아티팩트를 포함하는 출력을 생성합니다. 알고리즘은 컨테이너의 /output 디렉터리에 있는 다음 파일에 이 정보를 작성합니다. Amazon은 다음과 같이 이 디렉터리에 포함된 정보를 SageMaker 처리합니다.

  • /opt/ml/model - 알고리즘은 이 디렉터리에 모든 최종 모델 아티팩트를 작성해야 합니다. 는 이 데이터를 CreateTrainingJob 요청에 지정한 S3 위치에 압축된 tar 형식의 단일 객체로 SageMaker 복사합니다. 단일 훈련 작업의 여러 컨테이너가 이 디렉터리에 쓰이면 file/directory 이름이 충돌하지 않도록 해야 합니다. SageMaker 는 결과를 TAR 파일로 집계하고 훈련 작업이 끝날 때 S3에 업로드합니다.

  • /opt/ml/output/data - 알고리즘은 최종 모델 이외의 저장하려는 아티팩트를 이 디렉터리에 기록해야 합니다. SageMaker 는 이 데이터를 압축된 타르 형식의 단일 객체로 CreateTrainingJob 요청에 지정한 S3 위치에 복사합니다. 단일 훈련 작업의 여러 컨테이너가 이 디렉터리에 쓰여진 경우 file/directory 이름이 clash. SageMaker aggregates가 결과를 TAR 파일로 만들지 않고 훈련 작업이 끝날 때 S3에 업로드되지 않도록 해야 합니다.

  • /opt/ml/output/failure - 훈련에 실패하는 경우 모든 알고리즘 출력(예: 로깅)이 완료된 이후 알고리즘은 이 파일에 실패에 대한 설명을 기록합니다. DescribeTrainingJob 응답에서 는 이 파일의 처음 1024자를 로 SageMaker 반환합니다FailureReason.

훈련 출력을 저장할 S3 범용 버킷 또는 S3 디렉터리 버킷을 지정할 수 있습니다. 디렉터리 버킷은 Amazon S3 Express One Zone 스토리지 클래스만 사용합니다. 이 스토리지 클래스는 일관된 한 자리 수 밀리초 지연 시간이 필요한 워크로드 또는 성능에 중요한 애플리케이션을 위해 설계되었습니다. 애플리케이션 및 성능 요구 사항에 가장 적합한 버킷 유형을 선택하세요. S3 디렉터리 버킷에 대한 자세한 내용은 Amazon Simple Storage Service 사용 설명서디렉터리 버킷을 참조하세요.

참고

Amazon S3 관리형 키(-SSE-S33)를 사용한 서버 측 암호화를 통해서만 Amazon S3 디렉터리 버킷의 SageMaker 출력 데이터를 암호화할 수 있습니다. AWS KMS 키(SSE-KMS)를 사용한 서버 측 암호화는 현재 디렉터리 버킷에 SageMaker 출력 데이터를 저장하는 데 지원되지 않습니다.