기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
파이프 모드 훈련을 위한 증강 매니페스트 파일 형식
증강 매니페스트 형식을 사용하면 RecordIO 파일을 생성할 필요 없이 파일을 사용하여 파이프 모드에서 훈련을 수행할 수 있습니다. CreateTrainingJob
요청의 InputDataConfig
파라미터에 대한 값으로 train 및 validation 채널을 둘 다 지정해야 합니다. 증강 매니페스트 파일은 파이프 입력 모드를 사용하는 채널에 대해서만 지원됩니다. 각 채널에서 데이터는 해당 증강 매니페스트 파일에서 추출되어 채널의 명명된 파이프를 통해 순서에 따라 알고리즘으로 스트리밍됩니다. 파이프 모드는 선입선출(FIFO) 메서드를 사용하므로 레코드는 대기열에 있는 순서대로 처리됩니다. 파이프 입력 모드에 대한 자세한 내용은 Input Mode
를 참조하세요.
"-ref"
접미사가 붙은 속성 이름은 형식이 미리 지정된 바이너리 데이터를 나타냅니다. 경우에 따라 이 알고리즘은 데이터를 구문 분석하는 방법을 알고 있습니다. 다른 경우, 알고리즘에 대해 레코드를 분리하도록 데이터를 래핑해야 할 수 있습니다. 알고리즘이 RecordIO 형식 데이터RecordWrapperType
에 대해 RecordIO
를 지정하면 이 문제를 해결할 수 있습니다. 이 알고리즘이 RecordIO
형식과 호환되지 않는 경우 RecordWrapperType
에 대해 None
을 지정하고 알고리즘에 대해 데이터가 정확하게 구문 분석되었는지 확인하세요.
RecordIO 래핑을 사용하는 경우 ["image-ref", "is-a-cat"]
예에서는 다음 데이터 스트림이 대기열로 전송됩니다.
recordio_formatted(s3://amzn-s3-demo-bucket/foo/image1.jpg)recordio_formatted("1")recordio_formatted(s3://amzn-s3-demo-bucket/bar/image2.jpg)recordio_formatted("0")
RecordIO 형식으로 래핑되지 않은 이미지는 해당 is-a-cat
속성 값을 하나의 레코드로 포함해 스트리밍됩니다. 이 경우, 알고리즘이 이미지와 속성을 정확하게 구분하지 못할 수 있기 때문에 문제가 발생할 수 있습니다. 이미지 분류에 증강형 매니페스트 파일을 사용하는 방법에 대한 자세한 내용은 증강 매니페스트 이미지 형식을 사용한 훈련을 참조하세요.
일반적으로 증강 매니페스트 파일 및 파이프 모드에서는 EBS 볼륨의 크기 제한이 적용되지 않습니다. 여기에는와 같이 EBS 볼륨 크기 제한 내에 있어야 하는 설정이 포함됩니다S3DataDistributionType
. 파이프라인 모드와 이 모드를 사용하는 방법에 대한 자세한 정보는 자체 훈련 알고리즘 사용 - 입력 데이터 구성을 참조하세요.