

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 분류기 학습 데이터 준비
<a name="prep-classifier-data"></a>

사용자 지정 분류의 경우 멀티클래스 모드 또는 멀티레이블 모드에서 모델을 학습합니다. 멀티클래스 모드는 단일 클래스를 각 문서와 연결합니다. 멀티레이블 모드는 하나 이상의 클래스를 각 문서와 연결합니다. 입력 파일 형식은 모드마다 다르므로 학습 데이터를 생성하기 전에 사용할 모드를 선택합니다.

**참고**  
Amazon Comprehend 콘솔에서는 멀티클래스 모드를 단일 레이블 모드라고 합니다.

사용자 지정 분류는 일반 텍스트 문서로 학습시키는 모델 및 기본 문서(예: PDF, Word 또는 이미지)로 학습시키는 모델을 지원합니다. 분류기 모델 및 지원되는 문서 유형에 대한 자세한 내용은 [학습 분류 모델](training-classifier-model.md)을 참조하세요.

사용자 지정 분류기 모델을 학습할 데이터를 준비하려면: 

1. 이 분류기가 분석할 클래스를 식별합니다. 사용할 모드(멀티클래스 또는 멀티레이블)를 결정합니다.

1. 모델이 일반 텍스트 문서 또는 반정형 문서를 분석하기 위한 모델인지에 따라 분류기 모델 유형을 결정합니다.

1. 각 클래스에 대한 문서 예제를 수집합니다. 최소 학습 요구 사항은 [문서 분류를 위한 일반 할당량](guidelines-and-limits.md#limits-class-general)을 참조하세요.

1. 일반 텍스트 모델에서, 사용할 학습 파일 형식(CSV 파일 또는 증강 매니페스트 파일)을 선택합니다. 네이티브 문서 모델을 학습시키려면 항상 CSV 파일을 사용합니다.

**Topics**
+ [분류기 학습 파일 형식](prep-class-data-format.md)
+ [멀티클래스 모드](prep-classifier-data-multi-class.md)
+ [멀티레이블 모드](prep-classifier-data-multi-label.md)