쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

학습 분류 모델

포커스 모드
학습 분류 모델 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

사용자 지정 분류를 위해 모델을 학습시키려면 범주를 정의하고 사용자 지정 모델을 학습시키는 데 필요한 예제 문서를 제공합니다. 멀티클래스 또는 멀티레이블 모드에서 모델을 학습시킵니다. 멀티클래스 모드는 단일 클래스를 각 문서와 연결합니다. 멀티레이블 모드는 하나 이상의 클래스를 각 문서와 연결합니다.

사용자 지정 분류는 일반 텍스트 모델과 네이티브 문서 모델이라는 두 가지 유형의 분류기 모델을 지원합니다. 일반 텍스트 모델은 텍스트 내용을 기준으로 문서를 분류합니다. 네이티브 문서 모델 또한 텍스트 내용을 기준으로 문서를 분류합니다. 네이티브 문서 모델은 문서 레이아웃에서 보내는 추가 신호를 사용할 수도 있습니다. 네이티브 문서 모델을 네이티브 문서로 학습시켜 모델이 레이아웃 정보를 학습할 수 있도록 합니다.

일반 텍스트 모델은 다음과 같은 특성을 갖습니다.

  • UTF-8 인코딩 텍스트 문서를 사용하여 모델을 학습합니다.

  • 영어, 스페인어, 독일어, 이탈리아어, 프랑스어 또는 포르투갈어 중 하나의 언어로 된 문서를 사용하여 모델을 학습할 수 있습니다.

  • 지정된 분류기의 학습 문서는 모두 같은 언어를 사용해야 합니다.

  • 학습 문서는 일반 텍스트이므로 텍스트 추출에 대한 추가 비용은 없습니다.

네이티브 문서 모델은 다음과 같은 특성을 갖습니다.

  • 다음과 같은 문서 유형을 포함하는 반정형 문서를 사용하여 모델을 학습시킵니다.

    • 디지털 및 스캔한 PDF 문서.

    • Word 문서(DOCX).

    • 이미지: JPG 파일, PNG 파일 및 단일 페이지 TIFF 파일.

    • Textract API 출력 JSON 파일

  • 영어 문서를 사용하여 모델을 학습시킵니다.

  • 학습 문서에 스캔한 문서 파일이 포함된 경우 텍스트 추출에 대한 추가 비용이 발생합니다. 자세한 내용은 Amazon Comprehend 요금 페이지를 참조하세요.

두 모델 중 하나를 사용하여 지원되는 모든 문서 유형을 분류할 수 있습니다. 그러나 가장 정확한 결과를 얻으려면 일반 텍스트 모델을 사용하여 일반 텍스트 문서를 분류하고 네이티브 문서 모델을 사용하여 반정형 문서를 분류하는 것이 좋습니다.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.