Preparar dados de treinamento do classificador

Para classificação personalizada, você treina o modelo no modo multiclasse ou no modo com vários rótulos. Multi-class mode associa uma única classe a cada documento. Multi-label mode associa uma ou mais classes a cada documento. Os formatos de arquivo de entrada são diferentes para cada modo, então escolha o modo a ser usado antes de criar os dados de treinamento.

nota

O console do Amazon Comprehend se refere ao modo multiclasse como modo de rótulo único.

A classificação personalizada é compatível com modelos que você treina com documentos sem formatação e modelos treinados com documentos originais (como PDF, Word ou imagens). Para mais informações sobre modelos de classificadores e seus tipos de documentos compatíveis, consulte Modelos de classificação de treinamento.

Preparar dados para treinar um modelo de classificador personalizado:

Identifique as classes que você deseja que esse classificador analise. Decida qual modo usar (multiclasse ou multirrótulo).
Decida o tipo de modelo do classificador, com base no modelo ter o fim de analisar documentos de texto simples ou documentos semiestruturados.
Reúna exemplos de documentos para cada uma das classes. Para obter os requisitos mínimos de treinamento, consulteCotas gerais para classificação de documentos.
Para um modelo de texto sem formatação, escolha o formato de arquivo de treinamento a ser usado (arquivo CSV ou arquivo de manifesto aumentado). Para treinar um modelo de documento nativo, você sempre usa um arquivo CSV.

Tópicos

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Classificação personalizada

Formatos de arquivo de treinamento