As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Preparar dados de treinamento do classificador
Para classificação personalizada, você treina o modelo no modo multiclasse ou no modo multirrótulos. O modo multiclasse associa uma única classe a cada documento. O modo multirrótulos associa uma ou mais classes a cada documento. Os formatos de arquivo de entrada são diferentes para cada modo, então escolha o modo a ser usado antes de criar os dados de treinamento.
nota
O console do Amazon Comprehend se refere ao modo multiclasse como modo de rótulo único.
A classificação personalizada oferece suporte a modelos que você treina com documentos de texto sem formatação e modelos treinados com documentos nativos (como PDF Word ou imagens). Para mais informações sobre modelos de classificadores e seus tipos de documentos compatíveis, consulte Modelos de classificação de treinamento.
Preparar dados para treinar um modelo de classificador personalizado:
-
Identifique as classes que você deseja que esse classificador analise. Decida qual modo usar (multiclasse ou multirrótulo).
-
Decida o tipo de modelo do classificador, com base no modelo ter o fim de analisar documentos de texto simples ou documentos semiestruturados.
-
Reúna exemplos de documentos para cada uma das classes. Para obter os requisitos mínimos de treinamento, consulteCotas gerais para classificação de documentos.
-
Para um modelo de texto sem formatação, escolha o formato de arquivo de treinamento a ser usado (arquivo ou CSV arquivo de manifesto aumentado). Para treinar um modelo de documento nativo, você sempre usa um CSV arquivo.