Preparazione dei dati di addestramento del classificatore - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Preparazione dei dati di addestramento del classificatore

Per una classificazione personalizzata, si addestra il modello in modalità multiclasse o in modalità multietichetta. La modalità multiclasse associa una singola classe a ciascun documento. La modalità multi-etichetta associa una o più classi a ciascun documento. I formati dei file di input sono diversi per ogni modalità, quindi scegliete la modalità da utilizzare prima di creare i dati di allenamento.

Nota

La console Amazon Comprehend fa riferimento alla modalità multiclasse come modalità a etichetta singola.

La classificazione personalizzata supporta modelli addestrati con documenti di testo semplice e modelli addestrati con documenti nativi (come PDF Word o immagini). Per ulteriori informazioni sui modelli di classificazione e sui tipi di documenti supportati, vedere. Modelli di classificazione della formazione

Per preparare i dati per addestrare un modello di classificatore personalizzato:

  1. Identifica le classi che desideri che questo classificatore analizzi. Decidi quale modalità usare (multiclasse o multi-etichetta).

  2. Decidi il tipo di modello di classificatore, in base al fatto che il modello sia destinato all'analisi di documenti di testo semplice o di documenti semistrutturati.

  3. Raccogli esempi di documenti per ciascuna classe. Per i requisiti minimi di formazione, consultaQuote generali per la classificazione dei documenti.

  4. Per un modello in testo semplice, scegliete il formato del file di addestramento da utilizzare (CSVfile o file manifesto aumentato). Per addestrare un modello di documento nativo, si utilizza sempre un file. CSV