As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Treine classificadores personalizados () API
Para criar e treinar um classificador personalizado, use a CreateDocumentClassifieroperação.
Você pode monitorar o progresso da solicitação usando a DescribeDocumentClassifieroperação. Após a transição do campo Status
para TRAINED
, você pode usar o classificador para classificar documentos. Se o status for TRAINED_WITH_WARNINGS
, revise a pasta de arquivos ignorados no Saída do treinamento do classificador para a operação CreateDocumentClassifier
.
Tópicos
Classificação personalizada de treinamento usando o AWS Command Line Interface
Os exemplos a seguir mostram como usar a CreateDocumentClassifier
operação, a DescribeDocumentClassificationJob
operação e outro classificador personalizado APIs com o. AWS CLI
O exemplo está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um circunflexo (^).
Crie um classificador personalizado de texto sem formatação usando a operação create-document-classifier
.
aws comprehend create-document-classifier \ --region
region
\ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket
/docclass/file name
\ --data-access-role-arn arn:aws:iam::account number
:role/testFlywheelDataAccess
Para criar um classificador personalizado nativo, forneça os seguintes parâmetros adicionais na solicitação para create-document-classifier
.
-
DocumentType: defina o valor como SEMI _ STRUCTURED _DOCUMENT.
-
Documents: a localização do S3 para os documentos de treinamento (e, opcionalmente, os documentos de teste).
-
OutputDataConfig: forneça a localização do S3 para os documentos de saída (e uma KMS chave opcional).
-
DocumentReaderConfig: campo opcional para configurações de extração de texto.
aws comprehend create-document-classifier \ --region
region
\ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket
/docclass/file name
\ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket
/docclass/file name
\ --data-access-role-arn arn:aws:iam::account number
:role/testFlywheelDataAccess
Obtenha informações sobre um classificador personalizado com o classificador de documentos ARN usando a DescribeDocumentClassifier
operação.
aws comprehend describe-document-classifier \ --region
region
\ --document-classifier-arn arn:aws:comprehend:region
:account number
:document-classifier/file name
Exclua um classificador personalizado usando a operação DeleteDocumentClassifier
.
aws comprehend delete-document-classifier \ --region
region
\ --document-classifier-arn arn:aws:comprehend:region
:account number
:document-classifier/testDelete
Liste todos os classificadores personalizados na conta usando a operação ListDocumentClassifiers
.
aws comprehend list-document-classifiers --region
region
Usando o AWS SDK for Java ou SDK para Python
Para obter SDK exemplos de como criar e treinar um classificador personalizado, consulteUse CreateDocumentClassifier com um AWS SDKou CLI.