本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
自定义分类的分析作业 (API)
创建和训练自定义文档分类器后,您可以使用该分类器来运行分析任务。
使用StartDocumentClassificationJob操作开始对未贴标签的文档进行分类。您可以指定包含输入文档的 S3 存储桶、用于输出文档的 S3 存储桶以及要使用的分类器。
要在训练模型时获得最高的准确性,请将输入类型与分类器模型类型进行匹配。如果您向纯文本模型提交原生文档,或向原生文档模型提交纯文本文档,则分类器任务会返回警告。有关更多信息,请参阅 训练分类模型。
StartDocumentClassificationJob是异步的。启动作业后,使用该DescribeDocumentClassificationJob操作来监控其进度。当响应中的 Status
字段显示 COMPLETED
时,您可以在指定的位置访问输出。
使用 AWS Command Line Interface
以下是StartDocumentClassificationJob
操作的示例,以及其他APIs带有的自定义分类器。 AWS CLI
以下示例使用 Unix、Linux和 macOS 的命令格式。对于 Windows,请将每行末尾的反斜杠 (\) Unix 行继续符替换为脱字号 (^)。
使用 StartDocumentClassificationJob
操作运行自定义分类任务。
aws comprehend start-document-classification-job \ --region
region
\ --document-classifier-arn arn:aws:comprehend:region
:account number
:document-classifier/testDelete \ --input-data-config S3Uri=s3://S3Bucket
/docclass/file name
,InputFormat=ONE_DOC_PER_LINE \ --output-data-config S3Uri=s3://S3Bucket
/output \ --data-access-role-arn arn:aws:iam::account number
:role/resource name
使用 DescribeDocumentClassificationJob
操作获取带有任务 ID 的自定义分类器的信息。
aws comprehend describe-document-classification-job \ --region
region
\ --job-idjob id
使用 ListDocumentClassificationJobs
操作列出您账户中的所有自定义分类任务。
aws comprehend list-document-classification-jobs --region
region
对SDK于 Python 使用 AWS SDK for Java 或
有关如何启动自定义分类器作业的SDK示例,请参阅StartDocumentClassificationJob搭配使用 AWS SDK或 CLI。