自定义分类的分析作业 (API) - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自定义分类的分析作业 (API)

创建和训练自定义文档分类器后,您可以使用该分类器来运行分析任务。

使用StartDocumentClassificationJob操作开始对未贴标签的文档进行分类。您可以指定包含输入文档的 S3 存储桶、用于输出文档的 S3 存储桶以及要使用的分类器。

要在训练模型时获得最高的准确性,请将输入类型与分类器模型类型进行匹配。如果您向纯文本模型提交原生文档,或向原生文档模型提交纯文本文档,则分类器任务会返回警告。有关更多信息,请参阅 训练分类模型

StartDocumentClassificationJob是异步的。启动作业后,使用该DescribeDocumentClassificationJob操作来监控其进度。当响应中的 Status 字段显示 COMPLETED 时,您可以在指定的位置访问输出。

使用 AWS Command Line Interface

以下是StartDocumentClassificationJob操作的示例,以及其他APIs带有的自定义分类器。 AWS CLI

以下示例使用 Unix、Linux和 macOS 的命令格式。对于 Windows,请将每行末尾的反斜杠 (\) Unix 行继续符替换为脱字号 (^)。

使用 StartDocumentClassificationJob 操作运行自定义分类任务。

aws comprehend start-document-classification-job \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/testDelete \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name,InputFormat=ONE_DOC_PER_LINE \ --output-data-config S3Uri=s3://S3Bucket/output \ --data-access-role-arn arn:aws:iam::account number:role/resource name

使用 DescribeDocumentClassificationJob 操作获取带有任务 ID 的自定义分类器的信息。

aws comprehend describe-document-classification-job \ --region region \ --job-id job id

使用 ListDocumentClassificationJobs 操作列出您账户中的所有自定义分类任务。

aws comprehend list-document-classification-jobs --region region

对SDK于 Python 使用 AWS SDK for Java 或

有关如何启动自定义分类器作业的SDK示例,请参阅StartDocumentClassificationJob搭配使用 AWS SDK或 CLI