本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
运行异步任务
训练自定义分类器后,您可以使用异步任务批量分析大型文档或多个文档。
自定义分类接受各种输入文档类型。有关详细信息,请参阅异步自定义分析的输入。
如果您计划分析图像文件或扫描的PDF文档,则您的IAM策略必须授予使用两种 Amazon Textract API 方法(DetectDocumentText 和 AnalyzeDocument)的权限。Amazon Comprehend 在文本提取过程中会调用这些方法。有关策略示例,请参阅 执行文档分析操作所需的权。
要使用纯文本模型对半结构化文档(图像或 Docx 文件)进行分类,请使用输入格式。PDF one document per file
此外,请在StartDocumentClassificationJob请求中包含该DocumentReaderConfig
参数。