本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
训练自定义实体识别器模型
自定义实体识别器仅识别您在训练模型时包含的实体类型。它不会自动包括预设的实体类型。如果您还想识别预设的实体类型,例如位置、日期或人员,则需要为这些实体提供其他训练数据。
当您使用带注释的 PDF 文件创建自定义实体识别器时,您可以使用具有多种输入文件格式的识别器:纯文本、图像文件(JPG、PNG、TIFF)、PDF 文件和 Word 文档,无需预处理或拼合文档。Amazon Comprehend 不支持对图像文件或 Word 文档进行注释。
注意
使用带注释的 PDF 文件的自定义实体识别器仅支持英文文档。
创建自定义实体识别器后,您可以使用DescribeEntityRecognizer操作监控请求的进度。当 Status
字段为 TRAINED
时,识别器模型即可用于自定义实体识别。