图像的最佳实践 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

图像的最佳实践

当您使用图像文件进行自定义分类或自定义实体识别时,请遵循以下指南以获得最佳结果:

  • 提供高质量的图像,理想情况下至少为 150 DPI。

  • 如果图像文件使用支持的格式之一(TIFF、JPEG 或 PNG),则在将文件上传到 Amazon S3 之前,请勿对其进行转换或缩减采样。

为了在从文档的表格中提取文本时获得最佳结果,请遵循以下做法:

  • 文档中的表格与页面上周围的元素在视觉上是分开的。例如,表格不会叠加在图像或复杂图案上。

  • 表格中的文字是直立的。例如,文本不会相对于页面上的其他文本进行旋转。

从表格中提取文本时,您可能会在以下情况下看到不一致的结果:

  • 合并的表格单元格跨越多列。

  • 表中的单元格、行或列与同一个表的其他部分不同。