本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
检测文本
Amazon Rekognition 可以检测图像和视频中的文本。然后,它会将检测到的文本转换为机器可读的文本。您可以使用图像中的机器可读文本检测来实施一些解决方案,例如:
-
可视化搜索。例如,检索和显示包含相同文本的图像。
-
内容见解。例如,提供对文本中出现的主题的见解,该文本是在提取的视频帧中识别的。您的应用程序可以搜索识别的文本中的相关内容,例如新闻、体育赛事比分、运动员号码和字幕。
-
导航。例如,为视障人士开发可识别餐厅、商店或路标中的名称的支持语音的移动应用程序。
-
公共安全和交通运输支持。例如,从路况摄像头图像中检测车牌号码。
-
过滤。例如,从图像中过滤掉个人身份信息 (PII)。
对于视频中的文本检测,您可以实施一些解决方案,例如:
-
在视频中搜索包含特定文本关键字的剪辑,例如,新闻节目中图片上的来宾姓名。
-
通过检测意外文本、亵渎性词汇或垃圾邮件,审核内容是否符合组织标准。
-
查找视频时间线上的所有文本叠加以进行进一步处理,例如替换文本为另一种语言的文本以实现内容国际化。
-
查找文本位置,以便其他图形能够相应地对齐。
要检测 JPEG 或 PNG 格式图像中的文本,请使用DetectText操作。要异步检测视频中的文本,请使用StartTextDetection和GetTextDetection操作。图像和视频文本检测操作支持大多数字体,包括高度风格化的字体。在检测文本后,Amazon Rekognition 将创建检测到的单词和文本行的表示形式,显示它们之间的关系,并告知您文本在图像或视频帧中的位置。
DetectText
和 GetTextDetection
操作可以检测单词和行。单词 是一个或多个不用空格分隔的字母字符。DetectText
可以在一张图片中检测多达 100 个单词。GetTextDetection
每帧视频还可以检测多达 100 个单词。
单词是一个或多个字母字符,不用空格分隔。Amazon Rekognition 旨在检测英语、阿拉伯语、俄语、德语、法语、意大利语、葡萄牙语和西班牙语的单词。
行 是一个由等间距单词组成的字符串。一行不一定是一个完整的句子(句号不表示一行的结尾)。例如,Amazon Rekognition 将一个驾照号码检测为一行。当后面没有对齐的文本或单词之间有较大的间距(相对于单词的长度)时,一行便结束了。根据单词之间的间距,Amazon Rekognition 可能在向同一方向对齐的文本中检测到多个行。如果一个句子跨多个行,则操作将返回多个行。
请考虑以下图像。
蓝色框表示有关 DetectText
操作返回的检测到的文本和该文本的位置的信息。在此示例中,Amazon Rekognition 将“IT's”、“MONDAY”、“but”、“keep”和“Smiling”作为单词检测。Amazon Rekognition 将“IT's”、“MONDAY”、“but keep”和“Smiling”检测为一行。文本必须在横轴的 +/- 90 度方向以内才能被检测到。
有关示例,请参阅检测图像中的文本。