基于字符识别的关键词通知方法及设备、计算机程序产品的制作方法_2

文档序号：9756947阅读：来源：国知局

可以利用如图1所示的用于实现本公开实施例的基于字符识别的关键词通知方法的电子终端100中的图像采集装置110或者独立于所述电子终端100的可以向所述电子终端100传送图像的其它图像采集装置，在用户所在的位置处拍摄用户选定场景的图像作为待识别图像。
[0032]所述待识别图像可以是照片，也可以是视频中的一帧。所述照片可以包括一幅或多幅单一场景的照片，也可以是全景照片。具体地，可以利用所述电子终端中的图像采集装置拍摄用户选定场景的一张照片，或拍摄用户选定场景的一段视频，或者以低于预定移动速度阈值的速度改变所述图像采集装置的拍摄方向或取景范围从而拍摄更大范围的用户选定场景的视频。所述待识别图像可以反应用户所处的环境，并且相应地可以包含用户所处环境中存在的字符，所述字符可以包括但不限于建筑物标识、店铺标识、街道标识、广告牌字符等。
[0033]图3示出了在用户所在的位置处拍摄的待识别图像的示例，在该示例中，所述图像是照片，用户位于红星洗衣店附近，该照片包含“红星洗衣店”字符串，并且还包括“理店”、“店”、“十三店”、“Midea”、“美的”等字符串ο
[0034]图4A示出了在用户所在的位置处拍摄的照片的另一示例，在该示例中，所述图像是照片，用户站在机场的航班信息显示屏前希望找到他即将乘坐的航班CA3856的信息，该照片包含了 “航班号”、“计划”、“终点站/经停站”、“柜台号”和“办理等级时间”等字段。
[0035]在步骤S220，在所述待识别图像中进行字符识别。在获得所拍摄的待识别图像之后，可以识别所述待识别图像中出现的字符。
[0036]可选地，在识别所述待识别图像中的字符之前，可以对所述待识别图像进行预处理，以利于所述字符识别。例如，在所述图像是照片的情况下，所述预处理可以包括对照片进行缩放，在所述图像是视频的情况下，所述预处理可以包括提取视频的关键帧。
[0037]根据本公开实施例，从所述待识别图像中识别出的字符可以包括至少一个字符，并且字符识别结果可以包括所述至少一个字符以及每个字符的位置。例如，在如图3所示的待识别图像中，从所述待识别图像可以识别出“红”、“星”、“洗”、“衣”、“店”、“理”、“店”、“十”、“三”、“店”、“M”、“i”、“d”、“e”、“a”、“美”、“的”等字符。
[0038]更进一步，对于所述字符识别结果中的所述至少一个字符，可以将其按照行或列的顺序组织为字符串。具体地，在对所述待识别图像进行字符识别时，可以按照所述至少一个字符中每个字符在所述待识别图像中的位置，将所述至少一个字符进行组合以形成至少一个字符串。例如，可以根据包含在所述字符识别结果中的所述至少一个字符中每个字符的位置，将所述至少一个字符排列成一行或多行，然后将所述字符按照行的顺序组织为至少一个字符串；或者，可以根据包含在所述字符识别结果中的所述至少一个字符中每个字符的位置，将所述至少一个字符排列成一列或多列，然后将所述字符按照列的顺序组织为至少一个字符串。在本公开实施例中，可以根据用户所在国家和/或地区的书写习惯，确定应当将所识别的至少一个字符排列成行还是列。在此情况下，根据本公开实施例，从所述待识别图像中识别出的字符串可以包括至少一个字符串，并且字符串识别结果可以包括所述至少一个字符串以及每个字符串的位置。仍针对如图3所示的待识别图像，可以识别出“红星洗衣店”、“理店”、“店”、“十三店”、“Midea”、“美的”等字符串ο
[0039]具体地，可以使用光学字符识别(OCR)技术来识别所述待识别图像中的字符。可以扫描所述待识别图像以检测所述待识别图像中所有可能含有字符的字符框的位置，然后可以识别每个字符框中的字符并将每个字符框中的内容作为一个字符串，并且产生字符串识别结果。所述字符串识别结果可以包括所识别的字符串以及所述字符串的位置。
[0040]例如，可以将所述待识别图像划分为如图5A所示的9个块，并且可以采用数值I一9来表示所述字符串的位置，“I”表示所述字符串位于所述待识别图像的左上块中，“2”表示所述字符串位于所述待识别图像的中上块中，“3”表示所述字符串位于所述待识别图像的右上块中，依此类推。当然，根据实际需要，可以将所述待识别图像划分为更少或更多块，例如4块、16块等。
[0041]再例如，可以以所述待识别图像的中心点、左上顶点、左下顶点、右上顶点、右下顶点之一为原点建立二维坐标系，并且对于每个像素点而言，以该像素点与所述原点之间的像素点数量作为该像素点的二维坐标值。
[0042 ]光学字符识别(OCR)技术已经是本领域中公知的技术，在本公开中不对现有的OCR技术展开描述。此外，应了解，本公开实施例不限于采用现有的OCR技术进行字符识别，而且应涵盖采用将来开发的字符识别技术进行字符识别并继而进行关键词通知的任何应用。
[0043]可选地，还可以分析所述字符串识别结果中的每个字符串，以确定一个或多个具有具体含义的词语。具体地，可以使用本领域公知的方法对所述字符串进行分析，并且对所述字符串进行分词，从而将所述字符串划分为一个或多个具有具体含义的词语。对所述字符串进行分析和分词的方法是本领域公知的，在这里为了简单起见而省略其详细描述。在图3所示的示例中，通过上述分析和分词操作，例如可以将“红星洗衣店”字符串划分为以下词语“红星”、“洗衣”、“店”、“洗衣店”等子字符串。
[0044]在步骤S230，判断从所述待识别图像中识别出的字符与预设关键词是否匹配。所述预设关键词可以包括至少一个预设关键词。具体地，判断从所述待识别图像中识别出的字符串与所述至少一个预设关键词之一是否匹配。
[0045]具体地，可以预先设置匹配程度阈值，对于所述至少一个字符串中的每个字符串而言，确定该字符串与所述至少一个预设关键词之一的匹配程度，以及在所述匹配程度高于匹配程度阈值时确定该字符串与所述预设关键词匹配。例如，在该字符串完全包含某个预设关键词的情况下，可以确定该字符串与所述预设关键词完全匹配。
[0046]例如，一个预设关键词为“洗衣店”，在如图3所示的待识别图像中识别出的字符串包括“红星洗衣店”，因此识别出的字符串“红星洗衣店”完全包含预设关键词“洗衣店”，可以确定该字符串与该预设关键词匹配。在此情况下，可以将该字符串“红星洗衣店”在所述待识别图像中的位置作为向用户提示的字符串位置。
[0047]可选地，如上所述，在将如图3所示的待识别图像中识别出的字符串“红星洗衣店”划分为“红星”、“洗衣”、“洗衣店”子字符串的情况下，“洗衣店”子字符串与预设关键词“洗衣店”完全匹配。在此情况下，可以将该字符串“洗衣店”在所述待识别图像中的位置作为向用户提示的字符串位置。
[0048]再例如，一个预设关键词为“红星干洗店”，匹配程度阈值为60%，在如图3所示的待识别图像中识别出的字符串包括“红星洗衣店”，识别出的字符串“红星洗衣店”与预设关键词“红星干洗店”不能完全匹配，可以例如可以计算其匹配程度为70%或80%，该匹配程度高于所述匹配程度阈值60%，则可以确定该字符串与该预设关键词匹配。在此情况下，可以将该字符串“红星洗衣店”在所述待识别图像中的位置作为向用户提示的字符串位置。
[0049]再例如，一个预设关键词为“CA3856”。在如图4A所示的待识别图像中存在字符串“CA3856”。然而，由于字符识别算法的错误将所述待识别图像中的“CA3856”识别为字符串“CA5856”，所识别到的字符串“CA5856”与所述预设关键词“CA3856”没有完全匹配，例如根据预定的匹配程度计算算法确定所识别到的字符串“CA5856”与所述预设关键词“CA3856”之间的匹配程度为85%。在将匹配程度阈值设置为100%时，根据本公开实施例的基于字符识别的关键词通知方法确定所识别到的字符串与所述预设关键词不匹配;在将匹配程度设置为80%时，根据本公开实施例的基于字符识别的关键词通知方法可以确定所识别到的字符串与所述预设关键词匹配。
[0050]因此，可以权衡字符识别精度以及误报率来设置所述匹配程度阈值。所述匹配程度阈值越高，所要求的字符识别精度越高但误报率越低;所述匹配程度阈值越低，误报率越高但所要求的字符识别精度越低。例如，在如图4A所示的待识别图像中，一个预设关键词为“CA3856”，预设的匹配程度阈值为50%，图4A中的字符串“CA3856”和“CA3448”

完整全部详细技术资料下载

当前第2页1 2 3 4 5