图片文字识别方法与流程

文档序号:12468580阅读:1286来源:国知局

本发明涉及图文软件领域,特别地,是一种图片文字识别方法。



背景技术:

对于图片上的文字,在较多情况下需要进行大段地复制使用,因此,必须要首先通过软件方法先将图片形式的文字转换成可编辑文字;在此过程中,目前使用的方法是,采用一套字模库,将图片中截取的每一个图元文字与字模库中的各个字模文字进行对比,并将相似度最高的字模文字以可编辑文字的形式输出,从而使用户获得所需的可编辑文本。

然而,由于各种图片形式的文本通常采用不同的字体,而目前在将图元文字与字模文字相对比时,通常只采用一套字模库,因此,倘若图元文字的字体与字模库中的字体不同时,则文字识别的准确性并不高;若采用多套字模库,则按一套字模库的逐字对比的方式,每个图元文字将需要与多套字模库中的各字模文字相对比,其工作量十分巨大。



技术实现要素:

针对上述问题,本发明的目的在于提供一种图片文字识别方法,该方法可以准确而高效地识别图片中的文字信息。

本发明解决其技术问题所采用的技术方案是:该图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。

作为优选,所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、行楷、隶书对应的字模库。

作为优选,在分别选取所述框选文本区域中的各个图元文字时,采用矩形框的形式,所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切。

作为优选,在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与欲作对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文字作布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字颜色越少,则相似度越高。

本发明的有益效果在于:在将图元文字与字模文字作对比时,由于采用了多种字模库,因此,使得识别的准确性得到了很大程度的提高,而由于本方法在对于所述框选文本区域中的第一个图元文字作对比的过程中,就可以确定框选文本区域中的第一个图元文字的字体,从而推出该框选文本区域中所有图元文字的字体,这就可以使得后面的图元文字仅与一种字模库中的字模文字进行对比,不仅对比工作量小,且不失准确性。

具体实施方式

下面对本发明进一步说明:

本发明提供的图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取,如,当前图片为允8格式的,那么用户在当前图片上框选部分文本后,将用户框选的文本区域视为一张待处理的允8图片;然后,对待处理的允8图片中的各个图元文字分别进行选取,选取时,采用矩形框的形式,以从上至下、从左到右的顺序逐个选取图元文字,所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切;当选取所述框选文本区域中的第一个图元文字后,将其与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字,将该字模文字以可编辑文字形式输出,同时,记录该相似度最高的字模文字所在的字模库,定义为标准字模库;此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。

为了满足绝大部分图元文字的字体需求,所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、行楷、隶书对应的字模库。

另外,在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与欲作对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文字作布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字颜色越少,则相似度越高;如,通常情况下,文字颜色为黑色,则将所述字模图元与图元文字作布尔差运算后,它们相重合部分的黑色被消除了,由背景色替代,那么如果字模图元和图元文字完全一样,则布尔差运算之后,则黑色的剩余量为零,而相似度越低,则黑色的剩余量就越大。

本发明提供的图片文字识别方法在将图元文字与字模文字作对比时,由于采用了多种字模库,因此,使得识别的准确性得到了很大程度的提高,而由于本方法在对于所述框选文本区域中的第一个图元文字作对比的过程中,就可以确定框选文本区域中的第一个图元文字的字体,从而推出该框选文本区域中所有图元文字的字体,这就可以使得后面的图元文字仅与一种字模库中的字模文字进行对比,不仅对比工作量小,且不失准确性。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1