一种图片中字符识别的方法以及装置与流程

文档序号:11865357阅读:263来源:国知局
一种图片中字符识别的方法以及装置与流程

本发明涉及一种图片中字符识别的方法以及装置。



背景技术:

现有的图片中字符识别技术主要采用先将图片进行切割,然后对切割后的图片进行识别的方法,采用图片切割的方式进行图片中字符识别的技术,识别字符粘连的图片准确率低,不适合在生产过程中应用。而对于整体识别的技术,如果在识别过程中,没有把已经识别出来的字符在原图上完全消除,这些该消除而实际上又没被消除的字符残留部分,容易形成较大的干扰噪声,影响整体的识别准确率。



技术实现要素:

本发明要解决的技术问题,在于提供一种图片中字符识别的方法以及装置,便于识别图片中的字符,并保证准确率。

本发明之一是这样实现的:一种图片中字符识别的方法,所述方法包括一模板数据库;包括如下步骤:

步骤1、将原始图片进行图片预处理;

步骤2、将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;

步骤3、取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;

步骤4、将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成。

进一步地,所述步骤1中,图片预处理包括二值化以及除噪处理。

进一步地,所述步骤2进一步具体为:按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表。

本发明之二是这样实现的:一种图片中字符识别的装置,所述装置包括一模板数据库;包括如下模块:

图片预处理模块,用于将原始图片进行图片预处理;

图片切分模块,用于将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;

字符识别模块,用于取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;

字符消除模块,用于将该识别的子图片的数组列表消除,并进入字符识别模块直至所有字图片识别完成。

进一步地,所述图片预处理模块中,图片预处理包括二值化以及除噪处理。

进一步地,所述图片切分模块进一步具体为:按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表。

本发明具有如下优点:本发明一种图片中字符识别的方法以及装置,本发明中的技术可以很好的识别具有粘连字符特性的图片,识别准确率接近100%;可以很好的解决WEB自动测试工具不能填写验证码的问题;在网络数据抓取、分析的过程中,可以将网络中保存为图片格式的电话号码、电子邮箱地址等信息转换为计算机可以批量处理的数据,从而进行数据挖掘等深入应用。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明方法执行流程图。

图2为本发明装置的原理框图。

具体实施方式

如图1所示,本发明图片中字符识别的方法,所述方法包括一模板数据库;包括如下步骤:

步骤1、将原始图片进行图片预处理,图片预处理包括二值化以及除噪处理;

步骤2、按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表;

步骤3、取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;

步骤4、将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成。

如图2所示,本发明图片中字符识别的装置,所述装置包括一模板数据库;包括如下模块:

图片预处理模块,用于将原始图片进行图片预处理,图片预处理包括二值化以及除噪处理;

图片切分模块,用于按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表;

字符识别模块,用于取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;

字符消除模块,用于将该识别的子图片的数组列表消除,并进入字符识别模块直至所有字图片识别完成。

本装置由图片预处理、图片切分、字符模版管理、字符识别、字符消除等五个模块组成。图片预处理模块负责对输入的原始图片进行二值化、除噪等处理为图片切分模块提供输入;图片切分模块按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为多个不可再切分的子图片,最终将各自子图片转化为由数字0、1组成的数组列表,为字符识别和字符消除模块提供输入;字符模版管理模块负责从现有的图片数据中分析出单个字符模版,为字符识别和字符消除模块提供输入;字符识别模块从字符模块管理模块中获取所有字符模版,针对切分后的每一个子图片进行如下操作:把字符模版逐一与子图片数据进行匹配、比对,每次匹配的结果会输出一个匹配率,最终将匹配率最高的模版所代表的字符作为单次识别的结果输出;字符消除模块负责从图片数据中消除本次已经识别的内容,以决策下一步动作:a)继续识别;b)图片识别结束,输出图片总体识别结果。

虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1