基于数学运算验证码图像的分割方法和装置与流程

文档序号:12722536阅读:361来源:国知局
基于数学运算验证码图像的分割方法和装置与流程

本发明涉及图像分割领域,具体而言,涉及一种基于数学运算验证码图像的分割方法和装置。



背景技术:

图像分割是图像处理、图像识别中的一项关键技术,但由于图像差异性太大,很难找到一种方法适用于所有的图像分割,也没有制定出判断分割算法好坏的标准。

现有的图像分割方法主要有基于密度投影的分割方法、基于距离的分割方法和基于形态学腐蚀扩张的分割方法。

采用基于密度投影的分割方法时,需要对图像数据进行二值化预处理,图像二值化处理的作用是将三通道图片(由红黄蓝三基色组成)转换为黑白单色图片(由0和1组成的单通道图片),因为图片的差异性,采取的二值化方法也不同,主要的二值化方法为阈值法、hsv色彩提取法,基于密度投影的分割方法采用水平密度投影法进行文字切割,该方法沿水平方向计算垂直方向像素和,假设背景为白色,文字为黑色,那么垂直方向像素和波谷与波谷之间即为文字,该方法的缺陷在于对二值化要求高,不适用左右结构字符,并且要求单个文字左右两部分空白不超过一个像素的图片。

采用基于距离的分割方法时,也需要对图像数据进行二值化预处理,针对二值化后的图片,采用距离切割方法进行文字切割,距离切割方法是一种根据文字在图片中的位置进行切割的方法,该方法的缺陷在于只适用于文字大小和位置固定的图片。

采用基于形态学腐蚀扩张的分割方法时,也需要对图像数据进行二值化预处理,针对二值化后的图片,采用形态学腐蚀扩张法进行图像分割。该方法的缺陷在于将二值化后的图片腐蚀扩张后,需确保单个字粘连(即单个字只有一个等密度曲线),相邻文字间不粘连,因此只适用于单张图片分割。

针对上述有技术中对数学运算验证码图像进行分割时需对图像进行二值化处理、去噪以及对图像中字符的位置有限制而带来的分割复杂和适用性差的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明提供一种基于数学运算验证码图像的分割方法和装置,以至少解决现有技术中对数学运算验证码图像进行分割时需对图像进行二值化处理、去噪以及对图像中字符的位置有限制而带来的分割复杂和适用性差的技术问题。

根据本发明实施例的一个方面,提供一种基于数学运算验证码图像的分割方法,包括:获取待处理的数学运算验证码图像;将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板;根据匹配结果对待处理的数学运算验证码图像进行分割。

优选的是,获取待处理的数学运算验证码图像之后,还包括:将待处理的数学运算验证码图像进行灰度化处理。

在上述任一方案中优选的是,将待处理的数学运算验证码图像与预构建的字符模板匹配,包括:将字符模板的左上角像素沿着待处理的数学运算验证码图像的每一个像素对齐,计算像素相似度,若像素相似度大于等于预设匹配阈值,则匹配成功,否则匹配失败。

在上述任一方案中优选的是,预设匹配阈值的取值范围为大于或等于0.7。

在上述任一方案中优选的是,数字模板包括0-9的阿拉伯数字表示方式和汉字表示方式,符号模板包括加减乘除的数学符号表示形式和汉字表示形式。

根据本发明实施例的另一方面,还提供了一种基于数学运算验证码图像的分割装置,包括:获取模块,用于获取待处理的数学运算验证码图像;匹配模块,用于将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板;分割模块,用于根据匹配结果对待处理的数学运算验证码图像进行分割。

优选的是,装置还包括:处理模块,用于在获取模块获取待处理的数学运算验证码图像之后,将待处理的数学运算验证码图像进行灰度化处理。

在上述任一方案中优选的是,匹配模块用于将字符模板的左上角像素沿着待处理的数学运算验证码图像的每一个像素对齐,计算像素相似度,若像素相似度大于等于预设匹配阈值,则匹配成功,否则匹配失败。

在上述任一方案中优选的是,预设匹配阈值的取值范围为大于或等于0.7。

在上述任一方案中优选的是,数字模板包括0-9的阿拉伯数字表示方式和汉字表示方式,符号模板包括加减乘除的数学符号表示形式和汉字表示形式。

按照本发明的基于数学运算验证码图像的分割方法和装置,通过获取待处理的数学运算验证码图像,将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板,根据匹配结果对待处理的数学运算验证码图像进行分割,达到了对数学运算验证码图像进行分割的目的,无需二值化和去噪等困难的图像预处理过程,并且对数学运算验证码图像的字符位置没有限制,可实现切割的同时识别,具有速度快、实用性强的特点,进而解决了现有技术中对数学运算验证码图像进行分割时需对图像进行二值化处理、去噪以及对图像中字符的位置有限制而带来的分割复杂和适用性差的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例1的基于数学运算验证码图像的分割方法的示意图;

图2是根据本发明实施例1的数学运算验证码图像;

图2(a)是根据本发明实施例1的对图2的数学运算验证码图像进行分割后的第一个字符示意图;

图2(b)是根据本发明实施例1的对图2的数学运算验证码图像进行分割后的第一个字符示意图;

图2(c)是根据本发明实施例1的对图2的数学运算验证码图像进行分割后的第一个字符示意图;以及

图3是根据本发明实施例2的基于数学运算验证码图像的分割装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例,提供了一种基于数学运算验证码图像的分割方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的基于数学运算验证码图像的分割方法,如图1所示,该方法包括如下步骤:

步骤S102,获取待处理的数学运算验证码图像。

具体的,待处理的数学运算验证码图像可能具有背景色以及其他的噪音,如图2所示,图2为一种数学运算验证码图像,此处需要说明的是,由于附图要求,图2中给出的数学运算验证码图像是没有背景色的一种例子,实际情况中应用的数学运算验证码图像可能会有至少一种背景色。

步骤S104,将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板。

具体的,针对于数学运算验证码图像来说,数学运算中使用的字符是有限的,因此字符模板也是有限的,并不会太多,匹配过程不会特别复杂,此处需要说明的是,由于待处理的数学运算验证码图像中可能包括多个字符,本发明中可以对多个字符依次进行匹配,也可以同时进行匹配,采用同时匹配的方法能够进一步加快匹配速度。

步骤S106,根据匹配结果对待处理的数学运算验证码图像进行分割。

具体的,匹配结束后,可以按照字符在待处理的数学运算验证码图像中的顺序取出字符,完成分割。

在本实施例中,通过获取待处理的数学运算验证码图像,将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板,根据匹配结果对待处理的数学运算验证码图像进行分割,达到了对数学运算验证码图像进行分割的目的,无需二值化和去噪等困难的图像预处理过程,并且对数学运算验证码图像的字符位置没有限制,可实现切割的同时识别,具有速度快、实用性强的特点,进而解决了现有技术中对数学运算验证码图像进行分割时需对图像进行二值化处理、去噪以及对图像中字符的位置有限制而带来的分割复杂和适用性差的技术问题。

在一可选的实施例中,步骤S102中在获取待处理的数学运算验证码图像之后,还包括:将待处理的数学运算验证码图像进行灰度化处理。

具体的,待处理的数学运算验证码图像的背景色以及噪音可能包括多中颜色,造成噪音严重,为了去除噪音,加快匹配速度,可以将待处理的数学运算验证码图像进行灰度化处理,将背景色、噪音以及字符转化为灰度。

在一可选的实施例中,数字模板包括0-9的阿拉伯数字表示方式和汉字表示方式,符号模板包括加减乘除的数学符号表示形式和汉字表示形式。

具体的,由于数学运算涉及的字符量很少,因此字符模板相应的数量也不大,字符模板主要包括数字模板和符号模板,数字模板进一步可以分为0-9的阿拉伯表示方式的数字模板和汉字表示方式的数字模板,具体可以包括“0”、“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”、“9”以及“零”、“壹”、“贰”、“叁”、“肆”、“伍”、“陆”、“柒”、“捌”、“玖”,符号模板可以进一步分为加减乘除的数学符号表示形式和汉字表示形式,具体可以包括“+”、“-”、“×”、“÷”以及“加”、“减”、“乘”、“除”,上述的数字模板和符号模板共计28个模板,其中针对每个模板,可以通过改变字体等因素再分出4个模板,总共112个模板。

具体的,符号模板需要提前准备好,可以根据需求从图片提前分割出字符模板,也可以采用图片生成器生成各种大小、各种旋转角度的字符模板。

在一可选的实施例中,步骤S104中将待处理的数学运算验证码图像与预构建的字符模板匹配,包括:将字符模板的左上角像素沿着待处理的数学运算验证码图像的每一个像素对齐,计算像素相似度,若像素相似度大于等于预设匹配阈值,则匹配成功,否则匹配失败。

具体的,基于提前准备好的字符模板,本发明中进行匹配的过程不需要对待处理的数学运算验证码图像进行二值化以及去噪操作,在一种可选的实施例中,可以将灰度化后的待处理的数学运算验证码图像与28个字符模板分别进行匹配,将字符模板的左上角像素沿着待处理的数学运算验证码图像的每一个像素对齐,计算像素相似度,在匹配成功后,记录相应的位置。

在一可选的实施例中,如图2所示,采用本发明实施例对图2的数学运算验证码图像进行分割,首先需要采用28个模板与该图像进行匹配,可以依次或者同时将图像中的所有字符进行匹配,每匹配成功一个字符,可以记录该字符的位置以及该字符对应的字符模板,匹配完成后,可以按照字符在图像中的顺序将字符取出,图2(a)、2(b)和2(c)依次为图2中数学运算验证码图像的第1个字符、第2个字符和第3个字符。

在一可选的实施例中,预设匹配阈值的取值范围为大于或等于0.7。

具体的,当预设匹配阈值取值0.7时,若像素相似度大于等于0.7,则匹配成功,否则匹配失败。

实施例2

根据本实施例,提供一种基于数学运算验证码图像的分割装置的产品实施例,图3是根据本发明实施例的基于数学运算验证码图像的分割装置,如图3所示,该装置包括获取模块、匹配模块和分割模块。

其中,获取模块,用于获取待处理的数学运算验证码图像;匹配模块,用于将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板;分割模块,用于根据匹配结果对待处理的数学运算验证码图像进行分割。

在本实施例中,获取模块通过获取待处理的数学运算验证码图像,匹配模块将待处理的数学运算验证码图像与预构建的字符模板匹配,得到匹配结果;其中,字符模板包括数字模板和符号模板,分割模块根据匹配结果对待处理的数学运算验证码图像进行分割,达到了对数学运算验证码图像进行分割的目的,无需二值化和去噪等困难的图像预处理过程,并且对数学运算验证码图像的字符位置没有限制,可实现切割的同时识别,具有速度快、实用性强的特点,进而解决了现有技术中对数学运算验证码图像进行分割时需对图像进行二值化处理、去噪以及对图像中字符的位置有限制而带来的分割复杂和适用性差的技术问题。

在一可选的实施例中,装置还包括:处理模块,用于在获取模块获取待处理的数学运算验证码图像之后,将待处理的数学运算验证码图像进行灰度化处理。

在一可选的实施例中,数字模板包括0-9的阿拉伯数字表示方式和汉字表示方式,符号模板包括加减乘除的数学符号表示形式和汉字表示形式。

在一可选的实施例中,匹配模块的具体实施包括:将字符模板的左上角像素沿着待处理的数学运算验证码图像的每一个像素对齐,计算像素相似度,若像素相似度大于等于预设匹配阈值,则匹配成功,否则匹配失败。

在一可选的实施例中,预设匹配阈值的取值范围为大于或等于0.7。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1