一种基于识别反馈的字符图像验证码识别方法

文档序号:6610445阅读:302来源:国知局
专利名称:一种基于识别反馈的字符图像验证码识别方法
技术领域
本发明涉及一种验证码识别方法,特别是涉及一种基于识别反馈的图像验证码识别方法。
背景技术
验证码设计的基本准则是减少硬人工智能的问题,即一个问题如果不能用计算机程序解决,则可以用作验证码。目前验证码的实现方式包括字符图像、语音识别、动态图像等,其中字符图像由于体积小、易传输等优点,是使用最为广泛的一种。使用验证码可防止他人对网站进行批量注册、重复发贴、暴力密码破解、垃圾邮件的群发,然而验证码也阻碍了测试人员使用软件对网站的自动化测试、信息的快速发布、交易的自动化进行等操作。
在过去的数十年,研究者们提出了很多验证码识别方法,这些方法可分为基于模板匹配的方法,基于字符结构的方法和机器学习方法。
模板匹配方法采用预先设计好的模板匹配图像中的字符,相对比较简单,实现起来容易,然而这种方法无法处理存在噪音,字符位置和大小不固定的验证码。
基于字符结构的方法根据字符各自的结构特点作为识别特征,自定义不同的识别算法,然而无法处理字符粘连、变形等情况。
机器学习方法通过提取特征,训练分类器,可实现字符的高效识别。
字符图像验证码识别的主要问题是验证码中包含有各种类型的噪音,字符存在粘连、倾斜、旋转、变形,这些现象影响了识别的准确率。发明内容
本发明的目的是要提供一种基于识别反馈的字符图像验证码识别方法,克服自动化程序中验证码识别方法对于复杂字符图像验证码存在噪音、字符粘连、倾斜、旋转、变形等无法识别的缺陷,通过对字符图像验证码的识别,实现自动化程序的顺利工作,提高人们的工作效率。
为了达到上述的目的本发明是这样实现的本发明的一种基于识别反馈的字符图像验证码识别方法的操作步骤如下(1)将字符图片加载到内存中,获取每个像素的颜色,颜色采用RGB形式表示,分别代表该颜色的红色、绿色、蓝色分量;(2)二值化将彩色图像转换成灰度图像,且采用如下的灰度变换公式,Y=O. 299R+0. 587G+0. 114B且采用阈值将灰度图像转换成二值图像,阈值的选取采用大津法且为0STU,即选择使得两类样本间方差最大的灰度值作为阈值,二值化中阈值的选取方法为设#。为前景像素所占图像总像素的比例,令力为所有前景像素的平均灰度,设K 为背景点数所占图像总像素的比例,令士为所有背景像素的平均灰度,则图像的所有像素的平均灰度为《 = W0 U0 + W1U1 .在进行程序运算时,t的取值可从图像的最小灰度值到图像的最大灰度值依次遍历,当 取某值时,类间方差公式6= W0 {u0 - u)2+ W1 Qj1 -uY能取得最大,此时 即为二值化的阈值;(3)修补采用如下的模板对图像进行修复,以去除边缘毛刺并填补空白 0 0 00 0 0 0 0 II O I OO I IO I II O II O I0 0 0O O I0 0 I O O I模板Tl模板Τ2模板Τ3模板Τ4模板Τ5其中O代表背景像素点,I代表前景像素点,?可为背景或前景象素点,模板Τ1-Τ3将中心前景像素点变为背景像素点,模板Τ4和Τ5将中心背景像素点变为前景像素点,且每个模板依次顺时针旋转90度、180度和270度,形成新的模板,并依次作用于原始图像;(4)去噪音针对不同的噪音类型采用相应的去噪音方法,包括连通域滤波对相邻的前景像素点进行扩张,获得连通域,去除连通域面积小于一定临界值的区域,高斯滤波设/Ti,力表示图像(i,j)处像素点的灰度,经过如下变换获得滤波后的图像
权利要求
1.一种基于识别反馈的字符图像验证码识别方法,其特征在于该方法的操作步骤如下 (1)将字符图片加载到内存中,获取每个像素的颜色,颜色采用RGB形式表示,分别代表该颜色的红色、绿色、蓝色分量; (2)二值化 将彩色图像转换成灰度图像,且采用如下的灰度变换公式,Y=O. 299R+0. 587G+0. 114B 采用阈值将灰度图像转换成二值图像,阈值的选取采用大津法且为OSTU,即选择使得两类样本间方差最大的灰度值作为阈值,二值化中阈值的选取方法为 设# ,为前景像素所占图像总像素的比例,令^为所有前景像素的平均灰度,设K为背景点数所占图像总像素的比例,令士为所有背景像素的平均灰度,则图像的所有像素的平均灰度为《 = W0 U0 + W1U1 .在进行程序运算时,t的取值可从图像的最小灰度值到图像的最大灰度值依次遍历,当 取某值时,类间方差公式6= w0 {u0 - u)2+ W1 Qj1 -uY能取得最大,此时 即为二值化的阈值; (3)修补 采用如下的模板对图像进行修复,以去除边缘毛刺并填补空白 ·0 0 00 0 0 0 0 II ·O I OO I IO I II O II OI ·0 0 0O O I0 0 I O O I 模板Tl模板Τ2模板Τ3模板Τ4模板Τ5 其中O代表背景像素点,I代表前景像素点,?可为背景或前景象素点,模板Τ1-Τ3将中心前景像素点变为背景像素点,模板Τ4和Τ5将中心背景像素点变为前景像素点,且每个模板依次顺时针旋转90度、180度和270度,形成新的模板,并依次作用于原始图像; (4)去噪音 针对不同的噪音类型采用相应的去噪音方法,包括 连通域滤波对相邻的前景像素点进行扩张,获得连通域,去除连通域面积小于一定临界值的区域, 高斯滤波设/Ti,力表示图像(i,j)处像素点的灰度,经过如下变换获得滤波后的图像
全文摘要
一种基于识别反馈的图像验证码识别方法。其特征该方法主要包括步骤先将原始彩色图像转换成灰度图像,并进行二值化处理,得到二值化图像数据;接着对所述二值化图像进行修补,去除图像边缘毛刺,填补中心空白,并完成断裂笔画的连接,得到修补图像;再对所述修补图像去除背景以及干扰点或线,得到无噪图像;并对无噪图像进行细化,得到单一像素的细化图像;然后对细化图像进行切分,得到仅含单个字符的单字符图像;最后对单字符图像进行归一化并识别其中的字符。本发明可对含有各种类型的噪音、字符存在粘连、倾斜、旋转及变形等现象的字符图像验证码设计相应的算法进行处理,完成高效率和高精度的识别。本发明可应用于自动化程序中验证码识别。
文档编号G06K9/54GK102930277SQ20121034937
公开日2013年2月13日 申请日期2012年9月19日 优先权日2012年9月19日
发明者董启文 申请人:上海珍岛信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1