一种字符图像验证码识别的方法及系统的制作方法

文档序号:9687969阅读:294来源:国知局
一种字符图像验证码识别的方法及系统的制作方法
【技术领域】
[0001] 本发明设及图像处理领域,特别设及一种字符图像验证码识别的方法及系统。
【背景技术】
[0002] 验证码的识别经过长时间的发展,其识别方法可分为Ξ大类:W统计特征为基础 的识别方法、W结构特征为基础的识别方法和W人工智能领域的多种机器学习方法相结合 为基础的识别方法。
[0003] 其中,W统计特征为基础的识别方法使用该类字符里具有良好区分性和一定稳定 性的统计特征为标准模板特征向量。目前使用最多的统计特征主要是字符的投影特征序 列,此外还有位置相关的和频域相互变换的特征。该方法需要针对某一种验证码来建立较 标准的模板库,运样才会对该类验证码识别率较高,因而其适应性不够好,抗形变性较差。
[0004] W结构特征为基础的识别方法的本质是字符到结构空间的映射,实际识别中无须 样本空间的建立,一般情况下不同的字符有其独特的结构特征集合,运些集合不应完全重 合,将提取出的待识别字符特征所属的集合对应的字符作为识别结果。该类方法提前不需 要相关的参数知识,只要验证码的结构比较固定,识别效果就会又好又快,且具有一定的适 应性。
[0005] W人工智能领域的多种机器学习方法相结合为基础的识别方法使用机器学习算 法建立的模型对采集的样本进行训练学习,获得稳定的参数后即可对新的待识别样本进行 识别,运类方法有较强的鲁棒性和适应性,抗噪性较好且可移植。
[0006] 综上所述,当前的识别方法主要W传统的诸如结构统计、概率甚至集合方法之类 的确定性理论为基础来对验证码进行识别,运都导致其不足W来应对运些数据的不确定 性,因而可能会对识别准确性和可靠性产生直接影响。因此,如何高效、可靠的对字符图像 验证码进行识别是一个需要解决的问题。

【发明内容】

[0007] 本发明的目的是提供一种字符图像验证码识别的方法及系统,该方法及系统具有 良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
[000引为解决上述技术问题,本发明提供一种字符图像验证码识别的方法,包括:
[0009] 获取字符图像;
[0010] 对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值 字符图像进行除噪;
[0011] 对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
[0012] 依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变 换对每个所述子块进行处理,获得特征观察矩阵;
[0013] 将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识 别。
[0014] 其中,训练所述二维隐马尔科夫模型包括:
[0015] 构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进 行路径初始化,对预定参数进行重估计;
[0016] 获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处 理,得到每个字符图像的特征观察矩阵;
[0017] 依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入;
[0018] 对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的 最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率;
[0019] 使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应 的最优路径,并计算与所述最优路径对应的从模型的输出概率;
[0020] 比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出 概率结果一致时,得到二维隐马尔科夫模型。
[0021] 其中,对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述 二值字符图像进行除噪,包括:
[0022] 将所述字符图像进行灰度处理,得到灰度图像;
[0023] 利用大津法将所述灰度图像进行二值化处理,得到二值字符图像;
[0024] 利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图 像。
[0025] 其中,对除噪后的二值字符图像进行字符分割,得到单个字符区域图像,包括:
[0026] 将除噪后的二值字符图像进行水平方向上的投影;
[0027] 选取投影中的空白区域的中屯、点作为分割点对除噪后的二值字符图像进行分割;
[0028] 当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符 图像进行分割。
[0029] 其中,依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散 余弦变换对每个所述子块进行处理,获得特征观察矩阵,包括:
[0030] 将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素 的子块,其中,各子块之间有2像素重叠;
[0031] 利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像;
[0032] 获取变换后图像的左上角的2X2矩阵作为特征观察矩阵。
[0033] 本发明提供一种字符图像验证码识别的系统,包括:
[0034] 获取模块,用于获取字符图像;
[0035] 二值化模块,用于对所述字符图像进行处理,得到二值字符图像,并利用预定除噪 算法对所述二值字符图像进行除噪;
[0036] 分割模块,用于对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;
[0037] 特征观察矩阵模块,用于依次将每个所述单个字符区域图像切分为预定大小的子 块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;
[0038] 识别模块,用于将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字 符图像进行识别。
[0039] 其中,包括训练模块,其中,所述训练模块包括:
[0040] 构建单元,用于构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方 向作为从状态进行路径初始化,对预定参数进行重估计;
[0041] 输入获取单元,用于获取预定数量的字符图像作为训练样本,将训练样本中的每 个字符图像进行初处理,得到每个字符图像的特征观察矩阵;依次将每个字符图像的特征 观察矩阵作为初始二维隐马尔科夫模型的输入;
[0042] 从状态解码单元,用于对位于各个主状态下的从状态采取Viterbi解码,获得垂直 序列对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主 状态的输出概率;
[0043] 主状态解码单元,用于使用Viterbi对水平方向的主模型进行解码,得到在主模型 下水平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率;
[0044] 比较单元,用于比较得到的各个输出概率,根据比较结果对预定参数进行重估计, 直到各个输出概率结果一致时,得到二维隐马尔科夫模型。
[0045] 其中,所述二值化模块包括:
[0046] 灰度单元,用于将所述字符图像进行灰度处理,得到灰度图像;
[0047] 二值化单元,用于利用大津法将所述灰度图像进行二值化处理,得到二值字符图 像;
[0048] 除噪单元,用于利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后 的二值字符图像。
[0049] 其中,所述分割模块包括:
[0050] 水平投影单元,用于将除噪后的二值字符图像进行水平方向上的投影;选取投影 中的空白区域的中屯、点作为分割点对除噪后的二值字符图像进行分割;
[0051] 最短路径单元,用于当除噪后的二值字符图像存在粘连字符时,采用最短路径法 对除噪后的二值字符图像进行分割。
[0052] 其中,所述特征
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1