一种字符图像验证码识别的方法及系统的制作方法_4

文档序号:9687969阅读:来源:国知局
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实 施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而 言,由于其与实施例公开的方法相对应,所W描述的比较简单,相关之处参见方法部分说明 即可。
[0150] 专业人员还可W进一步意识到,结合本文中所公开的实施例描述的各示例的单元 及算法步骤,能够W电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和 软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。运些 功能究竟W硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业 技术人员可W对每个特定的应用来使用不同方法来实现所描述的功能,但是运种实现不应 认为超出本发明的范围。
[0151] 结合本文中所公开的实施例描述的方法或算法的步骤可W直接用硬件、处理器执 行的软件模块,或者二者的结合来实施。软件模块可W置于随机存储器(RAM)、内存、只读存 储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术 领域内所公知的任意其它形式的存储介质中。
[0152] W上对本发明所提供的字符图像验证码识别的方法及系统进行了详细介绍。本文 中应用了具体个例对本发明的原理及实施方式进行了阐述,W上实施例的说明只是用于帮 助理解本发明的方法及其核屯、思想。应当指出,对于本技术领域的普通技术人员来说,在不 脱离本发明原理的前提下,还可W对本发明进行若干改进和修饰,运些改进和修饰也落入 本发明权利要求的保护范围内。
【主权项】
1. 一种字符图像验证码识别的方法,其特征在于,包括: 获取字符图像; 对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符 图像进行除噪; 对除噪后的二值字符图像进行字符分割,得到单个字符区域图像; 依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对 每个所述子块进行处理,获得特征观察矩阵; 将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别。2. 如权利要求1所述的方法,其特征在于,训练所述二维隐马尔科夫模型包括: 构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作为从状态进行路 径初始化,对预定参数进行重估计; 获取预定数量的字符图像作为训练样本,将训练样本中的每个字符图像进行初处理, 得到每个字符图像的特征观察矩阵; 依次将每个字符图像的特征观察矩阵作为初始二维隐马尔科夫模型的输入; 对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列对应的从模型的最佳 路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态的输出概率; 使用Viterbi对水平方向的主模型进行解码,得到在主模型下水平观察序列对应的最 优路径,并计算与所述最优路径对应的从模型的输出概率; 比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到各个输出概率 结果一致时,得到二维隐马尔科夫模型。3. 如权利要求1所述的方法,其特征在于,对所述字符图像进行处理,得到二值字符图 像,并利用预定除噪算法对所述二值字符图像进行除噪,包括: 将所述字符图像进行灰度处理,得到灰度图像; 利用大津法将所述灰度图像进行二值化处理,得到二值字符图像; 利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二值字符图像。4. 如权利要求3所述的方法,其特征在于,对除噪后的二值字符图像进行字符分割,得 到单个字符区域图像,包括: 将除噪后的二值字符图像进行水平方向上的投影; 选取投影中的空白区域的中心点作为分割点对除噪后的二值字符图像进行分割; 当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除噪后的二值字符图像 进行分割。5. 如权利要求4所述的方法,其特征在于,依次将每个所述单个字符区域图像切分为预 定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵,包 括: 将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽各为4像素的子 块,其中,各子块之间有2像素重叠; 利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图像; 获取变换后图像的左上角的2X2矩阵作为特征观察矩阵。6. -种字符图像验证码识别的系统,其特征在于,包括: 获取模块,用于获取字符图像; 二值化模块,用于对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法 对所述二值字符图像进行除噪; 分割模块,用于对除噪后的二值字符图像进行字符分割,得到单个字符区域图像; 特征观察矩阵模块,用于依次将每个所述单个字符区域图像切分为预定大小的子块, 利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵; 识别模块,用于将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图 像进行识别。7. 如权利要求6所述的系统,其特征在于,包括训练模块,其中,所述训练模块包括: 构建单元,用于构建初始二维隐马尔科夫模型,将水平方向作为主状态和垂直方向作 为从状态进行路径初始化,对预定参数进行重估计; 输入获取单元,用于获取预定数量的字符图像作为训练样本,将训练样本中的每个字 符图像进行初处理,得到每个字符图像的特征观察矩阵;依次将每个字符图像的特征观察 矩阵作为初始二维隐马尔科夫模型的输入; 从状态解码单元,用于对位于各个主状态下的从状态采取Viterbi解码,获得垂直序列 对应的从模型的最佳路径,获得从模型的输出概率,并将所述输出概率作为对应的主状态 的输出概率; 主状态解码单元,用于使用Viterbi对水平方向的主模型进行解码,得到在主模型下水 平观察序列对应的最优路径,并计算与所述最优路径对应的从模型的输出概率; 比较单元,用于比较得到的各个输出概率,根据比较结果对预定参数进行重估计,直到 各个输出概率结果一致时,得到二维隐马尔科夫模型。8. 如权利要求6所述的系统,其特征在于,所述二值化模块包括: 灰度单元,用于将所述字符图像进行灰度处理,得到灰度图像; 二值化单元,用于利用大津法将所述灰度图像进行二值化处理,得到二值字符图像; 除噪单元,用于利用连通域滤波法去除所述二值字符图像中的噪点,得到除噪后的二 值字符图像。9. 如权利要求8所述的系统,其特征在于,所述分割模块包括: 水平投影单元,用于将除噪后的二值字符图像进行水平方向上的投影;选取投影中的 空白区域的中心点作为分割点对除噪后的二值字符图像进行分割; 最短路径单元,用于当除噪后的二值字符图像存在粘连字符时,采用最短路径法对除 噪后的二值字符图像进行分割。10. 如权利要求9所述的系统,其特征在于,所述特征观察矩阵模块包括: 切分单元,用于将每个所述单个字符区域图像在水平方向上和垂直方向上分割成长宽 各为4像素的子块,其中,各子块之间有2像素重叠; 变换单元,用于利用二维离散余弦变换对每个所述子块进行变换处理,得到变换后图 像; 特征观察矩阵单元,用于获取变换后图像的左上角的2X2矩阵作为特征观察矩阵。
【专利摘要】本发明公开了一种字符图像验证码识别的方法及系统,该方法包括:获取字符图像;对所述字符图像进行处理,得到二值字符图像,并利用预定除噪算法对所述二值字符图像进行除噪;对除噪后的二值字符图像进行字符分割,得到单个字符区域图像;依次将每个所述单个字符区域图像切分为预定大小的子块,利用二维离散余弦变换对每个所述子块进行处理,获得特征观察矩阵;将所述特征观察矩阵作为二维隐马尔科夫模型的输入,对所述字符图像进行识别;该方法具有良好的适应性和有效性,能够高效的完成字符图像验证码的识别。
【IPC分类】G06K9/62
【公开号】CN105447508
【申请号】CN201510761049
【发明人】董启文
【申请人】上海珍岛信息技术有限公司
【公开日】2016年3月30日
【申请日】2015年11月10日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1