复杂干扰下字符串的分割与识别方法

文档序号：6370583阅读：324来源：国知局

专利名称：复杂干扰下字符串的分割与识别方法
技术领域：
本发明涉及图像处理领域，具体地说是一种复杂干扰下字符串的分割与识别技术。
背景技术：
光学字符识别技术(Optical Character Recognition,简称OCR)经过多年的发展，取得了巨大的进步，目前已经在手写输入、车牌自动识别、文本的自动扫描与识别等领域得到广泛的应用。然而，现有的OCR技术还难以对复杂干扰下的字符串进行稳健的分割与识别。正因为如此，网络上通常采用受到一定干扰的字符串作为验证码，来鉴别某种操作是人工行为还是计算机的自动行为。目前，对字符串的识别方法主要分为两大类，一种是基于欧式空间距离的方法，例如模板匹配，PCA, 2D-PCA, Hu不变矩等；这类方法简单，易于实现，且对形状规整的字符具有较好的识别效果；但是对于复杂干扰下的字符串，识别效果很差。复杂干扰下的字符串一般具有以下特征(I)它们每种类型的字符都有多种字体，且故意扭曲或旋转一定角度；(2)字符粘连在一起，不易区分；(3)干扰与字符本身的特征没有明显区别。通过增加学习模板的方法，虽然在一定程度上提高了识别率，但是会过多的增加在时间上的开销。另一种是基于有监督机器学习的识别方法，例如神经网络，SVM, AdaBoost算法等。这类方法具有机器学习的能力，能够自动统计出样本的特征，具有较高的识别率和较快的识别速度；但是这类方法需要非歧义的样本，对于有干扰的样本，不能取到很好的学习效果，所以对复杂干扰下的字符串的识别率较低。对于无法用算法去除干扰的字符串，上述两种方法都需要人工去除干扰并制作大量样本。这样做是既费时又费力的。

发明内容
本发明是为避免上述现有技术所存在的不足之处，提出一种复杂干扰下字符串的分割与识别方法，能够实现样本的自动获取，在保证识别率的情况下不会增加时间上的开销，对于有干扰的样本，能取到很好的学习效果和识别率。本发明解决技术问题采用如下技术方案本发明一种复杂干扰下字符串的分割与识别方法的特点是按如下过程进行I、学习阶段利用多示例机器学习的方法按如下步骤对复杂干扰下字符串进行学习；步骤I、获取多示例学习的各个包；将包含有干扰的m个字符图像切分成m份图片；每一份图片包含且仅包含一个完整的字符；将所述m份图片作为多示例学习的m个包，以所述m个包分别入库；所述分别入库是指将同一字符作为同一类，放入在同一个文件夹中，获得与类的数量相一致的η个文件夹，所述η不大于m ；步骤2、利用haar-like特征原型提取haar-like特征作为包的示例；若所述图像不是灰度图像，则先将库内的每一个包进行灰度化处理，再按式(I)计算包的积分图；若所述图像是灰度图像，则利用式(I)计算包的积分图ii
权利要求
1. 一种复杂干扰下字符串的分割与识别方法，其特征按如下过程进行 I、学习阶段利用多示例机器学习的方法按如下步骤对复杂干扰下字符串进行学习；步骤I、获取多示例学习的各个包；将包含有干扰的m个字符图像切分成m份图片；每一份图片包含且仅包含一个完整的字符；将所述m份图片作为多示例学习的m个包，以所述m个包分别入库；所述分别入库是指将同一字符作为同一类，放入在同一个文件夹中，获得与类的数量相一致的η个文件夹，所述η不大于m ；步骤2、利用haar-like特征原型提取haar_like特征作为包的示例；若所述图像不是灰度图像，则先将库内的每一个包进行灰度化处理，再按式(I)计算包的积分图；若所述图像是灰度图像，则利用式(I)计算包的积分图ii
全文摘要
本发明公开了一种复杂干扰下字符串的分割与识别方法，其特征是在学习阶段，将包含有m个字符的图像切分成m份图片，构成多示例学习的包，并将同一字符作为一类，将包归类入库。再计算包的积分图，提取出包的haar-like特征作为包的示例，并使用多样性密度算法找到各类的关键示例，最后利用SVM的分类性能，对关键示例进行学习。在识别阶段，利用学习的结果预测新包的类型，实现对字符串的识别。本发明能实现复杂干扰下的字符串自动识别功能，且识别速度和效率较高。
文档编号G06K9/34GK102722736SQ20121019324
公开日2012年10月10日申请日期2012年6月13日优先权日2012年6月13日
发明者周良, 戴经成, 李想, 查炜, 汪荣贵, 游生福申请人:合肥工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪荣贵;戴经成;周良;李想;游生福;查炜
技术所有人：合肥工业大学
我是此专利的发明人

上一篇：一种结合邻域信息的快速鲁棒模糊c均值图像分割方法
上一篇：一种用于推荐系统的计算机数据挖掘方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。