彩色印刷纸张人工填涂信息的一种识别方法

文档序号：6488285阅读：298来源：国知局

彩色印刷纸张人工填涂信息的一种识别方法
【专利摘要】本发明提供了彩色选票图像识别问题的一个解决方法，能快速，准确，智能的定位出彩色扫描选票上的识别目标的位置，并对识别目标内部填涂信息作出判断，同时，对于椭圆及菱形这种形状不规则候选框也能正确识别。本算法适用于彩色答题卡填涂识别。
【专利说明】彩色印刷纸张人工填涂信息的一种识别方法
【技术领域】
[0001]本发明涉及彩色印刷纸张上人工填涂信息识别，例如彩色扫描头电子票箱扫描的彩色选票的图像识别，彩色答题卡的填涂答案识别，属于智能化图像识别系统。
【背景技术】
[0002]传统的电子票箱多为黑白扫描头，扫描的选票为灰度图，存在图像质量不佳，识别不准确等问题。彩色扫描图数据量大，数据处理需要更高的技巧。而且，票箱组成结构为机械部件，电机转速不均，或者人工投票过程中手部拉扯选票，都会造成选票扫描图像存在拉伸。电子票箱进票口大于选票尺寸，会造成选票扫描头像存在倾斜，拉伸和倾斜给选票的定位识别带来困难。传统的识别算法基于模板匹配，在数据库记录的坐标附近移动模板，匹配搜索候选框区域，这种处理方法使得运算次数过多执行时间过长。传统的选票设计多为矩形选项框，椭圆，菱形等选项框的曲线形状很复杂，涉及复杂的图像识别算法，难以处理。现有的答题卡图像识别算法多是利用模板匹配根据相似度计算做答题结果识别，这种方法运算时间较长。
[0003]本发明提出了一种新的处理方法，解决了上述问题。

【发明内容】

[0004]针对选票识别，本发明提出了一种新的解决方法。先对选票图像做噪声处理，然后进行目标搜索识别，最后与数据库记录的坐标信息进行匹配，解决了图像随机拉伸问题，同时减少了算法执行时间，提高了识别准确性。
[0005]本方法利用R/G/B三个颜色通道的颜色差值对彩色图像二值化，二值化函数为
[0006]〔 I R[i]-mean [i] +1 G[i] -mean [i] +1B [i] -mean [i] |〕< Threshold
[0007]其中，mean[i] =〔R[i]+G[i]+B[i]〕/3,是第i个像素点的灰度均值。逐个像素点判断三个RGB差值，大于设定阈值Threshold时判定为彩色像素点，二值化为0，小于设定阈值时判定为黑白像素点，二值化为1，后续的图像基于二值图像做处理。为了增强算法的容错能力，这里的二值化阈值Threshold通过对整张图像做光栅扫描统计计算得到。逐点计算三通道颜色差值:
[0008]RGBDiff [i] =〔 | R[i]-mean[i] | +1 G[i]-mean[i] | +1B[i]-mean[i] |〕
[0009]整张图像的像素点数为Length,对Length个RGBDiff求均值Ave和标准差Var,图像二值化阈值可由下式得到:
[0010]Threshold = Ave_3*Var
[0011]扫描头扫描图像的R/G/B灰度值通常偏离标准色卡的灰度值，其涨落近似为高斯分布。理论上，当阈值取得小于均值三倍标准差时，二值化误差小于0.2 %，能得到较好的二值图像。
[0012]根据数据库记录的候选框坐标，在选票扫描图像上进行模板匹配搜索定位，运算次数正比于模板大小乘以整张图像大小。对于A4纸张大小的选票，100DPI扫描头扫描的图像约有830*1170个像素点，候选框模板约有500个像素点，模板匹配的运算次数为
[0013]K*830*l170*500
[0014]其中K为依赖于具体匹配方法的一个常数，这个数值一般在十亿次以上。
[0015]为了减少运算次数，本发明提出了基于直线的选票图像处理方法，先对图像的点与线判断并作做去噪声处理。对于标准选票，其定位框，信息框及另选框都是标准的矩形，设矩形框宽高的最小尺寸为Width*Height。首先对整张二值图像逐行扫描，搜索行内连续的值为I像素点，若其点数大于Width-5，则保留这些像素点，否则将其值改为0，这么做就去掉了短于Width-5的直线。然后，对二值图像逐列扫描，搜索列内连续值为I的像素点，若其点数大于Height-5，则保留，否则将这些像素点的值改为0，这么做就去掉了内短于Height-5的直线。最后结果是去掉了图像噪声，只留下需要识别的目标客体，即定位框，信息框，候选框，另选框。
[0016]对图像做噪声处理，然后搜索识别目标，所需要的运算总次数约为:
[0017]L*830*1170
[0018]其中，L为一常数，依赖于具体的去噪方法。这个运算次数远小于模板匹配算法的运算次数，缩短了算法执行时间。
[0019]对选票图像先做噪声处理，再做目标识别，在另一个角度减少了噪声对识别的干扰。噪声处理去掉了二值化图像中的汉字，灰度起伏噪声点，不规则填涂笔迹，小的图像印刷污染等，最后选票图像上面只留下需要识别的目标(包括定位框，信息框，候选框，另选框)，提高了识别准确度。
[0020]先识别再匹配的处理方法则从根本上解决了选票图像扫描拉伸的问题。电子票箱的选票图像生成由传动电机及扫描头等机械部件完成，原则上不能保证扫描图像与电脑设计的数字图像精确匹配。识别目标如候选框被随机拉伸后，其大小与高度发生了变化，并且偏离了数据库记录位置。本方法先集体识别出目标客体的中心位置以及宽高信息，之后逐行与数据库对比匹配横向坐标，
[0021]RecX-DBX | < D
[0022]其中RecX是识别出目标框横向坐标，DBX是数据库记录的目标框横向坐标，D是一个大小约为10个像素的常值，这个匹配范围用以适应印刷导致的图像横向偏移。最后将匹配结果写入数据库，避免了图像的随机拉伸造成的识别困难。
[0023]对于椭圆，菱形这样不规则的形状，运用模板匹配方法识别计算量大，处理复杂。本方法利用类似上述矩形选项框的噪声处理方法，保留下椭圆或菱形中心宽高大于设定参数的部分，识别出其中心坐标，然后根据中心坐标取外切于椭圆或菱形选框的矩形方块区域进行识别。这种方法能巧妙的避开不规则形状曲线带来的算法复杂度，找到椭圆和菱形候选框的位置并作出填涂识别。
[0024]填涂识别部分，算法提取空白信息框，自动计算白色阈值。票箱处于不同的亮度环境下，扫描的图像灰度不一致，针对每张选票动态的调整白色阈值，能更准确的对填涂作出判定识别。
[0025]对于当前通用的彩色答题卡，矩形填涂框，上述方法同样适用。
【专利附图】

【附图说明】附图1为识别算法流程示意图。
【权利要求】
1.彩色扫描图像的RGB三通道颜色取差值对图像二值化。
2.基于直线处理图像噪声，本方法逐行逐列扫描图像，对短于特定长度的直线作为噪声去掉，缩短图像处理时间。
3.识别算法能应对扫描图像的随机拉伸，先识别出图像中的选项框，再将识别结果逐行与数据库匹配，解决了扫描图像随机拉伸时的识别问题。
【文档编号】G06K9/54GK103679178SQ201210314041
【公开日】2014年3月26日申请日期:2012年8月30日优先权日:2012年8月30日
【发明者】汪法兵, 黄姗申请人:北京飞利信科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪法兵;黄姗
技术所有人：北京飞利信科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。