基于混合特征提取的手写数字识别方法与流程

文档序号：11520312阅读：202来源：国知局

本发明涉及一种基于混合特征提取的手写数字识别方法。
背景技术：
：随着智能手机、平板电脑等手持设备的广泛应用，手写输入作为一种更便捷的人机交互方式，越来越得到人们的青睐，联机手写识别技术得到了快速发展。而手写数字缺乏上下文联系，给识别带来了更大的困难。对手写数字进行识别，首先要对从手写输入装置获取的手写数字信息进行预处理，然后再进行特征提取，最后进行特征分类。其中特征提取和分类是最重要的环节，而特征提取的好坏决定了识别正确率的高低。目前常用的特征提取算法有如下几种：统计特征提取和结构特征提取(1.dasn,reddyjm,sarkarr,etal.astatistical-topologicalfeaturecombinationforrecognitionofhandwrittennumerals[j].appliedsoftcomputing,2012,12(8):2486-2495.2.babuur,chinthaak,venkateswarluy.handwrittendigitrecognitionusingstructural,statisticalfeaturesandk-nearestneighborclassifier[j].internationaljournalofinformationengineeringandelectronicbusiness(ijieeb),2014,6(1):62.)；统计特征对图像细节和噪声不敏感，但是对一些精细结构不能有效提取；结构特征能把握数字固有的笔画结构，但是对数字结构的变动较为敏感，对于不同的手写字形不能给出较满意的分离效果。静态特征提取和动态特征提取(3.hafsa,w.,kherallah,m.,benjemaa,m.,benamara,en.,2004.ahybridapproachofneuralnetworks/hiddenmarkovmodelforon-linerecognitionofthearabicdigits[c]//ieeeinternat.conf.onscs’04.mounastir,tunisie,pp.137–141.4.kherallah,m.,haddadl.,alimim.a.,mitichea.on-linehandwrittendigitrecognitionbasedontrajectoryandvelocitymodeling[j].patternrecognitionletters,2008,29:580-594.)；静态特征对数字笔划书写先后顺序不敏感，但容易受到局部噪声的影响；动态特征对噪声和数字的细小变形不敏感，但书写顺序的不同会造成误识别。局部特征提取和全局特征提取(5.dixonrs,dolfingjg,meieru,etal.integratingstroke-distributioninformationintospatialfeatureextractionforautomatichandwritingrecognition:u.s.patent20,140,363,082[p].2014-12-11.6.nibarandas,ramsarkar,subhadipbasu,etal.ageneticalgorithmbasedregionsamplingforselectionoflocalfeaturesinhandwrittendigitrecognitionapplication[j].appliedsoftcomputing.2012,12(5):1592-16067.minorumori；seiichiuchida；hitoshisakano.globalfeatureforonlinecharacterrecognition[j].patternrecognitionletters2014,35,142-148.)等。局部特征能够把握数字局部笔划、形状等的特点，但易受到噪声的干扰；全局特征考虑了手写数字的非马尔可夫特征，并且对局部噪声不敏感，但书写顺序、书写习惯的不同会影响全局特征的正确提取。传统的特征提取算法一般是提取手写数字的某类特征，一旦对某个数字的某类特征提取失败，将会得到错误的分类结果。技术实现要素：本发明的目的是提供一种基于混合特征提取的手写数字识别方法，对一种温度阵列手写数字输入终端数据进行采集和识别，从而实现在线手写数字识别的方法，能够有效抑制环境噪声对在线识别产生的影响，同时避免了不同手写者、不同手写比划顺序等造成的误识别或拒识别，解决现有技术中存在的上述问题。本发明的技术解决方案是：一种基于混合特征提取的手写数字识别方法，包括以下步骤，s1、手写数字信息获取，对温度阵列手写数字输入终端进行手写数字信息的数据采集、预处理，随着手写数字的书写，采用温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化，判断落笔时刻和起笔时刻，消除无效数据帧；s2、手写数字混合特征提取，根据温度变化信息，对手指尖运动轨迹进行跟踪检测，在获得跟踪轨迹的基础上，提取手写数字的动态特征；同时对采集到的一个数字的多帧数据进行平均求和后，提取反映手写数字结构、比划特征等的静态特征；由此得到包括静态特征和动态特征的混合特征向量；s3、手写数字特征选择，对步骤s2得到的动态特征和静态特征进行分析，对特征向量归一化处理后，采用主分量分析法进行特征选择，选择能反映手写数字本质特征的主分量，构成手写数字的特征向量；s4、手写数字识别，将步骤s3得到手写数字的特征向量用于支持向量机svm分类器的训练或分类，实现对手写数字的识别。进一步地，步骤s1中，基于温度阵列手写数字输入终端的手写数字信息的获取与预处理，具体步骤如下：s11、计算机通过串口采集温度阵列输入终端的手写输入数据帧，并根据数据帧中温度的变化特征，去掉落笔前和起笔后的无效帧；s12、当一个数字书写完成后，将得到的多帧数据进行去噪处理，然后加权平均，得到一个手写数字的静态数据帧。进一步地，步骤s2中，动态特征提取步骤如下：首先，建立手写数字动态特征库，并给出每个特征的定义；其次，建立手写数字动态特征识别规则库；再次，用测试样本集对识别规则库进行测试，根据测试结果对特征和规则进行调整，直到满意的测试结果为止；最后，根据测试结果得出最优的动态特征。进一步地，步骤s2中，提取了手写数字的六个动态特征，分别为：特征一：起笔点与落笔点之间的距离；特征二：起笔点到落笔点的矢量方向；特征三：每个笔划矢量角度的代数和；特征四：相邻两笔划矢量的夹角；特征五：相邻两笔划矢量夹角绝对值的最大值；特征六：所有笔划矢量旋转方向的变化次数。进一步地，步骤s2中，采用粗网格特征提取方法提取手写数字的温度分布特征，即静态特征，首先对一个数字的多帧数据进行求和平均，然后把平均数据帧中的矩阵分成几个局部小区域，把每个小区域上的点阵密度作为描述特征，即统计每个小区域中图像像素所占百分比作为特征数据。进一步地，步骤s3进行手写数字特征选择，具体为：假设xi为第i个输入样本，用列向量表示，输入样本为x＝(x1,x2,…,xn)(1)s31、计算输入样本中所有的混合特征向量的平均向量；其中，n为输入样本的样本数量；s32、计算输入样本中每个特征向量与平均向量的向量差；s33、计算输入样本中特征向量的协方差矩阵；式中，d＝[d1,d2,…，di…,dn]，i为1到n间的一个整数；t表示向量转置；s34、采用奇异值分解方法计算测试样本特征向量协方差矩阵的非零特征值λj,及其对应的特征向量uj，j为1到r间的一个整数由此得到特征子空间为u＝[u1,u2,…,uj,…，ur](4)式中，r为选择的主特征向量的数目；s35、将训练样本或测试样本投影到特征子空间，即可得到被选择的特征向量：pi＝utdi(5)。进一步地，步骤s4中，手写数字识别的具体步骤如下：首先，设置支持向量机svm分类器的参数；其次，选择训练样本集，用于支持向量机svm分类器的训练，得到支持向量机svm模型；再次，采用测试样本集用训练得到的支持向量机svm模型进行分类，得到测试分类结果，即最终的识别结果。进一步地，对测试分类结果进行评估，包括对正确识别率和识别时间的评估，从而得到对识别方法的优劣判断：正确识别率越高，识别方法越好；识别时间越短，识别方法越好。进一步地，步骤s4中，采用一对一法实现多类支持向量机svm分类器，具体为：在任意两类样本之间设计一个支持向量机svm分类器，对k个类别的样本设计k(k-1)/2个支持向量机svm分类器。本发明的有益效果是，与现有技术相比，本发明不仅能够有效抑制环境噪声对在线识别产生的影响，同时避免了不同手写者、不同手写比划顺序等造成的误识别或拒识别，对不同人、不同手写笔顺的手写数字识别能够达到较高的正确识别率。附图说明图1是本发明实施例基于混合特征提取的手写数字识别方法的流程示意图。图2是实施例中温度传感阵列的说明示意图。图3是实施例中基于温度阵列手写输入终端得到的数据帧颜色分布示意图，颜色越红表示温度越高，颜色越蓝表示温度越低，其中，(a)为数字1的数据帧颜色分布示意图，(b)为数字7的数据帧颜色分布示意图。图4是实施例中手写数字轨迹示意图。图5是实施例中基于动态特征的手写数字识别规则示意图。图6是实施例中不同参数下的支持向量机svm分类器的识别率结果图，横坐标为惩罚因子，纵坐标为核函数参数，二位颜色分布图表示分类器识别率，其中，(a)为基于静态特征的支持向量机svm分类器识别率，(b)为基于动态特征的支持向量机svm分类器识别率，(c)为基于混合特征的支持向量机svm分类器识别率。具体实施方式下面结合附图详细说明本发明的优选实施例。实施例的基于混合特征提取的手写数字识别方法，首先根据手写过程中手指尖与温度阵列手写数字输入终端接触引起的温度变化特征，对采集到的数据帧进行预处理，去除落笔前和起笔后的无效帧。接下来收集了大量的测试样本，对动态特征的提取进行反复实验，得到能反映不同数字书写特征的六个动态特征。采用粗网格特征提取方法提取手写数字的温度分布特征，即静态特征。该特征对噪声有较强的容忍度，特别是对数字部分笔划的形变和孤立的噪声点不敏感。实施例进一步针对温度阵列手写输入终端，提出了基于混合特征的支持向量机svm分类器，该过程通过对训练集数据进行反复训练和参数选择，得到具有高分类正确率和强泛化能力的支持向量机svm模型。采用测试数据集对支持向量机svm分类器进行测试，得到具有高的测试正确率的混合特征支持向量机svm分类器。实施例结合图1，一种基于混合特征提取的手写数字识别方法，包括以下步骤：第一步，手写数字信息获取。即对温度阵列手写数字输入终端进行数据采集、预处理等。根据温度阵列输入终端传感器的特点，随着手写数字的书写，采集到的数据帧的值的分布随之变化，判断落笔时刻和起笔时刻，消除无效数据帧。温度阵列手写数字输入终端采用基于温度传感器阵列的手写数字输入终端，进行手写数字的数据采集。如图2所示，采用温度传感阵列，阵列大小为8×16作为手写输入终端，当手指接触输入终端，接触点的温度开始升高，随着手指移动，不同位置或区域的温度传感器的温度随之升高，由此得到一序列的具有不同温度分布的数据帧，如图3所示。第二步，手写数字混合特征提取。混合特征包括动态特征和静态特征。动态特征是表示手写数字过程中指尖的运动特征。选择了代表不同数字的手写比划特点的六个特征作为动态特征。在手写数字输入过程中，根据连续帧的温度变化，提取指尖运动轨迹，如图4所示，在此基础上进行动态特征的提取，如表1所示。表1基于温度传感阵列的手写数字动态特征特征数物理意义特征符号1手写数字起笔点与落笔点之间的距离；f12手写数字起笔点到落笔点的矢量方向；f23手写数字中每个笔划矢量角度的代数和；f34手写数字中相邻两笔划矢量的夹角；f45手写数字中相邻两笔划矢量夹角绝对值的最大值；f56手写数字中所有笔划矢量旋转方向的变化次数；f6并建立基于动态特征的手写数字识别规则，如表2、表3和图5所示，根据该规则，对训练数据集进行分类。根据分类效果选择最终的动态特征。表2基于动态特征的识别规则前项内容表3基于动态特征的手写数字分类规则表采用粗网格特征提取方法提取手写数字的温度分布特征，即静态特征。首先对一个数字的多帧数据进行求和平均。然后把平均数据帧中的矩阵分成几个局部小区域,把每个小区域上的点阵密度作为描述特征，即统计每个小区域中图像像素所占百分比作为特征数据。粗网格特征对噪声有较强的容忍度，特别是对数字部分笔划的形变和孤立的噪声点不敏感，并且有利于识别率的提高。这里实施例采用5×5的网格进行特征提取，得到25×1的静态特征向量。第三步，手写数字特征选择，即对第二步得到的动态特征和静态特征进行分析，选择能反映手写数字本质特征的主分量。采用主分量分析法，选择具有代表性的手写数字特征，得到降维的向量空间。具体为：假设xi为第i个输入样本，用列向量表示，输入样本为x＝(x1,x2,…,xn)(1)s31、计算输入样本中所有的混合特征向量的平均向量；其中，n为输入样本的样本数量；s32、计算输入样本中每个特征向量与平均向量的向量差；s33、计算输入样本中特征向量的协方差矩阵；式中，d＝[d1,d2,…，di…,dn]，i为1到n间的一个整数；t表示向量转置；s34、采用奇异值分解方法计算测试样本特征向量协方差矩阵的非零特征值λj,及其对应的特征向量uj，j为1到r间的一个整数由此得到特征子空间为u＝[u1,u2,…,uj,…，ur](4)式中，r为选择的主特征向量的数目；s35、将训练样本或测试样本投影到特征子空间，即可得到被选择的特征向量：pi＝utdi(5)。第四步，手写数字识别，即手写数字分类器的训练和分类。选择训练数据集对支持向量机svm分类器进行训练，输入为选择后的混合特征向量，输出为实际的数字。在训练过程中通过调节支持向量机svm分类器的参数包括惩罚因子和核函数参数，得到不同的训练精度，如图6所示，最后得到分类器的最优参数范围，建立支持向量机svm模型。对支持向量机svm模型，采用测试数据进行测试分类，测试分类结果是最终的识别结果。基于温度传感阵列的手写数字特征分类是一种非线性可分的多元(10个类别：数字0-9)分类问题。基本支持向量机svm只针对两类分类问题，为了实现多类分类，实施例采用一对一法实现多类支持向量机svm分类器，其做法是在任意两类样本之间设计一个支持向量机svm分类器，因此k个类别的样本就需要设计k(k-1)/2个支持向量机svm分类器，本实施例中需要构造45个支持向量机svm分类器。当对一个未知样本进行分类时，最后得票最多的类别即为该未知样本的类别。当训练样本量很大时，支持向量机svm分类器计算量会很大，为了减小其计算量，实施例采用了piatt的序列最小优化算法即smo算法。手写数字识别的具体步骤如下：首先，设置支持向量机svm分类器的参数；其次，选择训练样本集，用于支持向量机svm分类器的训练，得到支持向量机svm模型；再次，采用测试样本集用训练得到的支持向量机svm模型进行分类。最后，对测试分类结果进行评估，包括对正确识别率和识别时间的评估，从而得到对识别方法的优劣判断：正确识别率越高，识别方法越好；识别时间越短，识别方法越好。将基于混合特征的手写数字识别方法与基于动态特征的手写数字识别方法、基于静态特征的手写数字识别方法进行比较，得到图6、表4、表5所示的识别结果。表4基于混合特征的识别方法在不同分类器参数下的识别率表5三种识别方法的处理时间表识别方法*预处理时间(秒)特征提取时间(秒)分类时间(秒)总的处理时间(秒)svm10.013840.015030.0010560.02993svm20.013780.000360.0008340.01497svm30.013970.015040.0011370.03015*注：svm1是基于静态特征的识别方法；svm2是基于动态特征的识别方法；svm3是基于混合特征的识别方法。由图6可以看出，相比于基于动态特征或静态特征的手写数字识别方法，基于混合特征的手写数字识别方法在分类参数相同的情况，具有较高的识别率，并且在识别率高于99％时分类器参数的选择范围更广，因此该识别方法具有更高的识别稳定性和泛化能力。由表4可以看出，当分类器的参数满足以下条件：惩罚因子c〉1.48，核函数参数γ>0.01时，基于混合特征的手写数字识别方法的正确识别率大于95％；当分类器的参数满足以下条件：惩罚因子c〉1.48，核函数参数γ>0.1时，基于混合特征的手写数字识别方法的正确识别率达到100％。由表5可以看出，基于混合特征的手写数字识别方法的处理时间与基于静态特征的手写数字识别方法的处理时间相当，但正确识别率较高；基于混合特征的手写数字识别方法的处理时间大于基于动态特征的手写数字识别方法的处理时间，但基于混合特征的手写数字识别方法的正确识别率远远高于基于动态特征的手写数字识别方法。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王蕾
技术所有人：南京工程学院
我是此专利的发明人

上一篇：一种卡片收发装置的制造方法
上一篇：数据聚类方法、装置、计算机可读介质和电子设备与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。