手写字符的电子识别方法

文档序号:6633673阅读:314来源:国知局
手写字符的电子识别方法
【专利摘要】一种手写字符的电子识别方法,包括如下步骤:S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;S12,对所述图像信息进行几何矫正,得到矫正字符;S13,根据所述矫正字符的特征进行匹配识别。本发明应用到答题卡识别领域能够准确的分割手写英文字符及阿拉伯数字,避免了手写分割的难点,使得脱机手写识别的应用成为了可能,本发明简单快速的字符的特征提取方法能够快速的提取英文字符的特征,使得此类方法能够应用到一些计算能力有限的设备,极大的提高了手写识别的应用范围。
【专利说明】手写字符的电子识别方法

【技术领域】
[0001]本发明涉及答题卡图像识别处理的【技术领域】,具体涉及一种手写字符的电子识别方法。

【背景技术】
[0002]现有技术中答题卡可以识别2B铅笔填涂的图形,而不能够识别手写内容,然而现有技术中能够识别个别内容也是基于规范性书写或者特殊训练的书写形式;由于每个人的书写习惯不同导致英文字符的分割成为手写识别中的难点,现有的方法尚不能准确的分割不同情况的英文及字母等字符图形,目前的英文字符特征提取方法主要提取字符的几何信息或者几何特征,然后对这些特征进行分类处理,但由于每个人的习惯的不同导致这些方法需要训练每个人的手写字体,并不能保证良好的适用性,故此无法应用到答题卡领域中,无法在答题评分方面的手写识别方面应用。


【发明内容】

[0003]本发明的目的是提供一种手写字符的电子识别方法,以克服现有技术存在的上述不足。
[0004]本发明的目的是通过以下技术方案来实现的:
[0005]一种手写字符的电子识别方法,包括如下步骤:
[0006]S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;
[0007]S12,对所述图像信息进行几何矫正,得到矫正字符;
[0008]S13,根据所述矫正字符的特征进行匹配识别。
[0009]优选的,Sll中,预设的所述分割线答题卡具体为手写区域内设有单个字符的制定字符框;所述制定字符框内设有横向辅助分割线;所述字符框为实体线框或电子虚拟线框;所述横向辅助分割线为实体线段或虚拟线段。
[0010]更加优选的,获取所述图像信息的具体方法为:
[0011]S31,通过相机获取写有字符的所述分割线答题卡图案;
[0012]S32,提取所述制定字符框内的字符信息,得到所述图像信息。
[0013]更加优选的,对所述图像信息进行几何矫正,得到矫正字符的方法具体为:
[0014]S41,基于所述制定字符框内设有横向辅助分割线,将所述图像信息进行去边框、方向矫正处理;
[0015]S42,根据预设定的字符模板对所述图像信息进行对比处理,得到矫正字符。
[0016]更加优选的,根据所述矫正字符的特征进行匹配识别的方法具体为:
[0017]S61,提取所述矫正字符在所述制定字符框内的位置,作为第一特征;所述位置具体为所述制定字符框内被两条以上所述横向辅助分割线划分的区域;
[0018]S62,在所述制定字符框内设有中心垂直识别线和水平识别线;提取所述矫正字符与所述垂直识别线的交点个数,作为垂直交点数;所述矫正字符与所述水平识别线的交点个数,作为水平交点数;所述垂直交点数和所述水平交点数作为第二特征;
[0019]S63,基于所述第一特征和所述第二特征与预设定的字符进行匹配,得到识别字符。
[0020]根据权利要求4所述的手写字符的电子识别方法,其特征在于,
[0021]S62中,所述垂直识别线为三条以上;所述水平识别线为三条以上。
[0022]更加优选的,当所述横向辅助分割线为两条时,
[0023]所述第一特征分为如下六类;所述六类的判断具体为:
[0024]只占中间一格的作为第一类,包括:小写字母中的a、C、e、m、η、O、r、S、U、V、W、X和z ;
[0025]占上两格的作为第二类;包括小写字母中的b、d、h、1、k、I和t ;大写字母中的A_Z ;
[0026]占下两格的作为第三类;包括小写字母中的g、p、q和y,符号中的冒号和分号;
[0027]占三格的作为第四类;包括小写字母中的f和j ;阿拉伯数字中的0-9 ;标点符号中的问号和感叹号;
[0028]只占下面一格作为第五类;包括符号中的逗号和句号;
[0029]只占上面一格作为第六类;包括符号中的双引号和单引号。
[0030]更加优选的,S63,基于所述第一特征和所述第二特征与预设定的英文字母、阿拉伯数字或标点符号进行匹配,得到识别字符的方法具体为:
[0031 ] S81,按照从左边到右边的书写上、下、左、右的顺序进行所述第一特征和所述第二特征的识别;
[0032]S82,按照所述第一特征识别字符的分类;
[0033]S83,根据字符的分类,在字母所占区域上、中、下位置,在所占区域的宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线;
[0034]S84,通过三条横向识别线、三条纵向识别线与字符书写轨迹的交点数量及所述交点的次序与预设定的字符进行匹配,得到识别字符。
[0035]更加优选的,当所述字符为第一类、第五类或第六类时,所述垂直识别线为三条;所述水平识别线为三条;
[0036]当所述字符为第二类或第三类时,所述垂直识别线为三条;所述水平识别线为六条;
[0037]当所述字符为第四类时,所述垂直识别线为三条;所述水平识别线为九条;
[0038]更加优选的,所述辅助分割线为两条以上。
[0039]本发明的有益效果为:
[0040]本发明应用到答题卡识别领域能够准确的分割手写英文字符及阿拉伯数字,避免了手写分割的难点,使得脱机手写识别的应用成为了可能,本发明简单快速的字符的特征提取方法能够快速的提取英文字符的特征,使得此类方法能够应用到一些计算能力有限的设备,极大的提高了手写识别的应用范围。

【专利附图】

【附图说明】
[0041]图1是本发明的手写字符的电子识别方法的流程示意图;
[0042]图2为本发明预设的分割线答题卡结构示意图;
[0043]图3为本发明填写有手写字符的分割线答题卡结构示意图;
[0044]图中:1-第一水平识别线,2-第二水平识别线,3-第二水平识别线,4-辅助分割线,5-垂直识别线。

【具体实施方式】
[0045]如图1所示,本发明是所要解决的技术问题是提出了手写字符的电子识别方法,为了克服脱机手写识别中字符分割的难点,本发明预设了分割线答题卡;
[0046]本发明公开的手写字符的电子识别方法,包括如下步骤:
[0047]步骤1:设计标准的英文书写模板,并根据模板来设计字符分割算法。
[0048]步骤2:对分割出的字符进行几何矫正,得到标准方向和大小的字符。
[0049]步骤3:针对英文字符书写的规则,设计了一种基于分割投影的字符特征提取方法,该方法从垂直方向和竖直方向提取英文字符与分割线的交点个数作为字符的特征,最后对提取出的特征进行分类识别。
[0050]其中步骤I中所述标准的分割线答题卡如图2所示,传统手写识别方法中一大难题在于手写字母的不规范性和连笔书写,本设计基于英文或阿拉伯数字的“四线三格”基本书写规范,设计分割式书写区域,确保识别的可分割性。
[0051]其中步骤I中所述的字符分割算法具体为首先对由于拍摄而产生的答题卡及文字的变形进行矫正,然后提取制定区域的字符文字,这样能够保证准确的将书写的英文字符进行分割,避免了因书写习惯不同而导致的字符分割难的问题。
[0052]其中步骤2中所述的几何矫正是针对分割出来的字符进行一些去边框和旋转等操作。
[0053]其中步骤3中所述的英文字符判断和识别流程如下。传统手写英文字母的识别方式多集中在对字母书写笔画走势的判别上,本设计基于字母书写所处区域以及“交点”理论,通过判定字母书写在设计模板中的位置,以及书写区域内“识别线”与字母书写轨迹的“交点”个数实现对字母的识别判定。
[0054]首先,提取英文字符在3行中占的格子数,作为字符的第一类特征。针对书写规范可以分为只占中间一格的字母包括a、C、e、m、η、O、r、S、U、V、W、χ和ζ,占上两格的字母包括13、(1、]1、;[、1^、1和t,占下两格的字母包括g、p、q和Y,占二格的字母包括f和j ;另外,识别线区分不出字母的,如b和d,单靠交点个数无法判定字母的,通过交点的先后位置判断,上格交点位置在左侧的,为b,交点在右侧的,为d ;
[0055]其次,提取垂直方向和水平方向识别线与英文字符的交点数作为特征。默认字母书写上下左右最边缘像素为起止点,在字母宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线,通过识别线与字母书写轨迹的交点,判定字母,以字母C为例,如图3所示:
[0056]横向设置三条识别线,纵向设置一条识别线,若三条横线与字母轨迹交点均为2个,则可判定字母为0,若识别横线1、3与字母轨迹交点为2,识别横线2与字母轨迹交点为I,则判定字母为C。
[0057]以字母w为例:若字母书写只占中间一格,取横线识别线后,1/2识别线与字母轨迹有四个横向交点,贝1J判定字母为W。
[0058]以上通过具体的和优选的实施例详细的描述了本发明,但本领域技术人员应该明白,本发明并不局限于以上所述实施例,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种手写字符的电子识别方法,其特征在于,包括如下步骤: S11,获取预设的分割线答题卡上或空白区域内手写字符的图像信息;所述分割线为实体分割线段或电子虚拟分割线段;所述手写字符包括英文字母、阿拉伯数字和标点符号;S12,对所述图像信息进行几何矫正,得到矫正字符; S13,根据所述矫正字符的特征进行匹配识别。
2.根据权利要求1所述的手写字符的电子识别方法,其特征在于: Sll中,预设的所述分割线答题卡具体为手写区域内设有单个字符的制定字符框;所述制定字符框内设有横向辅助分割线;所述字符框为实体线框或电子虚拟线框;所述横向辅助分割线为实体线段或虚拟线段。
3.根据权利要求2所述的手写字符的电子识别方法,其特征在于, 获取所述图像信息的具体方法为: S31,通过相机获取写有字符的所述分割线答题卡图案; S32,提取所述制定字符框内的字符信息,得到所述图像信息。
4.根据权利要求3所述的手写字符的电子识别方法,其特征在于, 对所述图像信息进行几何矫正,得到矫正字符的方法具体为: S41,基于所述制定字符框内设有横向辅助分割线,将所述图像信息进行去边框、方向矫正处理; S42,根据预设定的字符模板对所述图像信息进行对比处理,得到矫正字符。
5.根据权利要求4所述的手写字符的电子识别方法,其特征在于, 根据所述矫正字符的特征进行匹配识别的方法具体为: S61,提取所述矫正字符在所述制定字符框内的位置,作为第一特征;所述位置具体为所述制定字符框内被两条以上所述横向辅助分割线划分的区域; S62,在所述制定字符框内设有中心垂直识别线和水平识别线;提取所述矫正字符与所述垂直识别线的交点个数,作为垂直交点数;所述矫正字符与所述水平识别线的交点个数,作为水平交点数;所述垂直交点数和所述水平交点数作为第二特征; S63,基于所述第一特征和所述第二特征与预设定的字符进行匹配,得到识别字符。
6.根据权利要求4所述的手写字符的电子识别方法,其特征在于, S62中,所述垂直识别线为三条以上;所述水平识别线为三条以上。
7.根据权利要求6所述的手写字符的电子识别方法,其特征在于,当所述横向辅助分割线为两条时, 所述第一特征分为如下六类;所述六类的判断具体为: 只占中间一格的作为第一类,包括:小写字母中的a、C、e、m、η、O、r、S、U、V、W、χ和z ; 占上两格的作为第二类;包括小写字母中的b、d、h、1、k、I和t ;大写字母中的A-Z ; 占下两格的作为第三类;包括小写字母中的g、P、q和y,符号中的冒号和分号; 占三格的作为第四类;包括小写字母中的f和j ;阿拉伯数字中的0-9 ;标点符号中的问号和感叹号; 只占下面一格作为第五类;包括符号中的逗号和句号; 只占上面一格作为第六类;包括符号中的双引号和单引号。
8.根据权利要求7所述的手写字符的电子识别方法,其特征在于, S63,基于所述第一特征和所述第二特征与预设定的英文字母、阿拉伯数字或标点符号进行匹配,得到识别字符的方法具体为: S81,按照从左边到右边的书写上、下、左、右的顺序进行所述第一特征和所述第二特征的识别; S82,按照所述第一特征识别字符的分类; S83,根据字符的分类,在字母所占区域上、中、下位置,在所占区域的宽度或高度的1/3、1/2、2/3处平均取三条横向识别线、三条纵向识别线; S84,通过三条横向识别线、三条纵向识别线与字符书写轨迹的交点数量及所述交点的次序与预设定的字符进行匹配,得到识别字符。
9.根据权利要求8所述的手写字符的电子识别方法,其特征在于, 当所述字符为第一类、第五类或第六类时,所述垂直识别线为三条;所述水平识别线为二条; 当所述字符为第二类或第三类时,所述垂直识别线为三条;所述水平识别线为六条; 当所述字符为第四类时,所述垂直识别线为三条;所述水平识别线为九条;
10.根据权利要求3或4所述的手写字符的电子识别方法,其特征在于, 所述辅助分割线为两条以上。
【文档编号】G06K9/20GK104463157SQ201410632470
【公开日】2015年3月25日 申请日期:2014年11月7日 优先权日:2014年11月7日
【发明者】邓振宇, 邓雨婷, 邓天泽 申请人:李宇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1