一种手写输入字符辨识方法及系统的制作方法

文档序号:6571510阅读:256来源:国知局
专利名称:一种手写输入字符辨识方法及系统的制作方法
技术领域
本发明涉及字符辨识系统和方法,特别是一种手写输入字符辨识方法和系统,该方法及其系统可根据手写输入字符中各相邻笔划段之间夹角的切角对其输入笔划进行优化处理,以调整笔划段间结构和位置,实现手写输入字符辨识。
背景技术
随着科技的迅速发展,各种掌上型数据处理装置不断出现,如手机、个人数字处理(PDA)等掌上型电子产品几乎都具备手写字符识别功能。通常文字运算特征由输入设备撷取,运算特征可以是采样资料中的任何有用的结构特征信息或者其组合,其中基本结构特征包含特征点、笔划段及笔划等单元结构特征。
但是,由于输入设备或人为因素,会使得输入的字符包含许多引起辨识出错的误差噪声。通常的处理方法是,通过笔划于处理中的过滤算法误差噪声过滤掉,仅保留笔划的特征点和笔划段信息。所述过滤方法仅以笔划中点的方向走势确定方向值相接近的点为固定的笔划段,如果笔划曲折度较大,则在输入一个弧度较大的笔划时就会被分割成很多较短的笔划段。原本在同一方向笔划段完全可以被过滤掉,而通过此过滤方法会保留过多的笔划段,在模板资料中还表现为特征资料变得很大。此外,保留过多的特征点会增加误差,由于比对前一笔划段与后一笔划段需要参照点,因此使得特征比对时增加不必要的参照点影响。因此,目前的大多算法仅对于较直的笔划段有效,比如汉字等,而对于比如泰文字元及多种符号文字等曲折度过大的笔划效果不明显。由于在过滤处理后所保留的笔划段和特征点过多,进而使特征值增多,在比对模板时造成辨识速度缓慢,导致辨识率过低。

发明内容
针对上述现有技术存在的问题与缺陷,本发明目的在于,提供一种手写输入字符辨识方法及系统,该方法及其系统能够去除输入设备对笔迹的影响和人为因素的误差,提高手写辨识的处理速度以及辨识率。
为了实现上述任务,本发明采取如下的技术解决方案一种手写输入字符的辨识方法,其特征在于,该方法首先然后对手写输入字符进行辨识,包括下列步骤获取由复数个笔划段所组成的一手写输入字符,对手写输入字符的笔划进行误差噪声过滤、滤波,去除字符图像中不该出现的噪声;然后计算手写输入字符的各相邻笔划段之间夹角的切角,通过手写输入字符各相邻笔划段之间所形成夹角的切角对输入笔划进行处理,以调整笔划段间的结构和位置;连续判断所述切角以找出一长直笔划所在位置,确定长直笔划的起点与终点连接的斜率,其中长直笔划段为一个方向上的且至少包含三个以上的笔划段;删除与长直笔划斜率差值最小的笔划段,并连接手写输入字符中剩余的笔划段;及进而撷取手写输入字符的特征信息进行计算,给出笔划段特征序列,并浏览模板数据库中的所有模板资料,使得计算结果与其中一标准模板进行比对,得到手写输入字符的最终辨识结果。
实现上述方法的手写输入字符辨识系统,该系统包括一输入设备,用于接收一手写输入字符;一预处理模块,用于对手写输入字符进行误差噪声过滤、滤波,去除字符图像中不该出现的噪声;
一模板数据库,用于储存复数个标准模板;一识别模块,用于对手写输入字符笔划段进行特征信息计算,并对特征信息与模板数据库的一标准模板进行比对,以调整笔划段间的结构和位置,撷取手写输入字符的特征信息进行手写输入字符辨识,并将辨识结果保存至储存装置或通过显示装置显示辨识结果;输入设备通过预处理模块与识别模块连接,模板数据库连接在识别模块上,识别模块还分别与储存装置和显示装置相连。
本发明的输入字符的辨识方法和系统,使用笔划各部分笔划段夹角的切角来计算并处理笔划段间的结构和位置,对已知的辨识方法中不合理因素进行最佳化处理,可去除输入设备对笔迹的影响和人为因素的误差,减少系统辨识误差的产生。此外,以切角作为过滤依据过滤掉更多的冗余笔划段,使得特征数据减少,有效地除去更多的误差点,进而提供更好的比对机制,降低辨识误差,提高了手写辨识的处理速度以及辨识率。


图1为本发明的手写输入字符辨识系统方框图;图为2本发明的手写输入字符辨识方法流程图;图3为本发明的手写输入字符的笔划处理方法流程图;图4为以泰文字体为例的一个处理实施例,其中图(a)为一正规体泰文字体示意图;图(b)为用户手写泰文字体笔迹示意图;图(c)为通过常规的过滤算法对图(a)所示的手写泰文字体笔迹处理后所得到的辨识输出显示图形,图(d)为采用本发明手写输入字符的笔划处理方法对图(b)所示手写泰文字体笔迹处理后得到的辨识输出显示图形。
上述图中的标号分别表示10、手写输入字符辨识系统,12、输入设备,14、预处理模块,16、识别模块,18、模板数据库,20、显示装置,22、储存装置;
以下结合附图和发明人给出的实施例对本发明作进一步的详细说明。
具体实施例方式
本发明的原理是利用相邻两笔划段所夹角的切角,作为过滤依据去除多余误差特征数据,以提高辨识率和速度。
参见图1,该图为本发明给出的一种手写输入字符辨识系统的方块图,如图所示,该手写输入字符辨识系统10包括一输入设备12、一预处理模块14、一识别模块16以及一模板数据库18,使用者通过在输入设备12的手写板上书写文字得到手写输入字符,然后输入设备12把手写板上的所有手写输入字符信息采样后经由串行或并行接口送入预处理模块14中。预处理模块14对手写输入字符进行包括误差噪声过滤、滤波的预处理操作,进而将字符图像中不该出现的噪声去除。接着识别模块16对预处理后的手写输入字符进行特征信息撷取,这里,辨识模块16在撷取手写输入字符的特征信息时,首先获取由复数个笔划段所组成的手写输入字符,通过手写输入字符中各相邻笔划段之间夹角的切角对手写输入字符的笔划进行处理,以调整笔划段间的结构和位置,即,计算手写输入字符各相邻所述笔划段之间夹角的切角,连续判断切角以找出一长直笔划所在,长直笔划由一个方向上的且至少包含三个以上的笔划段组成,然后确定长直笔划的起点与终点连接的斜率,删除与长直笔划斜率差值最小的笔划段,对剩余的笔划段进行连接即得到手写输入字符的特征笔划段信息。然后,辨识模块16对手写输入字符特征信息进行计算,给出笔划段的特征序列,并浏览模板数据库18中的所有模板资料,使得计算结果与其中一标准模板进行比对,得到最终辨识结果。最后将辨识结果保存到一储存装置22中,或者通过一显示装置20显示手写输入字符的辨识结果。通过上述操作对手写输入字符笔划进行处理,将相邻两笔划段的夹角的切角作为过滤依据,可以在垂直和水平方向上使得可用笔划段的特征更能体现文字的特性,滤掉因不同人的书写习惯或输入设备造成的误差,进而提高了比对精确度,特征值资料量的减少也提高了比对时的速度。
参见图2,该图为图1的手写输入字符辨识方法流程图,首先对手写输入字符进行预处理操作,即对输入字符进行误差噪声过滤、滤波处理(步骤101),然后通过手写输入字符各相邻笔划段之间所形成夹角的切角对输入笔划进行处理,以调整笔划段间的结构和位置(步骤102),进而撷取手写输入字符的特征信息进行手写输入字符辨识(步骤103)。在进行手写输入字符辨识时,需要计算手写输入字符的笔划段特征,并给出笔划段的特征序列描述待辨识(步骤104),在步骤105中,浏览模板资料对特征信息进行比对,其中需要计算手写输入字符的特征信息与各个模板资料中的字符特征信息的距离大小,距离越小表示比对率越高,然后根据距离排序输出辨识结果(步骤106)。
下面结合图3和图4a至图4d对本发明手写输入字符的笔划处理方法进行说明。
图3为本发明的手写输入字符的笔划处理方法流程图,即图2中所述的步骤102实现的具体步骤。图4a至图4d为本发明手写输入字符辨识方法一实施例的详细示意图,其中图4a为一正规体泰文字体示意图,图4b为用户手写泰文字体笔迹示意图,图4c为通过已知过滤算法对图4b所示手写泰文字体笔迹处理后所得到的辨识输出显示图形,其中①、②、③处的笔段为误差笔段对辨识造成干扰,滤波中由于此笔段在文字笔划中所占比例较大被保留下来,此误差会增大特征提取后数据,降低辨识模板的命中率,也使辨识速度减慢。而图4d为采用本发明手写输入字符的笔划处理方法对图4b所示手写泰文字体笔迹处理后得到的辨识输出显示图形。在利用已知过滤算法进行手写输入字符辨识时,特征提取一般而言是在手写输入字符笔划预处理后进行特征点、笔划段或/和笔划信息提取,但是上述特征提取对于曲折度过大的笔划效果不明显。由图3可知,本发明的手写输入字符辨识方法通过手写输入字符中各相邻笔划段之间夹角的切角对其输入笔划进行处理,以调整笔划段间的结构和位置,首先获取由复数个笔划段所组成的手写输入字符(步骤201),然后通过各相邻笔划段的坐标计算两笔划段之间的斜率(步骤202),进而得到两笔划段所在的坐标象限值(步骤203)。然后通过两笔划段的象限值和斜率计算出两笔划段夹角的余角,进而求出其切角(步骤204)。在计算出所有相邻两笔划段夹角的切角后,判断连续的各切角,最大角为转折角,进而找出长直笔划的所在,即为一个方向上的且至少包含三个以上的笔划段(步骤205)。得到长直笔划中起点和终点联机斜率及其在坐标系中的象限值(步骤206),最后删除与长直笔划斜率差值最小的笔划段,连接手写输入字符中剩余的笔划段即得到如图4d所示的手写输入字符的特征信息(步骤206)。从图4c与图4d所显示的图形可以看出,本发明的手写输入字符的笔划处理方法不仅可以过滤掉更多的冗余笔划段,又可以突显手写输入字符的特征信息,进而提高了辨识的处理速度以及辨识率。
虽然本发明以上述较佳的实施例做出了详细的描述,并非用上述实施例限定本发明。本领域的技术人员应当意识到在不脱离本发明技术方案所给出的技术特征和范围的情况下,对技术特征所作的增加、或以本领域一些同样内容的替换,均应属本发明的保护范围。
权利要求
1.一种手写输入字符的辨识方法,其特征在于,该方法首先然后对手写输入字符进行辨识,包括下列步骤获取由复数个笔划段所组成的一手写输入字符,对手写输入字符的笔划进行误差噪声过滤、滤波,去除字符图像中不该出现的噪声;然后计算手写输入字符的各相邻笔划段之间夹角的切角,通过手写输入字符各相邻笔划段之间所形成夹角的切角对输入笔划进行处理,以调整笔划段间的结构和位置;连续判断所述切角以找出一长直笔划所在位置,确定长直笔划的起点与终点连接的斜率,其中长直笔划段为一个方向上的且至少包含三个以上的笔划段;删除与长直笔划斜率差值最小的笔划段,并连接手写输入字符中剩余的笔划段;及进而撷取手写输入字符的特征信息进行计算,给出笔划段特征序列,并浏览模板数据库中的所有模板资料,使得计算结果与其中一标准模板进行比对,得到手写输入字符的最终辨识结果。
2.权利要求1所述的手写输入字符辨识方法的系统,其特征在于,该系统包括一输入设备,用于接收一手写输入字符;一预处理模块,用于对手写输入字符进行误差噪声过滤、滤波,去除字符图像中不该出现的噪声;一模板数据库,用于储存复数个标准模板;一识别模块,用于对手写输入字符笔划段进行特征信息计算,并对特征信息与模板数据库的一标准模板进行比对,以调整笔划段间的结构和位置,撷取手写输入字符的特征信息进行手写输入字符辨识,并将辨识结果保存至储存装置或通过显示装置显示辨识结果;输入设备通过预处理模块与识别模块连接,模板数据库连接在识别模块上,识别模块还分别与储存装置和显示装置相连。
全文摘要
本发明公开了一种手写输入字符辨识方法及系统,通过手写输入字符中各相邻笔划段之间夹角的切角对其输入笔划进行处理,以调整笔划段间的结构和位置,进而撷取手写输入字符的特征信息进行辨识。本发明使用笔划各部分笔划段夹角的切角来计算并处理笔划段间的结构和位置,对已知辨识方法的不合理因素进行最佳化处理,可去除输入设备对笔迹的影响和人为因素的误差,有效地除去更多的误差点,提高手写辨识的处理速度以及辨识率。
文档编号G06K9/72GK101030261SQ200710017598
公开日2007年9月5日 申请日期2007年3月30日 优先权日2007年3月30日
发明者陈淮琰, 公学雷, 赵永国 申请人:无敌科技(西安)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1