一种手写输入中确定待选字的方法及装置的制作方法

文档序号:6434638阅读:150来源:国知局
专利名称:一种手写输入中确定待选字的方法及装置的制作方法
技术领域
本发明涉及电子设备输入技术领域,尤其涉及一种手写输入中确定待选字的方法及装置。
背景技术
目前,向电子终端中录入数据主要通过键盘输入和手写输入两种方法。手写输入相对键盘输入更符合中国人的书写习惯,因而各种快速手写输入方法应运而生。汉字是一种方块字,具有特殊的形体结构,按层次从高到底的顺序,汉字形体结构可分为整字、部件和笔划。相应地,汉字手写输入法可大致分为3类基于整字识别的手写输入法、基于部件识别的手写输入法和基于笔划识别的手写输入法。基于整字识别的手写输入法是将用户输入的完整汉字通过识别系统进行样本或模板匹配,以相似性最大、差异性最小的匹配样本作为识别的结果,具有输入笔划多且识别复杂的特点,识别效率和准确率比较低。基于笔划序列的汉字手写输入法只考虑笔划本身以及笔划与笔划间顺序,而不考虑汉字的空间结构信息,虽然对用户的书写规范性要求不高,但是识别效率比较低。基于部件识别的手写输入法通过识别用户输入的部件,得到包含该部件的候选字,可减少用户输入的笔划数,相对于另外两种手写输入法识别效率和准确率要高。现有技术中提供一种速汉字手写输入法,其具体实现方式是将汉字按部首和区位进行编码以组成编码字库。书写区域内的每个田字格区域被划分为16个部首区位,用户输入一个部首,将得到部首编码和部首区位编码组成的编码串,将该编码串作为查找关键字在编码字库中查找得到满足条件的所有汉字。这种速汉字手写输入法可在一定程度上提高汉字手写输入速度,但是,它应用汉字按部首和区位信息来进行编码,会存在编码字库实现复杂、存储占用空间比较大,用户必须在正确的小方格区域内书写部首才能找到预输入汉字等问题。例如,汉字“部”的编码由3个部首编码和3个部首所在位置的区位编码组成,假设用户在书写区域的左上角书写“立”,根据包含“立”的部首编码和左上角区位编码的编码串,可从编码字库中查询得到左上角位置为“立”的汉字序列,进而找到“部”。如果用户在书写区域的左半部书写“立”,根据包含“立”的部首编码和左半部区位编码的编码串,则不能从编码字库中查询得到“部”的汉字序列。上述汉字手写输入法对书写位置有严格要求, 如果部首书写位置不正确,就无法得到欲输入汉字。在手提式终端设备中,因为书写区域较小,用户书写规范性比较难保证,所以导致上述方法应用存在困难。

发明内容
本发明提供一种手写输入中确定待选字的方法及装置,解决现有技术中手写输入终端因为书写区域较小,用户书写规范性难保证,从而导致手写输入识别困难的问题。本发明提供一种手写输入中确定待选字的方法,所述方法应用于包括有手写输入设备的智能设备中,包括
根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功, 则根据获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定;按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。根据上述方法本发明还提供一种手写输入中确定待选字的装置,该装置包括输入模块,用于根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;部首确定模块,用于将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功,则根据获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定;候选字确定模块,用于按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。上述技术方案中的一个或两个,至少具有如下技术效果首先本发明所提供的方法和装置存储根据用户个人手写习惯生成的个人部首笔迹样本,字库实现简单且存储空间小,不需要对字库中的汉字进行编码,只需将字库按部首索引以方便检索;另外,由于每个用户的笔迹都有稳定、明显的个人特征,将用户的部首笔迹作为匹配样本,可减少匹配次数,提高匹配效率,并且能够提高汉字手写输入法的识别效率和准确率、减少字库存储空间;进一步因为将用户书写部首笔迹和汉字部首建立一一对应关系,使得用户书写更随意, 具有用户自适应的特点。


图1为本发明实施例一种手写输入中确定待选字的方法的流程图;图2为应用本发明实施例所提供的方法进行手写输入的实现方法的流程图;图3为本发明实施例用户输入部首的示意图;图4为本发明实施例一种手写输入中确定待选字的装置的结构示意图。
具体实施例方式本发明实施例提供一种手写输入中确定待选字的方法,该方法包括根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功,则根据获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定;按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。如图1所示,本发明实施例提供一种手写输入中确定待选字的方法,所述方法应用于包括有手写输入设备的智能设备中,下面结合说明书附图对本发明的具体实施方式
进行详细说明步骤101,根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;
在本发明实施例中在用户输入汉字时,根据系统提示首先输入预输入汉字的偏旁部首。并且用户在输入部首时,需要根据预输入汉字的字形结构将部首写在输入设备的对应位置。例如,需要输入“部”字,则首先输入“卩”;并且在“部”的字形结构中,1 ”在右半部,所以在输入“部”字时,则将“卩,,写在输入设备的右半部。步骤102,将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功,则根据获取所述个人笔迹样本对应的部首索引号;因为个人手写输入习惯的不同,如果系统只是保存一个标准的系统部首笔迹库, 则在识别每个用户的输入内容时会比较困难,所以在本发明实施例中,建立了一个能够体现个人书写习惯的个人笔迹样本。所述个人笔迹样本由用户输入的部首笔迹确定。另外,因为即使同一个人在输入同一个部首时,也不能每次都相同,所以在本发明实施例中所述个人笔迹样本中可以存储同一部首的不同写法,从而提高系统对输入笔迹的辨识度。在本发明实施例中建立个人笔迹样本的具体实现方法可以是当接收到用户输入的部首后,确定所述部首的部首笔迹,并用所述部首笔迹与已存的个人笔迹样本进行匹配,如果匹配到相同的,则显示输出包含已识别部首的候选字序列;如果没有,则根据用户的输入信息从待选部首序列中确定输入部首,并查询所述输入部首是否已存在部首字迹样本,如果所述输入部首已存在部首字迹样本,则更新部首字迹样本;如果所述输入部首不存在部首字迹样本,则保存部首字迹样本。部首103,按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。因为包括同一部首的汉字相对较多,所以在通过部首确定一部分汉字之后,本发明实施例所提供的方法还进一步对候选字进行排序,具体的排序条件包括以下几种(1)从所述部首信息中获取所述部首的输入坐标,并根据该输入坐标判断所述预输入汉字的字形结构;根据所述字形结构,将所述候选字中为所述字形结构的汉字优先排列。(2)若接收到用户输入所述预输入汉字除所述部首外的剩余汉字首笔划,则根据所述剩余笔划的首笔划,将所述候选字中除部首外与所述首笔划相同的汉字优排列。(3)根据用户使用情况的不同,每个用户都存在一些常用字,在候选字包括N个, 并N个候选字中每个候选字都对应有使用频度值。则本实施例还根据所述N个候选字的使用频度值对所述N个候选字排序,其中,排序中第M-I个候选字的使用频度值大于或等于排序中第M个候选字的使用频度值,所述M是大于2小于或等于N的整数。在具体的应用中,可以任选其中一种或两种对候选字进行排序,也可以是以上三种排序方法自由组合后对候选字进行排序。根据汉字字形以及使用频率等原因,在对候选字进行排序时,可以根据以下判断方式选择排序的方法如果用户书写部首的坐标能很好的反映预输入汉字的字形结构,则采用汉字字形结构对候选字序列排序。如果包含该部首的汉字使用频度很高,则采用用户频度记录对候选字序列排序。如果用户输入完部首后再输入剩余汉字首笔划,则采用剩余汉字首笔划对候选字序列排序。
如图2所示,当预输入汉字为“部”时,本发明实施例所提供的一种手写输入中确定待选字的方法,包括步骤201,接收用户在输入设备右半部分输入的部首“卩”,并记录部首信息,该部首信息为部首笔迹(如图3所示)以及输入部首的坐标。步骤202,将部首笔迹与存储的个人笔迹样本进行匹配,并在确定所述个人笔迹样本对应的部首索引号;步骤203,按所述部首索引号获取包含“卩”的汉字序列。在本实施例中获取到的汉字序列可以包括Xl {队邓阴郊部陪都…}因为“部”的字形结构是比较明显的左右结构,则从输入设备右半部分输入“卩”可以确定进一步的确定预输入汉字的结构,则进一步包括步骤204,从所述部首信息中获取所述部首的输入坐标,并根据该输入坐标判断所述预输入汉字的字形结构;根据所述字形结构,将所述候选字中为所述字形结构的汉字优先排列。经过进一步优化排列之后,候选字序列的排列则可以为Xl {邓郊部都队阴陪…}。如果还需要进一步的确定预输入汉字的结构,更准确的定位预输入汉字,则该方法还可以在用户输入所述预输入汉字除所述部首外的剩余汉字首笔划后,若用户在输入叩”之后又输入剩余字首笔划“、”,则进一步包括步骤205,根据所述剩余笔划的首笔划,将所述候选字中除部首外与所述首笔划相同的汉字优排列。经过进一步优化排列之后,候选字序列的排列则可以为Xl {郊部陪邓都队阴…}。如图4所示,根据图1所示的方法,本发明实施例还提供一种手写输入中确定待选字的装置,该装置包括输入模块401,用于根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;部首确定模块402,用于将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功,则获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定,并且所述个人笔迹样本与部首索引号对应;候选字确定模块403,用于按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。因为用户在输入部首时,是根据预输入汉字的字形结构输入的,所以本发明实施例所提供的装置还进一步包括对候选字进行排序的模块字形结构排序模块404,用于从所述部首信息中获取所述部首的输入坐标,并根据该输入坐标判断所述预输入汉字的字形结构;根据所述字形结构,将所述候选字中与所述字形结构相同的汉字优先排列。另外,如果用户输入完部首后再输入剩余字首笔划,则可采用剩余字首笔划对候选字序列排序。剩余笔划排序模块405,用于若接收到所述预输入汉字除所述部首外的剩余汉字首笔划,根据所述剩余笔划,将所述候选字中与所述剩余汉字首笔划相同的汉字优先排列。因为根据用户使用情况的不同,每个用户都存在一些常用字,所以本发明实施例所提供的装置,还包括使用频度排序模块406,用于在候选字包括N个,并N个候选字中每个候选字都对应有使用频度值,根据所述N个候选字的使用频度值对所述N个候选字排序,其中,排序中第M-I个候选字的使用频度值大于或等于排序中第M个候选字的使用频度值,所述M是大于2小于或等于N的整数。由于每个用户的笔迹都有稳定、明显的个人特征,将用户的部首笔迹作为匹配样本,可减少匹配次数,提高匹配效率;所以本发明实施例提供的装置还包括个人笔迹样本确定模块407,用于在接收到用户输入的部首后,确定已存的个人笔迹样本中是否包括所述部首,如果包括,则显示输出包含已识别部首的候选字序列;如果没有,则根据用户的输入信息从待选部首序列中确定输入部首,并查询所述输入部首是否已存在部首字迹样本,如果所述输入部首已存在部首字迹样本,则更新部首字迹样本;如果所述输入部首不存在部首字迹样本,则保存部首字迹样本。本申请实施例中的上述一个或多个技术方案,至少具有如下的技术效果本发明实施例所提供的方法和装置,首先存储根据用户个人手写习惯生成的个人部首笔迹样本,字库实现简单且存储空间小,不需要对字库中的汉字进行编码,只需将字库按部首索引以方便检索;另外,由于每个用户的笔迹都有稳定、明显的个人特征,将用户的部首笔迹作为匹配样本,可减少匹配次数,提高匹配效率,并且能够提高汉字手写输入法的识别效率和准确率、减少字库存储空间;进一步因为将用户书写部首笔迹和汉字部首建立一一对应关系,使得用户书写更随意,具有用户自适应的特点。另外,本发明实施例所提供的方法和装置还应用汉字字形结构、用户频度记录和剩余字首笔划对包含同一部首的候选字序列进行优化排序,使得排序后的候选字更加准确,并能够体现用户的输入习惯。本发明所述的方法并不限于具体实施方式
中所述的实施例,本领域技术人员根据本发明的技术方案得出其它的实施方式,同样属于本发明的技术创新范围。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种手写输入中确定待选字的方法,所述方法应用于包括有手写输入设备的智能设备中,其特征在于,包括根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功,则获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定,所述个人笔迹样本与部首索引号对应;按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。
2.如权利要求1所述的方法,其特征在于,从所述汉字序列中确定所述预输入汉字的候选字之后,进一步包括从所述部首信息中获取所述部首的输入坐标,并根据该输入坐标判断所述预输入汉字的字形结构;根据所述字形结构,将所述候选字中与所述字形结构相同的汉字优先排列。
3.如权利要求1所述的方法,其特征在于,从所述汉字序列中确定所述预输入汉字的候选字之后,若接收到所述预输入汉字除所述部首外的剩余汉字首笔划,该方法还包括根据所述剩余汉字首笔划,将所述候选字中与所述剩余汉字首笔划相同的汉字优先排列。
4.如权利要求1 3任一权项所述的方法,其特征在于,从所述汉字序列中确定所述预输入汉字的候选字之后,该方法还包括若包括N个候选字,并所述N个候选字中每个候选字都对应有使用频度值,根据所述N 个候选字的使用频度值对所述N个候选字排序,其中,排序中第M-I个候选字的使用频度值大于或等于排序中第M个候选字的使用频度值,所述M是大于2小于或等于N的整数。
5.如权利要求1 3任一权项所述的方法,其特征在于,所述个人笔迹样本由用户输入的部首笔迹确定包括当接收到用户输入的部首后,确定已存的个人笔迹样本中是否包括所述部首,如果包括,则显示输出包含已识别部首的候选字序列;如果没有,则根据用户的输入信息从待选部首序列中确定输入部首,并查询所述输入部首是否已存在部首字迹样本,如果所述输入部首已存在部首字迹样本,则更新部首字迹样本;如果所述输入部首不存在部首字迹样本,则保存部首字迹样本。
6.一种手写输入中确定待选字的装置,其特征在于,包括输入模块,用于根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;部首确定模块,用于将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配, 如果匹配成功,则获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定,并且所述个人笔记样本与部首索引号对应;候选字确定模块,用于按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。
7.如权利要求6所述的装置,其特征在于,该装置还包括字形结构排序模块,用于从所述部首信息中获取所述部首的输入坐标,并根据该输入坐标判断所述预输入汉字的字形结构;根据所述字形结构,将所述候选字中与所述字形结构相同的汉字优先排列。
8.如权利要求6所述的装置,其特征在于,该装置还包括剩余笔划排序模块,用于若接收到所述预输入汉字除所述部首外的剩余汉字首笔划, 根据所述剩余汉字首笔划,将所述候选字中与所述剩余汉字首笔划相同的汉字优先排列。
9.如权利要求6所述的装置,其特征在于,该装置还包括使用频度排序模块,用于在候选字包括N个,并N个候选字中每个候选字都对应有使用频度值,根据所述N个候选字的使用频度值对所述N个候选字排序,其中,排序中第M-I个候选字的使用频度值大于或等于排序中第M个候选字的使用频度值,所述M是大于2小于或等于N的整数。
10.如权利要求6 9任一权项所述的装置,其特征在于,该装置还包括个人笔迹样本确定模块,用于在接收到用户输入的部首后,确定已存的个人笔迹样本中是否包括所述部首,如果包括,则显示输出包含已识别部首的候选字序列;如果没有,则根据用户的输入信息从待选部首序列中确定输入部首,并查询所述输入部首是否已存在部首字迹样本,如果所述输入部首已存在部首字迹样本,则更新部首字迹样本;如果所述输入部首不存在部首字迹样本,则保存部首字迹样本。
全文摘要
本发明公开了一种手写输入中确定待选字的方法及装置,应用于电子设备输入技术领域。该方法包括根据用户输入的预输入汉字的部首,确定预输入汉字的部首信息;将所述部首信息中的部首笔迹与存储的个人笔迹样本进行匹配,如果匹配成功,则获取所述个人笔迹样本对应的部首索引号;其中,所述个人笔迹样本由用户输入的部首笔迹确定,并且所述个人笔迹样本与部首索引号对应;按所述部首索引号获取包含所述部首的汉字序列,从所述汉字序列中确定所述预输入汉字的候选字。本发明公开的方法和装置通过存储根据用户个人手写习惯生成的个人部首笔迹样本,字库实现简单且存储空间小。
文档编号G06F3/048GK102360265SQ201110298039
公开日2012年2月22日 申请日期2011年9月29日 优先权日2011年9月29日
发明者江桂凤 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1