手写字符识别方法和系统的制作方法

文档序号:8361883阅读:439来源:国知局
手写字符识别方法和系统的制作方法
【技术领域】
[0001] 本发明涉及人机交互技术,更具体地,涉及手写字符识别方法和系统。
【背景技术】
[0002] 随着计算机视觉应用的发展,人们对自然人机交互技术有了日益广泛的需求,也 提出了更高的要求,手写字符识别技术也是自然人机交互的一部分。大多数手写字符识别 系统在用户写完了字符的所有笔画之后进行识别,这种系统在输入有多个笔画的字符时输 入速度很慢,此外,对于用户而言,输入复杂字符的所有笔画也有困难。为了解决该问题,提 出了一些预测手写字符识别方法,它们可以在输入字符的一部分笔画之后就识别字符。这 些方法中的一些方法基于预测字符数据库,系统根据包括给定笔画的数据库中存储的所有 字符的使用频率,提供包括一个或多个给定笔画的字符候选。其他的一类方法是在用户输 入字符部首之后给出预测结果。类似地,这类方法也根据使用频率来提供字符候选。
[0003] 题为"基于非完整识别的词语快速输入方法"的中国专利申请No. 201210284415 提出了一种手写字符识别方法,用于基于预测率来给出预测候选。该方法产生每个汉字字 符的完整模板和一系列派生子模板。派生子模板可以是汉字字符的字符部首或任意其他不 完整部分。每个子模板基于其相对于完整汉字字符的完整性等级而具有"完整性权重"。执 行输入笔画与每个汉字字符的所有子模板之间的模板匹配,之后,将所获得的匹配率与对 应子模板的完整性权重相乘;然后,将加权的匹配率的最大值当做完整汉字字符的预测率; 最后,基于预测率来呈现预测候选。
[0004] 但是,对于现有的预测手写字符识别方法,基于使用频率来呈现字符候选是不精 确的。例如,在用户输入非常用字符时,由于非常用字符的使用频率很低,系统无法在预测 候选中获得正确的识别结果。
[0005] 中国专利申请No. 201210284415的问题在于,没有给出如何测量"完整性权重"的 明确规则。"完整性权重"对于该方法中给出正确的预测候选而言非常重要。但是,在该专 利申请中并未描述如何测量并确定该权重。定义测量该权重的合理规则是模糊且复杂的, 而这将极大地影响预测效果。此外,该专利申请提到了可以将每个汉字字符的完整模板划 分为多个一级派生模板;一级派生模板可以划分为更多个二级派生模板;一些一级派生模 板和一些二级派生模板可组合以产生新的派生模板等。按照这种方式,所有汉字字符的模 板的数目将非常大,从而需要很大的存储空间来存储大的字符集合的所有模板,并且模板 匹配过程为了匹配所有模板将非常繁琐并且复杂。
[0006] 因此,需要一种能够精确地预测手写输入结果的方法。

【发明内容】

[0007] 本发明提出了一种部分笔画预测手写字符识别方法和系统,其可以精确地给出预 测候选,可以在用户通过手写输入了字符的一部分笔画之后识别所要输入的字符。
[0008] 根据本发明的一个方面,提出了一种手写字符识别方法,该方法首先接收用户输 入的手写轨迹,然后将手写轨迹与至少一个笔画模板进行匹配,以确定笔画模板的匹配度。 最后,按照匹配度,输出与匹配的笔画模板相对应的标准字符。其中,所述笔画模板是标准 字符的匹配模板,并且其中,至少一个标准字符的匹配模板包括所述至少一个标准字符的 完整笔画模板和所述至少一个标准字符的不完整笔画标准字符的不完整笔画模板,其中所 述至少一个标准字符的不完整笔画模板所对应的不完整笔画标准字符不构成任何其他标 准字符的部分或全部。
[0009] 优选地,在每次接收到一个笔画输入之后,执行匹配和输出步骤。
[0010] 优选地,要与手写轨迹进行匹配的至少一个笔画模板是所有标准字符的所有匹配 模板。
[0011] 优选地,将手写轨迹与至少一个笔画模板进行匹配,以确定笔画模板的匹配度的 步骤还包括:根据已输入的笔画数目与对应于进行匹配的笔画模板的标准字符的笔画数目 之差,对匹配度进行加权。
[0012] 优选地,还在手写轨迹的背景中显示与匹配度最高的笔画模板相对应的标准字 符。
[0013] 优选地,所述不完整笔画模板是通过以下步骤产生的:
[0014] 定义基本笔画和部首;
[0015] 给基本笔画和部首中的每个笔画/部首分配一个索引号;
[0016] 用与标准字符的每个笔画/部首相对应的索引号、按照该标准字符的笔画顺序组 合得到的索引号序列来表示每个标准字符;
[0017] 对标准字符的索引号序列进行排序;
[0018] 识别所述至少一个标准字符与其他标准字符不同的索引号;
[0019] 确定所述至少一个标准字符的独有索引号序列,所述独有索引号序列是所述至少 一个标准字符的索引号序列中从起始索引号到所述不同索引号的部分索引号序列;
[0020] 产生与所述独有索引号序列相对应的不完整笔画标准字符,作为所述至少一个标 准字符的不完整笔画标准字符;
[0021] 根据所述至少一个标准字符的不完整笔画标准字符,根据所述至少一个标准字符 的完整笔画样本,得到与所述不完整笔画标准字符相对应的该标准字符的不完整笔画样 本;以及
[0022] 根据所述至少一个标准字符的不完整笔画样本,得到所述至少一个标准字符的不 完整笔画模板。
[0023] 优选地,所述独有索引号序列还包括:所述不同索引号之后的索引号。
[0024] 优选地,当与所述不同索引号相对应的笔画/部首包括至少两个笔画时,与所述 独有索引号序列相对应的不完整笔画标准字符还包括:包括与从起始索引号到所述不同索 引号之前一个索引号的部分索引号序列相对应的笔画/部首、加上与所述不同索引号相对 应的笔画/部首的逐笔画部分的不完整笔画标准字符。
[0025] 优选地,在所得到的不完整笔画模板中丢弃与所述不同索引号相对应的笔画/ 部首为特定笔画/部首之一的不完整笔画模板。
[0026] 优选地,特定笔画/部首可以是《 z ?和"、"之一。
[0027] 优选地,所述至少一个标准字符的不完整笔画模板还包括通过以下步骤产生的模 板:
[0028] 确定至少两个标准字符的相同笔画部分,所述相同笔画部分是所述至少两个标准 字符的不完整笔画部分;
[0029] 将该相同笔画部分当作中间标准字符,针对所述中间标准字符,产生其不完整笔 画模板;以及
[0030] 将所产生的不完整笔画模板和与所述中间标准字符相对应的笔画模板作为所述 至少两个标准字符中每个标准字符的不完整笔画模板。
[0031] 优选地,所述标准字符可以是中文、日文和韩文之一的字符。
[0032] 根据本发明的另一方面,还提出了一种手写字符识别系统,包括:手写输入单元, 用于接收用户输入的手写轨迹;模板存储库,存储有标准字符的匹配模板;模板匹配单元, 被配置为将手写轨迹与至少一个模板进行匹配,以确定模板的匹配度;以及输出单元,被配 置为按照模板匹配单元确定的匹配度,输出与匹配的模板相对应的标准字符,其中,至少一 个标准字符的匹配模板包括所述至少一个标准字符的完整笔画模板和所述至少一个标准
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1