手写字符识别方法和系统的制作方法_3

文档序号:8361883阅读:来源:国知局
与图5相同的字符笔画信 息排序表,但是对其中的相同部分进行了示意。
[0063] 从图6的表中可以看出,左边的虚线框包含所示六个字符的共同笔画。中间的 虚线框包含前五个字符的共同笔画。此外,右边的虚线框表示"晋"和"戬"的共同部 首。最后,第二、第三、第五和第六字符的最后笔画/部首(其索引号分别是211、226、233 和201)表示对应字符的独有笔画/部首。因此,获得了"独有索引表"。即,对于"垩",其 索引号序列为"1-3-3-7-6-1-211",其中"211"表示其独有笔画/部首。对于"晋",其索 引号序列为"1-3-3-7-6-1-236",但是没有独有笔画/部首。对于"戬",其索引号序列为 " 1-3-3-7-6-1-236-233",其中"233"表示其独有笔画/部首。对于"严",其索引号序列为 "1-3-3-7-6-201",其中"201"表示其独有笔画/部首。
[0064] 然后,确定字符的独有索引号序列,独有索引号序列是一个字符的索引号序列中 从起始索引号到不同索引号的部分索引号序列。从图6可以看出,六个字符中仅"垩"、"恶" 和"戬"和"严"具有与其他字符不同的独有索引号。
[0065] 作为另一示例,假设"鞭"的索引号序列例如为"302-104-1-3-10-1-1-5-8",其中 第三个索引号"1"表示其独有笔画/部首。"鞭"的独有索引号序列可以是"302-104-1"、 "302-104-1-3"、"302-104-1-3-10"、"302-104-1-3-10-1"、"302-104-1-3-10-1-1"\ "302-1 04-1-3-10-1-1-5"和"302-104-1-3-10-1-1-5-8"。换言之,除了"302-104-1",独有索引号 序列还包括独有索引号之后的索引号。
[0066] 在步骤S250中,根据获得的"独有索引号序列"来产生每个标准字符的不完整笔 画字符。
[0067] 在一个实施例中,与所述独有索引号相对应的笔画/部首可能包括至少两个笔 画。在该实施例中,与独有索引号序列相对应的不完整笔画字符包括:包括与从起始索引号 到所述独有索引号之前一个索引号的部分索引号序列相对应的笔画/部首、加上与该独有 索引号相对应的笔画/部首的逐笔画部分的不完整笔画字符。
[0068] 在步骤S260中,根据每个字符的不完整笔画字符,由标准字符的完整笔画样本得 到其不完整笔画样本,从而得到该标准字符的不完整笔画模板。
[0069] 图7示出了 "鞭"的完整笔画字符的训练样本。根据步骤S240,可以获得"鞭"的 索引号序列例如为"302-104-1-3-10-1-1-5-8",其中第三个索引号" 1"表示其独有笔画 /部首。因此,根据步骤S250可以确定"鞭"的不完整字符的索引号序列为"302-104-1"、 "302-104-1-3"、"302-104-1-3-10"、"302-104-卜3-10-1"、"302-104-1-3-10-1-1" 和 "302-104-1-3-10-1-1-5"。图8示出了从图7所示的"鞭"的完整笔画样本中得到的"鞭" 的不完整笔画样本。
[0070] 图9示出了根据本发明实施例的手写字符识别方法900的流程图。
[0071] 如图9所示,在步骤S910处,接收用户输入的手写轨迹。在该步骤中,用户利用手 写输入单元来输入手写轨迹。
[0072] 然后在步骤S920处,对手写轨迹进行预处理。预处理的目的是使得手写轨迹更加 平滑,以利于后续操作。
[0073] 然后,在步骤S930处,输入的手写轨迹与笔画模板进行匹配,以确定笔画模板的 匹配度。最后,在步骤S940处,输出与匹配的笔画模板相对应的标准字符,即,识别出了与 手写轨迹相对应的标准字符。
[0074] 根据本发明的实施例,系统存储有不完整笔画模板。因此,可以在每次接收到一个 笔画输入之后,执行步骤S920-S940,以调整识别结果。例如,当用户想要输入"恶"字时, 在输入完"亚"之后,步骤S930确定匹配度从高到低的笔画模板相对应的字符依次为例如 "亚"、"巫"、"恶"、"丑"、"正",从而在步骤S940中依次输出"亚"、"巫"、"恶"、"丑"、"正"。但 是在用户接下来输入了后两笔之后,此时步骤S930确定匹配度从高到低的笔画模板相对 应的字符依次为例如"恶"、"悉"、"恐"、"恋"、"晋",从而在步骤S940中依次输出"恶"、"悉"、 "巩,," TfK,," 亚,, 也、 、 >匕、 、曰 〇
[0075] 在一个实施例中,当用户输入笔画时,可以输出当前输入笔画的识别结果中的前 十个候选,并且在输入笔画的背景中显示最可能的识别结果,即匹配度最高的字符。例如, 用户输入汉字字符"鞭"的不完整笔画,如图10(a)所示。根据本发明实施例的手写字符识 别系统将当前输入笔画与所有字符的所有不完整笔画模板进行匹配,发现不完整笔画模板 "鞭"是最可能的候选,如图10(b)所示。最后,在手写轨迹的背景中显示第一个识别结果 "鞭",如图10(c)所示。
[0076] 在一些实施例中,为了避免不完整笔画字符与全笔画字符混淆,丢弃与全笔画字 符类似的一些不完整笔画字符,即丢弃与全笔画字符的区别部分为特定笔画/部首的不完 整笔画字符。例如,对于字符"恶",其独有部首是226 (心),这意味着它具有三个不完整笔 画字符,即恶恶"。但是,第一个不完整笔画字符"可能会与"亚"混淆。因为区别 的笔画" μ'可能是在输入"亚"字时由于输入屏幕上的噪声或污迹而错误识别到的。因此, 对于字符"恶",丢弃第一个不完整笔画字符,仅保留其他两个不完整笔画字符。图11示出 了从"恶"中提取的二个不完整笔画样本和完整笔画样本。根据本发明的实施例,所述特定 笔画/步骤可以是" 和"、"之一。
[0077] 根据本发明的一些实施例,为了有效地预测字符,构造一些中间字符,作为类似字 符的公共部分。例如,对于"醒"、"醌"和"醍","f3"是这三个字符的公共部分。这意味着, 可以将该公共部分当做这三个字符的中间字符,并对于该中间字符产生不完整笔画模板, 例如由图13所示样本提取出的模板。将"f 1"、《 If"、" 当做"醒"、"醌"和"醍"的 不完整笔画字符。这样,在用户输入手写字符时,一旦输入了如图13所示字符,就可以识别 "醒"、"醌"和"醍"。图12示出了构造中间字符的一个示例。如图12所示,"醒"、"醌"和 "醍"的索引号序列中的公共部分为"293-236",对应于"丨f"。针对该公共部分,产生不完整 笔画模板,而将这样产生的不完整笔画模板和公共部分的笔画模板当做"醒"、"醌"和"醍" 的不完整笔画模板。
[0078] 根据本发明的实施例,还定义用于识别每个标准字符的最大笔画数目的表。然后, 在计算匹配度时,给出笔画数目的不同权重,以便可以根据输入笔画数目与匹配模板的笔 画数目之间的差距来调整识别结果。
[0079] 根据本发明的实施例提出的手写字符识别方法和系统可以识别中文、日文和韩文 等的字符。
[0080] 下面,使用识别率和输入笔画的数目来评估根据本发明的预
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1