手写字符识别方法和系统的制作方法_3

文档序号：8361883阅读：来源：国知局

与图5相同的字符笔画信息排序表，但是对其中的相同部分进行了示意。
[0063] 从图6的表中可以看出，左边的虚线框包含所示六个字符的共同笔画。中间的虚线框包含前五个字符的共同笔画。此外，右边的虚线框表示"晋"和"戬"的共同部首。最后，第二、第三、第五和第六字符的最后笔画/部首（其索引号分别是211、226、233 和201)表示对应字符的独有笔画/部首。因此，获得了"独有索引表"。即，对于"垩"，其索引号序列为"1-3-3-7-6-1-211"，其中"211"表示其独有笔画/部首。对于"晋"，其索引号序列为"1-3-3-7-6-1-236"，但是没有独有笔画/部首。对于"戬"，其索引号序列为 " 1-3-3-7-6-1-236-233"，其中"233"表示其独有笔画/部首。对于"严"，其索引号序列为 "1-3-3-7-6-201"，其中"201"表示其独有笔画/部首。
[0064] 然后，确定字符的独有索引号序列，独有索引号序列是一个字符的索引号序列中从起始索引号到不同索引号的部分索引号序列。从图6可以看出，六个字符中仅"垩"、"恶" 和"戬"和"严"具有与其他字符不同的独有索引号。
[0065] 作为另一示例，假设"鞭"的索引号序列例如为"302-104-1-3-10-1-1-5-8"，其中第三个索引号"1"表示其独有笔画/部首。"鞭"的独有索引号序列可以是"302-104-1"、 "302-104-1-3"、"302-104-1-3-10"、"302-104-1-3-10-1"、"302-104-1-3-10-1-1"\ "302-1 04-1-3-10-1-1-5"和"302-104-1-3-10-1-1-5-8"。换言之，除了"302-104-1"，独有索引号序列还包括独有索引号之后的索引号。
[0066] 在步骤S250中，根据获得的"独有索引号序列"来产生每个标准字符的不完整笔画字符。
[0067] 在一个实施例中，与所述独有索引号相对应的笔画/部首可能包括至少两个笔画。在该实施例中，与独有索引号序列相对应的不完整笔画字符包括：包括与从起始索引号到所述独有索引号之前一个索引号的部分索引号序列相对应的笔画/部首、加上与该独有索引号相对应的笔画/部首的逐笔画部分的不完整笔画字符。
[0068] 在步骤S260中，根据每个字符的不完整笔画字符，由标准字符的完整笔画样本得到其不完整笔画样本，从而得到该标准字符的不完整笔画模板。
[0069] 图7示出了 "鞭"的完整笔画字符的训练样本。根据步骤S240,可以获得"鞭"的索引号序列例如为"302-104-1-3-10-1-1-5-8"，其中第三个索引号" 1"表示其独有笔画 /部首。因此，根据步骤S250可以确定"鞭"的不完整字符的索引号序列为"302-104-1"、 "302-104-1-3"、"302-104-1-3-10"、"302-104-卜3-10-1"、"302-104-1-3-10-1-1" 和 "302-104-1-3-10-1-1-5"。图8示出了从图7所示的"鞭"的完整笔画样本中得到的"鞭" 的不完整笔画样本。
[0070] 图9示出了根据本发明实施例的手写字符识别方法900的流程图。
[0071] 如图9所示，在步骤S910处，接收用户输入的手写轨迹。在该步骤中，用户利用手写输入单元来输入手写轨迹。
[0072] 然后在步骤S920处，对手写轨迹进行预处理。预处理的目的是使得手写轨迹更加平滑，以利于后续操作。
[0073] 然后，在步骤S930处，输入的手写轨迹与笔画模板进行匹配，以确定笔画模板的匹配度。最后，在步骤S940处，输出与匹配的笔画模板相对应的标准字符，即，识别出了与手写轨迹相对应的标准字符。
[0074] 根据本发明的实施例，系统存储有不完整笔画模板。因此，可以在每次接收到一个笔画输入之后，执行步骤S920-S940,以调整识别结果。例如，当用户想要输入"恶"字时，在输入完"亚"之后，步骤S930确定匹配度从高到低的笔画模板相对应的字符依次为例如 "亚"、"巫"、"恶"、"丑"、"正"，从而在步骤S940中依次输出"亚"、"巫"、"恶"、"丑"、"正"。但是在用户接下来输入了后两笔之后，此时步骤S930确定匹配度从高到低的笔画模板相对应的字符依次为例如"恶"、"悉"、"恐"、"恋"、"晋"，从而在步骤S940中依次输出"恶"、"悉"、 "巩，，" TfK，，" 亚，，也、、 >匕、、曰〇
[0075] 在一个实施例中，当用户输入笔画时，可以输出当前输入笔画的识别结果中的前十个候选，并且在输入笔画的背景中显示最可能的识别结果，即匹配度最高的字符。例如，用户输入汉字字符"鞭"的不完整笔画，如图10(a)所示。根据本发明实施例的手写字符识别系统将当前输入笔画与所有字符的所有不完整笔画模板进行匹配，发现不完整笔画模板 "鞭"是最可能的候选，如图10(b)所示。最后，在手写轨迹的背景中显示第一个识别结果 "鞭"，如图10(c)所示。
[0076] 在一些实施例中，为了避免不完整笔画字符与全笔画字符混淆，丢弃与全笔画字符类似的一些不完整笔画字符，即丢弃与全笔画字符的区别部分为特定笔画/部首的不完整笔画字符。例如，对于字符"恶"，其独有部首是226 (心），这意味着它具有三个不完整笔画字符，即恶恶"。但是，第一个不完整笔画字符"可能会与"亚"混淆。因为区别的笔画" μ'可能是在输入"亚"字时由于输入屏幕上的噪声或污迹而错误识别到的。因此，对于字符"恶"，丢弃第一个不完整笔画字符，仅保留其他两个不完整笔画字符。图11示出了从"恶"中提取的二个不完整笔画样本和完整笔画样本。根据本发明的实施例，所述特定笔画/步骤可以是" 和"、"之一。
[0077] 根据本发明的一些实施例，为了有效地预测字符，构造一些中间字符，作为类似字符的公共部分。例如，对于"醒"、"醌"和"醍"，"f3"是这三个字符的公共部分。这意味着，可以将该公共部分当做这三个字符的中间字符，并对于该中间字符产生不完整笔画模板，例如由图13所示样本提取出的模板。将"f 1"、《 If"、" 当做"醒"、"醌"和"醍"的不完整笔画字符。这样，在用户输入手写字符时，一旦输入了如图13所示字符，就可以识别 "醒"、"醌"和"醍"。图12示出了构造中间字符的一个示例。如图12所示，"醒"、"醌"和 "醍"的索引号序列中的公共部分为"293-236"，对应于"丨f"。针对该公共部分，产生不完整笔画模板，而将这样产生的不完整笔画模板和公共部分的笔画模板当做"醒"、"醌"和"醍" 的不完整笔画模板。
[0078] 根据本发明的实施例，还定义用于识别每个标准字符的最大笔画数目的表。然后，在计算匹配度时，给出笔画数目的不同权重，以便可以根据输入笔画数目与匹配模板的笔画数目之间的差距来调整识别结果。
[0079] 根据本发明的实施例提出的手写字符识别方法和系统可以识别中文、日文和韩文等的字符。
[0080] 下面，使用识别率和输入笔画的数目来评估根据本发明的预

完整全部详细技术资料下载

当前第3页1 2 3 4