数据识别设备的制作方法

文档序号:6405843阅读:118来源:国知局
专利名称:数据识别设备的制作方法
技术领域
本发明涉及一种数据识别设备,特别涉及一种书写数据,例如手写的字符、符号,图形等的设备。
通常这类设备使用的方法是在数据板等上输入笔尖的坐标和笔尖的上-下数据,然后识别书写在数据板上的字符。对于在线的数字符识别,为了应付中文识别的处理容量的增加,对于上述方法已提出了在将输入数据的特征与字典的字符数据比较之前根据中文的偏旁或部首先进行局部模式的识别,选出待比较的字符数据并且将输入数据与较少数目的字符数据进行比较,因此,缩短识别时间的要求。
但是,在上述的常规系统中,是对整个字符进行比较,因此还不能有效地缩短识别时间。具体来说,即使给定的字符已知还不可能识别,直到处理过程一直进行到整个字符的比较完了为止才行,因此耗费了时间。
本发明是针对上述情况的。其目的是提供一种数据识别设备。该设备通过以更高的效率执行识别操作,缩短了识别时间。
为了解决上述问题和实现上述目的,本发明的数据识别设备其特征为一输入装置输入模式数据;一选择装置,在输入的模式数据中识别局部模式数据并且选择出为识别输入模式数据所使用的备用局部模式数据;第一比较装置,将选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较;第二比较装置,将根据由第一比较装置得出的比较结果选出的备用局部模式数据与输入模式数据中的局部模式数据部分进行比较以及判断装置,判断在如上所述根据由第一和第二比较装置得出的结果选出的备用局部模式数据中的识别结果。
如上所述,本发明的目的是提供一数据处理设备,该设备中的输入装置输入模式数据,选择装置识别在输入的模式数据中的局部模式数据的一部分并且选择用于识别输入模式数据的备用局部模式数据,第一比较装置将选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较,第二比较装置将根据由第一比较装置得出的比较结果选出的备用局部模式数据与输入模式数据中的局部模式数据部分进行比较,判断装置判断在根据第一和第二比较装置得出的结果选出的备用局部模式数据中的识别结果。
如上所述,本发明更进一步的目的是提供一数据识别设备,该设备包括提取与输入部分的位置坐标和上-下数据有关的输入模式的特征的提取装置,存储模式数据的字典装置,存储局部模式数据的局部模式字典装置和限制根据被提取装置提取的模式的特征和存储在局部模式字典装置中的局部模式数据而将要与模式特征进行比较并且将存储在局部模式字典装置中的模式数据的装置。


图1为表示现行实施例的数据识别设备的构成的方框图;
图2到图4示出了现行实施例的局部模式字典的内容;
图5示出了字符字典8的内容;
图6为现行实施例的整个字符识别过程各步骤的流程图。
图7为现行实施例的局部模式识别过程各步骤的流程图。
图8为现行实施例的字符识别过程各步骤的流程图;
图9是说明比较过程的改进实施例的流程图。
下面参看附图对本发明的最佳实施例进行详细的描述。对于现行实施例的数据识别设备,将汉字或中文字符的识别作为书写数据。
图1是表明现行实施例的数据识别设备的构成的方框图而图2到图4示出了现行实施例的局部模式字典7中的内容。在图中,1代表检测坐标位置和输入书写数据的数据板,数据板1使用压敏导电橡胶(或者超声数字转换器)。2代表在数据板1上标明坐标位置的输入笔,3代表特征提取器,该特征提取器3归一化一个字符的书写数据(输入模式)的位置和大小并且提取诸如笔划数,每一笔划末端的坐标,每一笔工的形状特性等特征。4代表局部模式识别器、该局部模式识别器4已通过数据板1输入的一个汉字的书写数据,就是说,根据输入模式与汉字的偏旁或部首相应的局部模式的形状。7代表局部模式字典7,该局部模式字典7寄存用于识别局部模式识别器4中的如图2所示的局部模式的形状的局部模式,局部模式与局部模式码相对应。在局部模式字典7中寄存有对应于局部模式码的给定的局部模式的笔划数和位置码(图3)。就该位置码而言,“1”表示字符书写开始的局部模式,“2”表示字符书写结束的局部模式。例如,当局部模式具有偏旁“亻”时。局部模式码为“1”(图2)笔划数为“2”位置码为“亻”。对于局部模式字典7,当偏旁是“亻”时,如图4所示,相应于局部模式码“1”第一笔划的开始点坐标(30,92)结束点坐标(5,46),第二笔划的开始点坐标(21,63)结束点坐标(22,3)作为“亻”的位置坐标来储存,并且当局部模式“亻”寄存在局部模式字典7中时,存储偏差阈值56来识别输入模式。该阈值是一与输入模式的笔划和寄存在局部模式字典7中的偏旁“亻”的局部模式之间的间距之和进行比较的数值。
5代表字符识别器,该字符识别器识别字符的与由局部模式识别器识别的局部模式不同的那部分并且根据这种识别结果,输入模式的形状被识别为字符。8代表字符字典,字符识别器识别字符所用的字符数据,如图5所示存储在该字符字典中。
图5示出了字符字典8的内容。在图5中,100代表局部模式的笔划数的项目表,101是例如存储了10笔划的局部模式的局部模式项目表,102代表存储了具有局部模式“亻”的汉字的汉字项目表,103代表存储了汉字“倍”(读作“bai”意为“两倍”)的字符码和组成汉字“倍”的每一笔划的开始点和结束点的位置坐标(X,Y)的笔划数据项目表。在该笔划项目表103中,坐标的位置根据笔顺存储。局部模式字典7和字符字典8在此合并称为字典6。
下面描述现行实施例的字符识别过程。
图6为现行实施例的整个字符识别过程各步骤的流程图。
当在数据板1输入一字符模式时,特征提取器3提取输入模式的特征(步骤S1,步骤S2)。局部模式识别器4根据提取的特征对输入模式的局部模式进行识别(步骤S3)。然后在字符识别器5中根据已识别的局部模式对具有较小偏差的字符进行识别(步骤S4)和在显示器9上显示上述识别结果(步骤S5)。
下面更详细地描述上述步骤S3的局部模式识别过程和步骤S4的字符识别过程。
首先描述局部模式识别过程。
图7为现行实施例的局部模式识别过程各步骤的流程图。
在步骤S301中从由特征提取器3根据存储在局部模式字典7中的笔划数和位置码提取出的输入笔划中分离出对应于局部模式的笔划(步骤S301)并且获得所分离笔划的开始点和结束点与局部模式之间间距之和(步骤S302)。由此获得的局部模式和对应于这一局部模式的笔划之间的间距与这一局部模式所储存的阈值进行比较(步骤S303),如果这一间距小于该阈值,则将在此时间点上已跟输入笔划进行了比较的局部模式的局部模式码送往下一级的字符识别器5(步骤S304)。从步骤S301开始的上述处理步骤不断重复直到与所有应进行比较的局部模式的比较完了为止(步骤S305)。如果在步骤S303中局部模式和对应于这一局部模式的笔划之间的间距被判别为大于阈值,则返回到步骤S301并重复相同的处理。
在上述局部模式处理过程中,虽然没有在上面说明,但可以使当对一给定的输入模式的局部模式识别不可能时,判断输入为错误输入而中止处理过程。
下面描述字符识别过程。
图8为现行实施例的字符识别过程各步骤的流程图。
首先进行予置,定出表明最小差值的参数能够设定的最大电平值(步骤S401)。然后根据由局部模式识别器4发送过来的第一个备用局部模式,获得对应于在字符字典8中项目表102上的字符的项目地址和字符数目(步骤S402)。再存储备用局部模式的位置码和笔划数(步骤S403)。
然后将输入笔划中非局部模式部分的笔划与项目表102上的第一个字符进行比较,并获得上述笔划的开始点和结束点和第一个字符的开始点和结束点之间的间距(步骤S404),如此获得的间距之和作为“剩余模式间距”(步骤S405)。然后比较前面获得的最小差值参数和在步骤S405获得的剩余模式间距值(步骤S406)。到目前步骤为止,因为是第一轮比较,最小差值定为较大电平,因此剩余模式间距被判别为较小值(步骤S407)。因此到达步骤S408,根据在步骤S403,存储的备用局部模式的位置码和笔划数一个笔划一个笔划地获得字符和已进行了比较的那部分局部模式之间的间距,然后这样就获得了笔划到笔划间距之和值并且该值被认作局部模式间距(步骤S409)。
然后分别在步骤S405和步骤S409获得的剩余模式间距和局部模式间距被求和并且该值被认作被比较的字符的差值(步骤S410)。比较前面的最小差值和在步骤S410获得的差值(步骤S411),结果就是与输入笔划的形状偏差较小的字符被作为具有最小差值的字符来存储(步骤S412)。这时在当前比较中使用的字符被作为具有最小差值的字符来存储。如上所述,当一个字符数据的比较结束时,从步骤S404开始的各步骤不断重复直到与在同一备用局部模式中的所有字符的比较完毕为止(步骤S413)。第二次比较以及根据输入模式和字典中的字符,先前的最小差值与在步骤S407处理的剩余模式间距进行比较具有先前的最小差值的字符的偏差与在步骤S412处理的字符的偏差进行比较。
如上所述,当备用局部模式的比较完毕(步骤S413)并且如果还有备用模式的话(步骤S414),则返到步骤S402并重复上述处理步骤。当对所有备用局部模式的比较都已结束(步骤S414),则具有最小偏差的字符被确认为识别的结果并在显示器9上输出(步骤S415)。
如上所述,根据现行实施例,通过更有效地完成识别过程可以缩短识别时间。
在上述实施例中,当与输入模式比较的字符的剩余模式间距大于先前的最小差值时,输入模式的特征与字典中正进行比较的字符的比较中断,但本发明不局限于此种情形,比较可以以如下的方式中断。
图9为说明比较过程的改进实例的流程图。
此时,每组局部模式的局部模式笔划的平均位置数据存储在字符字典8中项目表101的每一局部模式的上部。在局部模式识别过程中,对于输入模式和字典中局部模式的比较(图7的步骤S302),首先获得输入模式的每一笔划和局部模式的每一笔划的平均位置数据之间的间距,并且这些间距之和被作为平均位置数据的差值。作为字符识别的方法,这就意味着对已在上述实施例的例子中进行了描述的图8中流程的步骤S409进行改进。当过程根据这种方法进行到步骤S408时,如图9所示就获得了局部模式的每一笔划和存储在字典中的字符的每一笔划之间的间距之和值,该和值称为局部模式间距l1(步骤S501)。然后从当前最小差值中减去平均位置数据的差值。上述减去的结果称为l2(步骤S502)。仅当局部模式间距l1大于通过从当前最小差值减去平均位置数据的差值获得的值l2时,过程才到达图8所示的步骤S413,与当前进行比较的字符的比较中止。如果局部模式间距l1小于通过从当前最小差值减去平均位置数据的差值获得的值l2时,则过程从图8所示的步骤S410开始继续进行(步骤S503)。
即使应用这种方法,也可获得与在上述实施例的例子中获得的相同的功能和效果。
或者,系统可以这样设置使得在输入模式和字符字典8中的字符数据的比较中,当剩余模式间距大小由输入模式的笔划或字符数据的笔划确定的某一值时,中止后面的输入模式特征和字符数据的比较。
此外,在上述实施例的例子中,字符字典8中相对于输入模式的非局部模式的每一笔划具有最小笔划-笔划间距的笔划被认作对应笔划,但是可以这样改进,通过将局部模式的笔划数和位置码作为输入模式,使和非局部模式中的输入模式的具有最小笔划-笔划间距的输入笔划可被认作对应笔划。例如在“倍”(读作“bai”意为“两倍”)和输入数据的特征的比较中,对“倍”的非局部模式部分的每一笔划,得到输入数据的非前两笔的笔划和笔划-笔划间距并且具有最小笔划-笔划间距的输入笔划被认作对应笔划。
在上述实施例的例子中,在显示器9上输出字符识别的结果,但是也可在例如打印机这样的设备上输出字符识别结果,这是不言而喻的。
如上所述,根据本发明,通过更有效地执行识别过程可缩短识别时间。
权利要求
1.数据识别设备,包括用于输入模式数据的装置;用于在输入模式数据中识别局部模式数据和选择用于输入模式数据的识别的备用局部模式数据的选择装置;用于将被选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较的第一比较装置;用于根据由第一比较装置得出的比较结果将被选出的备用局部模式与输入模式数据中的局部模式数据部分进行比较的第二比较装置;以及用于判断在根据由第一比较装置和第二比较装置得出的比较结果选出的备用局部模式数据中的识别结果的判断装置。
2.数据识别设备,包括用于提取与输入部分的位置坐标和上一下数据有关的输入模式的特征的提取装置;用于存储模式数据的字典装置;用于存储局部模式数据的局部模式字典装置;以及用于限制根据被提取装置提取的模式特征和存储在局部模式字典装置中的局部模式数据而将要与模式特征进行比较并且将存储在字典装置中的模式数据的装置。
全文摘要
一数据识别设备包括用于输入模式数据的输入装置,在输入模式数据中识别局部模式数据和选择用于输入模式数据识别的备用局部模式数据的选择装置。该设备还包括两个比较装置。第一比较装置将被选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较。第二比较装置根据由第一比较装置得出的比较结果将备用局部模式数据与输入模式数据中的局部模式数据部分进行比较。该设备此外还包括判断在根据第一和第二比较装置的比较结果选出的备用局部模式数据中的识别结果的判断装置。
文档编号G06K9/68GK1046624SQ9010362
公开日1990年10月31日 申请日期1990年4月6日 优先权日1989年4月6日
发明者杉山光正 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1