在线字符识别方法和设备的制作方法

文档序号:6412072阅读:207来源:国知局
专利名称:在线字符识别方法和设备的制作方法
技术领域
本发明涉及一种在线字符识别的方法和设备,更具体地说,是涉及这样一种方法和设备,它能够通过寻找输入字符笔划单元中各图案的笔划间距离,并参考预先生成的笔划单元中的图案(它通过对目标字符的笔划进行量化而得到)而达到在线识别字符的目的。
在日本专利出版物38351/93(以下作为参考文献1)中介绍了一个在线识别设备的实例。该设备可以通过利用与笔划有关的信息对字符进行在线识别。其中从笔与图形输入板接触开始到笔离开图形输入板为止之间笔的连续轨迹称为一划。
在这种在线字符识别设备中,笔划单元中的图案首先被从输入字符中找出,然后通过使用一预先生成的参考图案集组成的笔划代码本,就可根据该代码本中的每个参考图案找出笔划间的距离。接下来,通过将每个已获得的笔划间距离相加,并根据一字符库就可找出中间字符距离。在该字符库中,字符用代码串来表征以用于每个笔划代码本内的参考图案,具有最小距离的字符就作为识别的结果。此方法可在这样一种情况下减少存储量,即全部笔划的笔划间距离都被计入而不用将目标字符的笔划进行量化处理。
在电子信息通信工程学院的文章“模糊逻辑在手写字符在线识别方法中的应用”(February 1991,D-II,Vol.J74-D-II,No.2,pp.166-174)(以下作为参考文献2)中,探索了输入字符每个笔划的形状与预先输入的每个基本笔划形状图案之间的相似程度。字符的识别可通过使用一字符单元识别库来完成,该识别库根据模糊理论来使用上述相似程度及字符的各不同特征。例如,具体来说,该字符库中的每个字符都根据模糊理论利用了字符的各不同特征,如笔划形状、笔划长度、笔划方向、笔划位置和笔划数。还有两个例子,一个是“第一根线与第1号典型笔划图案或第2号典型笔划图案相接近”,另一个是“第二根线的开始接近并位于第一根线之下”。
在参考文献1所述的设备中,笔划单元的图案只被量化而未经转换,由此仅含有笔划形状及位置的信息。由于位置不同但形状相似的图案都被作为不同的笔划单元图案,因此使用这种方法需要一个庞大的笔划代码本,进而需要很大容量的存储器来保存该代码本,而且需要找出笔划间距离必须进行大量的计算。
在参考文献2所述的方法中,存在一个问题,即必须根据不同特征为每个字符都装备一个识别库。制作这些识别库需要工作人员单独输入每一个字符,因此需要花费大量的劳动力。最后,还有一个问题,即对识别过程的控制需要一个为每个字符解决模糊的过程,但很难用硬件对这类过程实现高速和重复处理。
本发明的目的是提供一种在线字符识别的方法和设备,该设备可以大大地减少对存储量的要求、计算次数和准备识别字库所需的步骤。
为了实现上述目的,本发明提供了一种在线字符识别的方法,它含有以下步骤输入被输入字符的笔划图案;为每个输入的笔划图案找出一个说明笔划形状的笔划形状图案和一个说明笔划位置或大小的笔划位置图案;找出笔划间形状的距离,即输入字符的每个笔划形状图案与根据参考字符笔划图案而预先获得的笔划形状图案之间的距离,和笔划间位置的距离,即输入字符的每个笔划位置图案与根据参考字符笔划图案而预先获得的笔划位置图案之间的距离;依据笔划间形状距离和笔划间位置距离,找出每个目标字符的笔划与被输入字符的笔划之间的笔划间距离,并将具有最小笔划间距离的目标字符作为对被输入字符的识别结果。
另外,本发明提供了一种在线字符识别设备,它包括图案检测装置,用于输入一个被输入字符的笔划图案,并从每个笔划图案中找出一个说明笔划形状的笔划形状图案和一个说明笔划位置或大小的笔划位置图案;计算笔划间形状距离的装置,用于找出笔划形状之间的距离,即每个笔划形状图案与根据参考字符笔划图案而预先获得的笔划形状图案之间的距离;计算笔划间位置距离的装置,用于找出笔划位置之间的距离,即每个笔划位置图案与根据参考字符笔划图案而预先获得的笔划位置图案之间的距离;选配装置,用于依据笔划间形状的距离和笔划间位置的距离,找出每个目标字符的笔划与被输入字符的笔划之间的笔划间距离,并将具有最小笔划间距离的目标字符作为对被输入字符的识别结果。
在将笔划作为单元的在线字符识别中,笔划可用与笔划形状相对应的图案和与笔划位置相对应的图案来表征,因此为不同特征所共有的信息可以通过为每个图案预先准备代码本而得到紧密的组织。
这种安排使得处理过程成为简单的计算过程,由此减少了计算的次数和存储的容量,而且更进一步的是,它可以简化一个识别库的制作。
通过以下描述并参考画有本发明举例的附图,本发明前面所述的内容及其其它目的、特征和优点将变得一目了然。


图1所示出的是一在线字符识别设备的结构,它是本发明的第一个实施例。
图2所示出的流程图显示了图1所示在线字符识别设备的处理顺序。
图3所示出的是一在线字符识别设备的结构,它是本发明的第二个实施例。
图4所示出的流程图显示了图3所示在线字符识别设备的处理顺序。
参考图1所示的是根据本发明的第一个实施例而设计的一种在线字符识别设备,它包括图形输入板1,图案检测器2,笔划形状代码本3,笔划位置代码本4,计算笔划间形状距离的装置5,笔划间形状距离表6,计算笔划间位置距离的装置7,笔划间位置距离表8,字符库9和选配单元10。
图形输入板1是一输入装置,它根据所输入的笔划为每个笔划输出一系列具有固定时间间隔的坐标点,并将其作为笔划图案。从笔与图形输入板1开始接触到笔离开图形输入板1为止之间笔的连续轨迹称为一划。
图案检测器2可输入由图形输入板1产生的每个笔划图案,并能从构成输入字符A的笔划图案Sn(n=1,2,3,...,N)(N是构成输入字符A的笔划数)中找出说明笔划位置的笔划位置图案Pn(n=1,2,3,...N)和说明笔划形状的笔划形状图案Fn(n=1,2,3,...,N)。
笔划形状代码本3和笔划位置代码本4分别含有预先从所有目标字符中获得的笔划形状图案Fn和笔划位置图案Pn;作为代码本的笔划形状代码本3和笔划位置代码本4是根据代码本准备方法而预先准备好的,该方法利用了如参考文献1中所述的类聚的方法。两代码本3和4可在一辅助存储设备中建立。
计算笔划间形状距离的装置5能够找出笔划形状图案Fn和笔划形状代码本3中的参考笔划形状图案FSm之间的距离,并将笔划间形状距离DF(n,m)作为结果在笔划间形状距离表6中存储起来。
在笔划间形状距离表6中的笔划间形状距离DF(n,m)是通过计算笔划间形状距离的装置5找出的。该表可在一辅助存储设备中建立。
计算笔划间位置距离的装置7可找出参考笔划位置图案PS1(1=1,2,...,L)与笔划位置图案代码本4中的笔划位置图案Pn之间的欧几里德距离,并能将笔划间位置距离DP(n,1)作为结果存储在笔划间位置距离表8之中。
在笔划间位置距离表8中的笔划间位置距离DP(n,1)是通过计算笔划间位置距离的装置7找出的。该表可在一辅助存储设备中建立。
字符库9中的字符是通过与笔划形状代码本3和笔划位置代码本4都有对应关系的各个代码数来表示的。它可在一辅助存储设备中建立。
通过利用存储在笔划间形状距离表6和笔划间位置距离表8之中的距离值并根据字符库9,选配单元10可以找出目标字符和被输入字符之间的中间字符距离,进而识别字符。
每个如上所述的功能模块(即,图案检测器2,计算笔划间形状距离的装置5,计算笔划间位置距离的装置7和选配单元10)都可通过软件和数据处理器的组合来实现其功能。
对符合上述实例的在线字符识别设备工作过程的详细描述如下,其流程图如图2所示。
首先,在步骤21中,图形输入板1输出了每个笔划的轨迹(从笔与图形输入板1开始接触到笔离开图形输入板1为止之间笔的连续轨迹称为一划),并将笔划上一系列具有固定时间间隔的坐标点作为一个笔划图案。图案检测器2将这些笔划图案作为笔划图案Sn(n=1,2,3,...,N)进行输入,其中N是构成输入字符A的笔划数。
在步骤22中,图案检测器从笔划图案Sn中获得代表笔划位置的笔划位置图案Pn(n=1,2,3,...N)。如果被输入字符A的位置和大小预先经过标准化处理,则笔划重心的坐标(gxn,gyn)就可作为笔划位置图案Pn,利用笔划图案Sn的坐标点{xn(i),yn(i)}(i=1,2,...,I;其中I是构成笔划图案Sn的坐标点数),可根据公式(1)找出上面所述的重心坐标,公式如下(GXn,GXn)=1IΣi=1I(Xn(i)Yn(i))----(1)]]>然后,在步骤23中,图案检测器2从笔划图案Sn中找出代表笔划形状的笔划形状图案Fn(n=1,2,3,...,N)。该笔划形状图案Fn作为连接相邻坐标点线段的斜率Dn(i),用于找出斜率Dn(i)的公式如下Dn(i)=tan-1(Yn(i+1)-Yn(i)Xn(i+1)-Xn(i))----(2)]]>计算笔划间形状距离的装置5的处理过程在步骤24中执行。利用笔划形状代码本3并通过例如电子信息通信工程学院的文章“通过堆栈DP选配方法进行手写字符的在线识别”(1983,PRL 83-29,pp.1-7)中所描述的DP选配方法,就可以获得笔划形状间距。
该距离用于由图案检测器2找出的笔划形状图案Fn。在笔划形状代码本3中存储的是代表目标字符笔划的笔划形状图案FSm(m=1,2,...,M)(M为代码数)。
当找出被输入字符笔划形状图案Fn与这些代表笔划的笔划形状图案FSm之间的距离结果后,该结果将被作为笔划间形状距离DF(n,m)而存储进笔划间形状距离表6中。
计算笔划间位置距离的装置7的处理过程在步骤25中执行。与装置5获得笔划间形状距离的方法一样,通过笔划位置代码本4就可以找出笔划间位置距离。该距离用于由图案检测器2找出的笔划位置图案Pn。在笔划位置代码本4中存储的是代表目标字符笔划的笔划位置图案PS1(1=1,2,...,L)(1为代码数)。当找出被输入字符笔划位置图案Pn与这些代表笔划的笔划位置图案PS1之间的欧几里德距离后,它将被作为笔划间位置距离DP(n,1)而存储进笔划间位置距离表8中。
在步骤26中,选配单元10通过参考字符库9找出中间字符距离,并利用笔划间形状距离表6中的笔划间形状距离DF(n,m)和笔划间位置距离表8中的笔划间位置距离DP(n,1)执行字符识别。
在字符库9中,预先存储有代码数MID(t,u)(u=1,2,...,Ut;其中Ut为构成Bt的笔划数)和代码数KID(t,u)。代码数MID(t,u)存于笔划形状代码本3中,作为参考笔划形状图案,该笔划形状图案组成了目标字符Bt(t=1,2,...,T;其中T为目标字符数)。代码数KID(t,u)存于笔划位置代码本4中,作为参考笔划位置图案,该笔划位置图案组成了目标字符Bt。选配单元10根据这些代码数为每个目标字符Bt找出距离D(A,Bt),并找出符合公式(3)的笔划间形状距离DF(n,m)和笔划间位置距离DP(n,1),然后选取具有最小数值的目标字符作为对被输入字符A的识别结果R。D(A,Bt)=Σn=1N{DF(n,MID(t,n))+DP(n,KID(t,n))}---(3)]]>在这种实例的在线字符识别设备中,笔划信息被分成与笔划位置或大小无关的笔划单元形状和字符内笔划所占的位置或(和)大小这两部分信息,因此较大地减少了存储量和计算的次数。换句话说,由形状和位置和/或大小组成的特征是从目标字符中出现的所有笔划中提取出来的,然后这些图案中的每一个都被量化处理并作为典型的笔划形状图案和笔划位置图案。一个字符由它的典型笔划形状图案与典型笔划位置图案的组合来表征。作为结果,字符不光可以用较小的存储量来表示,其计算也能以较高的速度执行。
参考图3所示的是根据本发明的第二个实施例而设计的一种在线字符识别设备,它包括图形输入板1,图案检测器2,笔划形状代码本3,笔划位置代码本4,计算笔划间形状距离的装置5,笔划间形状距离表6,计算笔划间位置距离的装置7,笔划间位置距离表8,这些元件与第一个实例中所述的在线字符识别设备的对应元件相同;此外,还包括计算笔划间距离的装置11,笔划库12,笔划间距离表13,字符库14和选配部分15。
图1中所示的第一个实例中的选配单元参考的是笔划间形状距离表6和笔划位置距离表8中的数据。而本实例中的在线字符识别设备与第一种不同。其不同之处在于,本应用中计算笔划间距离的装置11利用笔划库12从笔划间形状距离表6和笔划间位置距离表8内的距离数值中找出笔划间距离,并将结果存储在笔划间距离表13中;而且,选配部分15参考的是存有这些距离数值的笔划间距离表13。进一步说,字符库14与第一种应用中的字符库9也不同,它存储了笔划间距离表13中组成目标字符Bt笔划图案的代码数OID(t,u)。
根据公式(4),计算笔划间距离的设备11可从代码数MS(v)(v=1,2,...,V;其中V是笔划数)、存于笔划库12中的KS(v)、存于笔划间形状距离表6中的笔划间形状距离DF(n,m)和存于笔划间位置距离表8中的笔划间位置距离DP(n,1)中为每个笔划找出其笔划间距离DS(n,v),并将结果保存在笔划间距离表13中。
DS(n,v)=DF(n,MS(v))+DP(n,KS(v)) (4)在笔划库12中,存储有例如用于笔划形状代码本3的代表笔划的代码数MS(v),用于含有参考笔划位置图案的笔划位置代码本4的代码数KS(v)。它可以建立在辅助存储设备之中。
在笔划间距离表13中,存储有由计算笔划间距离的设备11找出的笔划间距离DS(n,v),它也可以建立在辅助存储设备之中。
字符库14中保存有组成目标字符Bt笔划图案的代码数OID(t,u)(u=1,2,...,Ut;其中Ut是组成Bt的笔划数)。
根据公式(5)并利用存储在笔划间距离表13中的笔划间距离DS(n,v)和存储在字符库14中的代码数OID(t,u),选配单元15为每个目标字符Bt找出距离D2(A,Bt),并将具有最小距离值的目标字符确定为对被输入字符A的识别结果。D2(A,Bt)=Σn=1NDS(n,v)----(5)]]>在本实例的在线字符识别设备中,一个字符可以由一类代表笔划类型的代码来表征。作为结果,在有许多目标字符的情况下,字符不光可以用较小的存储量来表示,其计算也能以较高的速度执行。
图4所示出的流程图显示了符合本发明第三个实例的在线字符识别设备的处理顺序。在第一和第二种实施例中,字符单元内执行了一系列的处理过程。而在本实例中,它完成了对每个被输入笔划的笔划间形状距离和笔划间位置距离的计算,如图4所示。其它处理过程与第一和第二种实例中的过程相同,因此本处将其做了省略。
进一步来说,在这些实例中是用字符中一个笔划的重心坐标作为笔划位置图案。但是,也可以使用许多其它能够辨别字符内位置的特征,如一个笔划两端点的坐标值。此外,还可以使用一个笔划的大小来作为笔划位置图案Pn。许多其它可以表征一个笔划大小的特征也可用来作为笔划的大小,它们包括一个笔划的垂直或水平长度,或是一个圆的半径Rn(该圆的圆心就是一个笔划的重心,如图6所示)。可以单独或混合使用位置和大小的特征。Rn={Σi=1I(x2n(i)+y2n(i))}/I---(6)]]>尽管在上面的描述中,是用欧几里德距离作为笔划间位置距离。但是也可以使用city-block距离或许多其它中间图案距离标准。
此外,尽管上述实例是利用连接两坐标点线段的斜率作为笔划形状特征,并通过DP选配找出笔划间形状距离的。但也可以使用其它找出距离的方法。例如,可以使用其它能够说明不同笔划形状的特征量或距离标度,如Nikkei电子的1993年12月5日,第115-133页中的“On-line handwritten kanji recognition for simplified or cursivecharacters in which writing rules are relaxed”一文所述。或者也可以使用另一种方法。在此方法中,通过将连接坐标点的线段方向量化为8个或16个方向,就可找出距离。
尽管本发明的优选实例是用特定词语来描述的,但这种描述仅达到说明的目的。应该明白,对其所做的修改和变换不会脱离本发明下述权利要求中所提出的精神和范围。
权利要求
1.一种在线字符识别方法,其特征在于包括以下步骤输入一被输入字符的笔划图案;为每个输入的笔划图案找出一个说明笔划形状的笔划形状图案和一个说明笔划位置或大小的笔划位置图案;找出笔划间形状的距离,即上述输入字符的每个上述笔划形状图案与根据参考字符笔划图案而预先获得的笔划形状图案之间的距离,以及划输出笔划间位置的距离,即上述输入字符的每个上述笔划位置图案与根据参考字符笔划图案而预先获得的笔划位置图案之间的距离;依据上述笔划间形状距离和上述笔划间位置距离,找出每个目标字符的笔划与上述被输入字符的笔划之间的笔划间距离,并将具有最小笔划间距离的目标字符作为对上述被输入字符的识别结果。
2.如权利要求1所述的方法,其特征在于上述的笔划位置图案是一个笔划重心的坐标值。
3.如权利要求1所述的方法,其特征在于上述的笔划位置图案是一个笔划两端点的坐标值。
4.如权利要求1所述的方法,其特征在于上述的笔划位置图案是一个笔划的大小。
5.如权利要求1所述的方法,其特征在于上述的笔划形状图案是连接一个笔划相邻两坐标点的线段的斜率。
6.如权利要求1所述的,其特征在于上述笔划间位置距离是上述笔划位置图案与一参考字符的笔划位置图案之间的欧几里德距离。
7.如权利要求1所述的,其特征在于上述笔划间距离是上述笔划间形状距离和上述笔划间位置距离的总和。
8.一种在线字符识别设备,其特征在于包括图案检测装置,用于输入一个被输入字符的笔划图案,并从每个笔划图案中找出一个说明笔划形状的笔划形状图案和一个说明笔划位置或大小的笔划位置图案;计算笔划间形状距离的装置,用于找出笔划同形状的距离,即每个上述笔划形状图案与根据参考字符笔划图案而预先获得的笔划形状图案之间的距离;计算笔划间位置距离的装置,用于找出笔划间位置的距离,即每个上述笔划位置图案与根据参考字符笔划图案而预先获得的笔划位置图案之间的距离;选配装置,用于依据上述笔划形状间的距离和上述笔划位置间的距离,找出每个目标字符的笔划与上述被输入字符的笔划之间的笔划间距离,并将具有最小笔划间距离的目标字符作为对上述被输入字符的识别结果。
9.如权利要求8所述的设备,其特征在于进一步包括计算笔划间距离的装置,它将上述笔划间形状距离和笔划间位置距离相加,并找出上述笔划间距离。
全文摘要
本发明揭示了一种在线字符识别方法,该方法是通过找出被输入字符笔划单元中的笔划图案与参考笔划单元的笔划图案之间的距离实现对输入字符进行在线识别。参考图案和被输入字符的图案都被分成说明笔划形状的笔划形状图案和说明笔划位置或大小的笔划位置图案,并由这两个图案表征。当找出与每个笔划形状图案相对应的笔划间形状距离和与每个笔划位置图案相对应的笔划间位置距离后,就可根据笔划间形状距离和笔划间位置距离找出笔划间距离。
文档编号G06K9/46GK1172996SQ9711243
公开日1998年2月11日 申请日期1997年5月30日 优先权日1996年5月30日
发明者池端义和, 吉田和永, 中岛丰 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1