识别手写输入的方法

文档序号:6409582阅读:229来源:国知局
专利名称:识别手写输入的方法
技术领域
本发明涉及手写识别,具输入涉及个体字识别。
人手写输入的机器识别是个困难的问题,随着笔基(pen-based)计算装置的最近迅速增长,手写输入的机器识别已成为一个重要问题被提出来。人手写输入的机器识别当前具有各种应用。
对于人手写输入的机器识别的一个当前应用例子在EO和New-ton产品之类的个人数字辅助装置中可以看到。这种类型的产品通常具有一个触摸敏感的荧光屏,用户能在它上面写手写字。然后,这类装置对手写输入诸如字母数字输入进行数字化,随后处理该输入,以试图识别手写的信息内容。
按照一种先有技术的手写识别技术,对于依序识别每个字母数字字符串可以作出最佳判断,由此得到的字符串包括识别活动性的结果。这种方法存在多种缺点。它受碍于难以识别待识别的候选输入(在目前情况下是字母数字符)的空间边界。当这些边界不正确地就位时,因它缺少笔划或包含从相邻字符引入额外的材料,故不能准确地识别该字符。
对于人手写输入的机器识别的一个重要问题是识别出一个输入的结束和下一个输入的开始的能力。例如,一个明显的问题是从其随后的手写输入段、字或字母数字输入的开始定位这个手写输入段、字或字母数字的结束。分辨手写输入的这种不良识别导致对手写输入的信息内容的差和不准确的解释。
据此,现在需要一种能从第二个手写输入段的开始检测出第一手写输入段的结束的手写识别技术,借此对该手写输入的信息内容提供较准确的解释。


图1示出按照本发明的优选实施例的操作流程图。
图2示出按照本发明的优选实施例的一个显示器的示例图。
图3示出按照本发明的优选实施例的另一个显示器的示例图。
图4示出按照本发明的优选实施例的又一个显示器的示例图。
图5示出按照本发明的优选实施例的再一个显示器的示例图。
手写字符输入典型地以离散的连续段的形式从用户收集到。一个离散的连续段是由一个或多个笔划组成的,这里,一个笔划是指在笔尖与一个数字化图形输入卡或纸之类的输入装置相接触期间由笔尖留下的印记。一个笔划可由输入装置以大致规则的时间间隔取样的一系列点来表示。每个点最少由一个X座标和一个Y座标来描述。笔划可以利用一个数字化图形输入卡以电学方式捕获,或者另一个实施例中,利用图像中线条的检测过程从一个被扫描的或被传真的图像中得到,这种以电学方式捕获输入的方法在本领域内是可以理解的。
总的来说,这里所公开的本发明确定两个离散的连续段是构成同一手写字符输入的一部分还是构成一个以上的手写字符输入的一部分。在本发明中,一个或多个离散的连续段是待识别的手写输入的单元。手写输入是以电学方式捕获的输入,它包括但并不限制于以下方面手写输入;电子输入;由压力捕获的输入例如印模输入;以电学方式接收的输入,例如通过传真、寻呼机或其它装置来的输入。例如,本发明判定两个离散的连续段是构成同一个字的一部分还是构成几个单独分离的字的一部分。在一种优选方法中,本发明计算基本上与书写轴平行配置的一个或多个基本上平行的距离,并将这些距离与一个或多个的预定阈值相比较。预定阈值规定了对于离散的连续段要判认为属于单独分离的手写输入例如单独分离的手写字的最小距离量度。该基本上平行的距离就必须超过这种预定阈值。书写轴是一道线,手写输入沿着它增加笔划。书写方向是每个后继的手写输入增加的方向。在英文中,手写输入典型地沿水平书写轴增加,每个后继的字母数字输入在书写方向上为从左到右地沿水平轴跟随在前一个输入之后。在根据本发明教导的实施中,各种其它的书写轴和书写方向的替代方案也是可能的。
在一个优选实施例中,手写轴是水平的,手写输入形成一序列的字。这个优选实施例中,基本上平行的距离沿水平方向计算,该输出表明离散的连续段是否属于单独分离(separate)的字。在另一优选实施例中,手写轴是水平的,手写输入形成一序列单独分离的字符,它们可以是字母数字字符、在诸如汉语语言中的表意字符、或其它形式的字符、或书面通信的符号。在这个另一实施例中,该输出表明离散的连续段是否属于单独分离的字符。在又一优选实施例中,手写轴是垂直的,手写输入形成一序列单独分离的字符,它们可以是字母数字字符、表意字符或者其它手写文本。在该优选实施例中,书写轴是垂直的,基本上平行的距离在垂直方向上对准,该输出表明的连续段是否属于单独分离的字符。在一个优选实施例中,手写轴是垂直的,手写输入形成一序列单独分离的字、字母数字输入、或其它的手写输入例如一个垂直的字或号码表。在该优选的实施例中,书写轴是垂直的,基本上平行的距离在垂直方向上对准,该输出表明离散的连续段属于单独分离的手写输入例如单独分离的字。如上所述和将进一步讨论的,本发明通过公开一些优选实施例表明,书写轴可以存在任何角度,手写输入更通常地可以解释为对应于含有一个或多个离散的连续段的离散元素(它们可包括但也不限于字符和文字)。将这里所说明的方法应用到各个优选实施例的任一个实施例时,只需要改变所应用的座标系统就可使这种变动可按照本文的教导来做。
参看图1,该图示出本发明的一个优选方法。本发明可用于具有离散的连续段的一个或多个手写输入。本发明的优选实施例可用于具有离散的连续段的两个或多个手写输入。为了便于说明起见,这里只应用两个离散的连续段S1和S2来说明。图1示例的优选方法在步骤110由诸如PDA或其它装置接收由两个离散的连续段S1和S2组成的手写输入。具有接收手写书入功能的其它装置包括但不限于下列装置计算机,调制解调器,寻呼机,电话机,数字或交互式或其它电视机,带有数字图形输入卡的装置,传真装置,扫描装置,以及具有捕获手写输入能力的任何装置。在步骤120,最好一接收手写输入就辨认两个离散的连续段S1和S2之间基本的垂直边界b1和b2。判定基本上垂直于书写轴的边界b1和b2是通过在笔划顺序S1中找出沿书写方向有最大位移点并在笔划顺序S2中找出沿书写方向有最小位移点来实现的。基本上垂直的边界b1是在笔划顺序S1中沿书写方向具有最大位移的点的位移值。基本上垂直的边界b2是在笔划顺序S2中沿书写方向具有最小位移的点的位移值。依次计算S1中每一点在书写方向上的位移,将该值与一个初始时为很大负值的存储值相比较,便可判定沿书写方向具有最大位移的基本上垂直的边界b1。如果计算出的位移值大于存储值,则该存储值由这个计算出的位移值取代。在所有的点都被检测之后,存储值便具有在该笔划顺序中寻找到的最大位移值的值。一个相似的程序是以一个很大的正值开始的,通过计算S2中依序的每点在书写方向上的位移并将该值与一个初始时为很大正值的存储值相比较,寻找出沿书写方向具有最小位移的S2中的点。如果计算出的位移值小于存储值,则该存储值由这个计算出的位移值取代。本优选的方法在步骤130,计算出一个第一基本平行的距离d';这里,d'=b2-b1。
参看图1,在步骤140将第一基本上平行的距离d'与第一预定阈值t'相比较。如果d'大于或等于t',则在步骤145本优选方法断定第一连续的离散段S1和第二连续的离散段S2属于手写输入的不同段。例如,如果d'大于t',则本优选方法断定S1和S2是手写输入的不同字、字符或其它元素。预定阈值t'的选择按照具体的实施例作出。关于阈值t'的选取将在别处详述。
如果d'的值小于阈值t',则发生进一步的处理。为了判定两个离散的连续段S1和S2是否组成手写输入中个别的离散的连续段S1和S2,诸如单独的字、字符或其它元素,需要计算一个第二基本上平行的距离d″。计算几个基本上平行的距离并选取那些距离中最短的一个,便寻找出该第二基本上平行的距离d″。在优选实施例中,这是在步骤150首先计算由离散的连续段S1和S2一起对着垂直于书写轴最大尺度来完成的。在步骤160再将此最大尺度划分成为基本上平行于书写轴的许多等高的节。然后,在步骤170为每节寻找出在S1与S2之间基本上平行的距离。在步骤180从许多节中选择出在S1与S2之间基本上平行的最小或最短距离为d″。在图1所示的优选方法中,一旦找出基本上水平的距离d″后,将距离d″与第一基本上水平的距离d'相结合,有助于最终判定S1和S2是否是同一手写输入的一部分,还是手写输入的单独分离的离散的连续段的一部分。在步骤190,计算d'和d"的加权平均值,优选的加权平均值的公式是dw=(q'd'+q″d″)/(q'+q″)。凭对实际手写数据的经验测试业已发现采用d'和d″的加权平均比之单独的d'或d″更精确。在一个优选实施例中,q'=q″,但适当地选取q'与q″两者不相等,能使结果进一步优化。此外,q'和q″各自可等于零,但不能同时等于零。
在步骤195将加权平均值dw与第二阈值t″相比较。如果加权平均值dw小于阈值t″,则在步骤197本优选方法断定S1和S2是手写输入同一段的一部分。如果加权平均值dw大于或等于阈值t″,则在步骤199本优选方法将断定S1和S2是手写输入的不同的离散的连续段。
本优选方法选择t'和t″是具体实施例的细节。在一个实施例中,设定t'值可在一大组数据中测量d'值并能从伪选择中选取最佳地区分开真实分割点的值来实现。在另一优选实施例中,t'可以设定为一个常数,它对应于输入装置上诸输入导向件(guide)之间距离的某个分数值。在又一优选实施例中,t'值动态地变化可以作为在垂直于书写轴的S1与S2上测量所得到尺度的一个分数值。在再一个实施例中,t'值可以在该方法执行之前由用户直接设定。在所示的优选实施例中,t'设定为垂直于书写轴的S1与S2上测量所得到尺度的1/3,它对英文、字母数字文本可给出良好的结果。许多其它的设定t'的方式也可以考虑,它们对于不同的解决方案可能是最佳的。在不同的实施例中确定t″的各种方式与为确定t'所叙述的那些方式相似。
图2示出一个用于一种优选实施例的图解表示。该实施例中,离散的连续段S1210和S2220对应于两个英文单字,书写轴230是水平的,书写方向270为从左到右。在该优选实施例中,对于任一点沿书写方向的位移简单地是有关该点的X座标值,因而基本上垂直的边界b1240是S1210中最右点的X座标值,基本上垂直的边界b2250是S2220中最左点的X座标值。基本上平行的距离d'260是b1与b2之间展开的距离。
如图3所示的另一个图解,离散的连续段S1310和S2320对应于两个汉字,书写轴330是垂直的,书写方向370为从上到下。在该实施例中,对于任一点沿书写方向370的位移简单地是有关该点的Y座标值乘以-1(假定是标准座标系统,其中当座标值从下向上移动时Y值增加),因而基本上垂直的边界b1340是S1310中最下点的Y座标值乘-1,基本上垂直的边界b2350是S2320中最上点的Y座标值乘-1。
在其它实施例中,b1和b2的值可以计算,使手写输入作简单的几何旋转,将座标系统中两个基本轴之一对准到书写轴上,然后应用如上叙述的方法。这种运算简单明了,人们结合这里的讲解是能理解的。另外,在其它实施例中,当书写方向并不与座标系统中两个基本轴之一对准时,可简单地将离散的连续段几何投影到书写轴上,然后应用三角学计算投影点对座标系统原点的位移,便可计算出沿书写方向上各笔划点的位移。这是众所周知的数学方法,这里可以采用。
如前所述,如果d'小于t',则计算过程继续进行。在许多情况下,事实上属于单独的字或字符的段的位置可使d'小,甚至是负的,但它仍可能判定S1和S2属于不同的字或字符。图4为一个实施例示出这种情况的一个例子,其中,S1410和S2420是两个英文字。在这个例子中,d'460实际为负值,b1440大于b2450。在这个例子中,书写轴430是水平的,书写方向470为从左到右。
在书写轴为水平的一个实施例中,由S1和S2对着的、垂直于书写轴的最大尺度可借助于寻找出S1和S2中呈现出的最小和最大Y座标值来计算。为了寻找出最小Y座标值,将一个存储值初始赋以一个很大的正值,然后依次检测S1和S2中的每一个点,若其Y座标值小于该存储值,则对存储值指配以那个Y座标值。用类似的方法寻找出最大的Y座标值。将最大与最小的Y座标值相减,便能计算出垂直于书写轴的尺度。S1和S2中的所有座标点均处于这个尺度之内。
在一个优选实施例中,只考虑S1和S2的点的一个子集,即只考虑所涉及的边界附近处一个固定数目的点,可以更有效地完成这一计算过程。因为这些点子才最可能对所作的量度造成影响。
在书写轴为垂直方向的另一个实施例中,由S1和S2对着的、垂直于书写轴的最大尺度可借助于寻找出S1和S2中呈现的最小和最大X座标值来计算。为了寻找出最小X座标值,将一个存储值初始赋以一个很大的正值,然后依次检测S1和S2中的每一个点,若其X座标值小于该存储值,则对存储值指配以那个X座标值。类同的方法用来寻找出最大的X座标值。将最大与最小的X座标值相减,便能计算出垂直于书写轴的尺度。
在书写轴既非水平方向也非垂直方向的另一个实施例中,可以旋转图像平面来使书写轴对准座标系统中的X或Y轴;上面叙述了当书写轴既非水平也非垂直时基本上平行的距离d'的计算。
一旦寻找出垂直于书写轴的尺度,一个优选实施例便将这个尺度划分成为基本上平行于书写轴的一些节(band),以使每一节描述为通过S1和S2的一个狭窄部分。在每一节内,寻找出在书写方向上具有最大位移的S1中的那个点,并寻找出在书写方向上具有最小位移的S2中的那个点。对于S1来说,对每一节的存储值初始化到一个很大的负值,便能有效地完成这一工作。依次地检验S1中的每一点。首先,检验其垂直于书写轴的位移,看它处于哪个节中。由于诸多节在垂直于书写轴方向上跨越S1和S2的整个尺度,所以它对于S1和S2中的任一点可保证寻找到这样一个节。如果优选实施例中按上述在计算垂直尺度时只考虑S1和S2内的一个点子集,则垂直尺度可能不包含S1和S2中的全部点,因而必须检验每一点,以保证它位于一个节内。如果不是这样,则对它不作进一步的考虑。当辨认出该节之后,将书写方向内该点的位移与关于该节的存储值相比较。如果位移值较大,便将它指配给存储值。当S1中的全部点都这样地检验过之后,每一节内的存储值将包含这样的点的最大位移,即S1中那个节内遇到有最大位移的点。如果S1中无点处在一个给定的节内,则存储值将保留在初始的很大负值上。对于S2采用一个类似的程序利用在每节内初始化到很大正值的第二存储值,以寻找出S2中每节内在书写方向上具有最小位移的点的最小位移量。如果S2中一个给定节内无点存在,则对于该节的第二存储值保留在其初始的很大正值上。
在这个操作结束时,每节具有两个存储值,对应于该节中在S1书写方向上的最大位移值以及该节中在S2书写方向上的最小位移值。如果任一个存储值从其初始的很大负值或正值未改变,则该节的信息不用于任何进一步的计算中。否则,为每节计算从S2的点位移的存储值中减去S1的点的位移的存储值得到一个距离。这些距离的最小值是检测依次对每节的距离来找到的,并将找到的最小值存储起来。该最小距离基本上是水平的距离d″。如果d″小于零,则对它指定为零;当S1和S2相接触或重叠时,会发生这种情况。
图5示出一个实施例,其中,书写轴是水平的,书写方向为从左到右。在这个实施例中,节510的数目为10。寻找位于每节520内的S1的最右点,寻找位于那节530内的S2的最左点。对于S1来说,这是通过对每节将存储值初始化到一个很大的负值完成的。依次检验S1中的每一点。首先,检查它的Y座标,看看哪节位于其内。这些节跨越整个高度,即S1和S2的尺度540,所以可保证对S1和S2中的任一点寻找到一个节。一旦识别出该节,就将该点的X座标值与该节的存储值相比较。如果X座标值较大,则将它指配给存储值。当S1中的全部点这样地检验过之后,每节内的存储值将包含S1中那节所遇到的最右点的X座标值。如果在S1中无点处在一个给定的节内,则存储值将保留在其初始的很大的负值上。对于S2使用一个类似的程序,在每节内应用一个初始化到很大正值的第二存储值,以寻找出S2中每节内最左点的X座标值。
如前所述,对每节根据存储的位置计算出d″值。从多节的量值中选择出S1和S2之间基本上平行的最小或最短距离,作为d″值。然后,利用加权平均,将距离d"与d'组合,与t″相比较。根据同t″的比较,本发明的方法可断定离散的连续段S1和S2是否属于同一手写输入或分离的手写输入。
本领域的技术人员显然知道,这里公开的发明可以用无数的方式作出改动,并采用许多不同于具体地提出和上面所说明的优选形式。因此,所附的权利要求书意在覆盖对本发明的所有改动,它们都落在本发明及其等效项的精神实质和范畴之内。
权利要求
1.一种识别手写输入的方法,其特征在于,包括以下步骤接收手写字符输入,该手写字符输入包含有至少第一和第二两个离散的连续段;至少计算该第一和第二离散的连续段之间基本上平行的距离;应用该基本上平行的距离来判定该第一和第二离散的连续段是否属于单独分离的手写字符输入。
2.根据权利要求1的方法,其特征在于,至少有下列步骤之一(a)计算步骤,用以计算基本上平行的至少一个距离包括计算第一和第二离散的连续段之间多个基本上平行的距离的步骤,其中,进一步选择的计算多个基本上平行的距离的步骤中,还包括识别具有最小值的基本上平行的距离的步骤,其中,进一步选择的、利用平行距离来判定第一和第二离散的连续段是否属于分离的手写输入的步骤中包括利用具有最小值的基本上平行的距离来判定第一和第二离散的连续段是否属于分离的手写输入的步骤。(b)还包括以下步骤识别第一和第二离散的连续段的每一个的基本上垂直的边界;计算第一和第二离散的连续段的基本上垂直的边界之间的距离;其中,进一步选择的、利用平行距离来判定第一和第二离散的连续节段是否属于分离的手写输入的步骤中包括对第一和第二离散的连续段还应用基本上垂直的边界之间的距离来判定第一和第二离散的连续段是否属于分离的手写输入的步骤。
3.一种识别手写输入的方法,其特征在于,它包括以下步骤接收手写输入,该手写输入含有至少第一和第二两个离散的连续段;识别第一和第二离散的连续段的每一个的基本上垂直的边界;计算第一和第二离散的连续段的基本上垂直的边界之间的第一距离;当该第一距离至少不超过第一预定阈值时,计算在第一和第二离散的连续段之间至少一个基本上平行的距离;应用该第一距离和该基本上平行的距离来判定第一和第二离散的连续段是否属于分离的手写输入。
4.根据权利要求3的方法,其特征在于,利用第一距离和基本上平行的距离来判定第一和第二离散的连续段是否属于分离的手写输入的步骤中包括将加权的第一距离和加权的基本上平行的距离相加以得到一个总值、将该总值除以2以得到一个最终值、将该最终值与第二预定阈值相比较的步骤。
5.根据权利要求4的方法,其特征在于,至少具有下列情况之一(a)第一和第二预定阈值相同;(b)第一和第二预定阈值不同;(c)对第一距离和基本上平行的距离两者加上加权系数,以分别得到加权第一距离和加权基本上平行的距离,以使第一距离等于加权的第一距离,基本上平行的距离等于加权的基本上平行的距离。
6.根据权利要求3的方法,其特征在于,在计算第一和第二离散的连续段在基本上垂直的边界之间的第一距离的步骤中包括以下步骤当基本上平行的距离值为正时,应用这基本上平行的距离作为基本上平行的距离;当基本上平行的距离值为负时,便应用预定值作为基本上平行的距离;其中,进一步选择的预定值为零。
7.根据权利要求3的方法,其特征在于,在计算至少一个基本上平行的距离的步骤中包括计算在第一和第二离散的连续段之间多个基本上平行的距离的步骤。
8.根据权利要求7的方法,其特征在于,计算多个基本上平行的距离的步骤进一步包括识别具有最小值的基本上平行的距离的步骤;其中进一步选择的、应用第一距离和基本上平行的距离来判定第一和第二离散的连续段是否属于分离的手写输入的步骤中包括利用具有最小值的基本上平行的距离和第一距离来判定第一和第二离散的连续段是否属于分离的手写输入的步骤。
9.一种识别手写输入的方法,其特征在于,它包括以下步骤接收手写输入,该手写输入含有至少第一和第二两个离散的连续段,它们的配置基本上平行于一个书写轴;识别第一和第二离散的连续段的每一个的垂直于书写轴的一个边界;计算第一和第二离散的连续段的边界之间的第一距离;当该第一距离至少超过一个第一预定阈值时,可断定第一和第二离散的连续段属于分离的手写输入;当该第一距离并不是至少超过第一预定阈时,计算在第一和第二离散的连续段之间的至少一个基本上垂直的距离,该基本上垂直的距离是基本上垂直于书写轴的;应用该第一距离和基本上平行的距离来判定第一和第二离散的连续段距离是否属于分离的手写输入。
10.一种判定两个离散的连续段属于分离的手写输入的方法,其特征在于,包括以下步骤接收手写输入,该手写输入含有至少第一和第二两个离散的连续段;识别第一和第二离散的连续段的每一个的基本上垂直的一个边界,这种基本上垂直的边界是互相间最邻近的边界;计算第一和第二离散的连续段的基本上垂直的边界之间的一个间隔距离;当该间隔距离至少超过一个第一预定阈值时,可断定第一和第二离散的连续段属于分离的手写输入;当该间隔距离并不是至少超过第一预定阈时,计算第一和第二离散的连续段的多个部分之间的多个基本上平行的间隔距离;应用该间隔距离和基本上平行的诸间隔距离中的最小一个距离来判定第一和第二离散的连续段是否属于分离的手写输入。
全文摘要
本发明判定手写输入S
文档编号G06K9/62GK1128073SQ95190365
公开日1996年7月31日 申请日期1995年5月8日 优先权日1994年5月10日
发明者约汉·L·C·西伯德 申请人:摩托罗拉公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1