识别字符或图形的方法和系统的制作方法

文档序号:6410319阅读:136来源:国知局
专利名称:识别字符或图形的方法和系统的制作方法
技术领域
本发明涉及到识别字符或图形的方法和系统,特别涉及识别联机状态下输入的手写汉字字符或诸如此类字符的方法和系统。
已经提出了许多识别联机状态下输入的手写字符或图形的自动系统。例如,日本专利申请4-220410号(美国专利5,343,537号),公开了一种方法和装置,此方法和装置是用于在一个混合的复杂体中特定的手写标记自动识别手写文本,此方法和装置考虑一个或几个特征向量空间和每个空间的高斯模拟,也考虑全部空间中所有有关的样品的贡献。
特别是,为了响应书写者用输入笔(Stylus)在电子板上的书写,要对包含书写者手写输入的已知字符进行采样。机器显示出手写空间中被采样的已知字符的参数向量,并响应手写空间中被采样已知字符的参数向量,提供出手写原型。接着,为了响应书写者在电子板上用输入笔进行的书写,对包含书写者手写输入的待识别未知字符进行采样,然后显示出手写空间中被采样未知字符的参数向量。根据对手写原型与手写空间中被采样未知字符的参数向量进行的弹道式(ballistic)比较,包括制作候选字符表,于是估计出有多大可能性在手写原型中至少有一个是将被识别成未知字符的候选字符。接着,为了识别被采样未知字符(其中包括了要识别的输入手写体),要对候选字符表进行弹道式分析。
此外,申请号为4-328128的日本专利申请公开了一种使用隐蔽式马尔可夫模型识别手写体的方法和系统。
总的说来,如果假定那些字符是以正确的笔划顺序书写出来的,那么在联机状态下手写体字符识别方法识别出字符的概率是较高的。上述技术背景也描述了根据这种笔划顺序,即时间系列信息进行字符识别的方法。然而,由于有许多笔划的字符(如汉字)中存在取决于书写者的笔划顺序变异,因此,即使是同样的字符,时间系列信息也会变化。所以,根据笔划顺序对同样的字符也会给出错误的识别。
另外,此种字符识别方法是把从已输入字符中提取并制作出来的模式与字符识别系统中字典里已存入的许多模式相比较,并计算出每次比较的比分来完成的。因此,如果,对一个已知字符来说,其字典中要预先存入预期数量的模式,而且考虑到上述笔划顺序的变异性,字典的容量就必定会变得很大。这样就不仅会造成字典容量的增大,而且会减慢识别速度。
本项发明是为了解决上述问题而完成的,而其目的是提供一种对输入的笔划顺序和数量没有任何限制的识别技术。此技术适用于识别日语,因为日语的笔划比英语或其它类似语言的笔划多得多,它尤其适用于识别汉字。
此外,本发明的另一个目的在于不是用字符的笔划顺序来完成字符识别工作,这就是说,是用时间系列信息以外的信息来完成的。
本发明提供了一种把输入进书写区域的字符或图形作为对象进行识别的方法,此方法包括以下步骤对已输入的字符或图形进行采样,以提取出采样信息;根据采样信息从已输入的字符或图形中确定多个局部区域;为每个局部区域计算出特征向量;根据每个特征向量在书写区中的位置得到特征向量系列;然后根据特征向量系列识别已输入的字符或图形。书写区是指要识别的字符或图形所在的区域。根据局部区域在此书写区中的位置依次排列特征向量就能获取特征向量系列。在联机字符识别中,通常书写文字区是字符输入的框架区或下划线区。
获取向量系列的方法最好是根据局部区域在书写区里从一边到另一边的位置次序来确定。再详细点儿说,也就是最好参考对应于向量系列的局部区域在以X、Y坐标代表的书写区里中的位置,并按y坐标递减顺序排列这些向量。
此外,本发明的另一方面提供了一种用于识别联机输入到书写区的字符或图形的方法,此方法包括以下步骤对联机输入的字符或图形采样,来提取采样信息;根据采样信息从已输入的字符或图形中确定多个局部区域;为每个局部区域计算出特征向量;根据联机写入的字符或图形的笔划顺序来获得第一组特征向量系列;根据每个特征向量在书写区的位置来获得第二组特征向量系列;然后根据第一组和第二组向量系列来识别已输入的字符或已输入的图形。
获得第二组系列的步骤最好是根据局部区域在书写区从一边到另一边的位置次序来确定。
此外,识别步骤最好用隐蔽式马尔可夫模式方法或DP(动态编程)匹配法来识别已输入字符或已输入图形。
本发明的另一方面提供了用于识别联机输入的字符或图形的系统,此系统包括对联机输入的字符或图形采样来提取采样信息的装置;根据采样信息从已输入字符或已输入图形确定多个局部区域并为每个局部区域计算出特征向量的装置;根据每个特征向量在书写区的位置来获得特征向量系列的装置;以及根据向量系列来识别已输入字符或已输入图形的装置。
获取向量系列的装置最好是根据局部区域在文字区中从一端到另一端的顺序来计算出向量系列。


图1是本实施例中手写识别系统的方框图。
图2是本实施例中手写识别系统的流程图。
图3是对特征向量的向量系列进行计算的流程图。
图4显示了在电子书写板上的书写区中输入“ ”时的一组点和局部区域。
图5的表中列出了组成每个局部区域的点。
图6的表中列出了每个局部区域的y坐标。
现在,举例说明作为本发明最佳实施例的联机字符识别。图1是本发明中手写识别系统的方框图。此系统包括一个计算机平台110。此计算机平台110有一个由随机存取存储器(RAM)118、中央处理机(CPU)120以及输入/输出接口122组成的硬件部件116。此计算机平台110有一个操作系统112,可能还会有微指令代码114。
接在计算机平台110上的是用来对联机输入书写区的字符或图形进行采样以便提取采样信息的装置,例如电子书写板126。电子板126允许用户用输入笔在书写区里写入想要写的字符或图形。也要接上许多外围设备,如终端124,数据存储设备128,以及一个打印机130。
在平台110中运行一个手写识别程序102。借助手写识别程序102运行一个前端104、一个再定位机制106以及一个模式单元108。前端104是用来根据采样信息从已输入的字符或图形中确定许多局部区域,并为每个局部区域计算出特征向量。再定位机制106是用来根据每个特征向量在书写区的位置计算出向量系列。例如这点可以根据局部区域在书写区中从一端到另一端的位置次序计算出来。另外,模式单元108是用来根据向量系列识别用户输入的字符或图形。
图2是本实施例中手写识别方法的流程图。首先,联机对输入的字符或图形采样,以便提取采样信息(步骤201)。采样是对用户在电子书写板上的书写区里写入的字符或图形进行的。
根据采样信息,从已输入字符或图形中确定许多局部区域(步骤202)。这就是说,每个由步骤201提取的采样点均是在书写区里由(Xn,Yn)坐标限定的点。这些点间的距离不等,这是因为书写者的书写速度不总是稳定的,表现为用户书写速度的函数。然后,要使这些单个采样点规格化,使其成为间隔统一的点P(Xm,Ym)。这样,由电子板126捕获的以时间为准的采样点转化为一个所有点间距离统一而且与时间无关的表现形式。
接着,根据间隔统一的已规格化的采样点P,确定局部区域。局部区域是指对于识别某个字符或图形是必需的特征性部分。一般来讲,局部区域通常是包括一个笔划的起始点、一个笔划的终止点、或x和y坐标的最大值和最小值的那些区域。局部区域决定由等量的点(如2K+1)组成的,而一个字符或图形都有多个局部区域。
对于通过步骤202获得的多个局部区域要计算出相关的特征向量(步骤203)。此步是在图1所示的系统前端104中与步骤202中进行的。
特征向量是指具有局部区域特征的向量,例如,象每个点在区域中的坐标一类参数,以及类似笔划转弯的点间关系。特征向量还包括反映局部区域中的一个点与同一个区域中的另一个点相距多远的参数。
如果某个给定字符的特征向量数是N,那么在此步骤中要确定反映N个特征向量的次序的向量系列。然而,如下文所述,向量系列的次序是根据其在书写区的位置而变化的。因此,最初的向量系列是在本步骤中获得到的,这样,这些向量可以取任何顺序。在本步骤中获取的最初向量是根据联机状态下输入的字符或图形的笔划顺序排列的,也就是说,是按时间系列顺序排列的。
根据特征向量在书写区里的空间位置将所获得的多个特征向量按次序排列好,以便获取向量系列(步骤204)。如果在步骤203中已经按照笔划顺序获得了向量系列,那么该向量系列会通过根据其在书写区中的空间位置所进行的再排列而产生次序变化。下文将详述此步骤。此步是在再定位装置106中进行的。
最后,根据向量系列来识别已输入字符或图形(步骤205)。根据步骤204得到的向量系列在书写区的空间位置,用隐蔽式马尔可夫模式(HMM)或其它类似方法,将向量系列模式化后,此系统就可以识别出已输入字符或图形了。就是说,把特征向量的向量系列用隐蔽式马尔可夫模式或其它类似模式依次与字典中已存的特定字符进行比较,然后计算出比分,最后通过鉴别出比分高的一个即完成了字符或其它符号的识别工作。当然也可以通过动态编程(DP)匹配方法来完成识别工作。因此,将本发明用于最初利用笔划次序来完成字符识别工作的隐蔽式马尔可夫模式(HMM)或其它类似模式中,即便是笔划顺序错误和用连笔方式书写的字符,本发明也能完成识别工作,而且识别率较高。
参考图3进一步详述上述步骤204。首先,要确定由步骤202中获得的某个特定字符或图形的局部区域的y坐标(步骤301)。然而,由于局部区域包括大量采样点而且它们的y坐标落在预定范围内,为了鉴别局部区域的y坐标,某种算法是必要的。然后,为了鉴别与某个特征向量fn相对应的局部区域的y坐标yn,如果局部区域含有2K+1个点,那么第K+1点便被定义为局部区域的y坐标。例如,假设局部区域含有五个点,那么第三个点P的y坐标就被确定为该局部区域的y坐标。这样定义就使局部区域的y坐标易被鉴别出来。
按上述方法确定的局部区域的y坐标为根据向量系列在书写区的空间位置重新排列特征向量的向量系列提供了一个评判标准,因此,本发明中还可设想此定义外的其它各种方法。例如,2K+1个点各自的y坐标有可能被确定下来,而其平均值有可能被定义为该局部区域的y坐标。
尽管此实施例中向量系列的重新排列是根据y坐标来进行的,但当然也可以根据x坐标来进行。本发明的重要特征在于字符识别是利用根据书写区中特征向量的空间位置确定的向量系列来完成的,而不是使用以联机状态下输入字符的笔划顺序为依据的特征向量的向量系列来进行的。因此,本发明并不限于这一途径,只要能抓住在书写区从一端到另一端的各局部区域y坐标值之间的关系就可以了。
要确定是否已获得所有局部区域中的y坐标(步骤302)。如果“否”,程序就要回到步骤301,而且要不断反复进行此步骤直到确定了所有局部区域的y坐标。通过这一系列步骤,确定了含有字符或图形的N个局部区域的所有y坐标。
如果步骤302中为“是”,即确定了所有局部区域的y坐标,那么就会产生数组A(步骤303)。数组A含有相应局部区域的特征向量和y坐标作的组合(fn,yn)为参数。
数组A是按局部区域的y坐标减少的次序排列的(步骤304)。此排序可以用一个已知排序算法来完成。
确定了向量系列(步骤305)。从已排序的数组A中取出特征向量然后将其按那种顺序排列后形成向量系列。
通过步骤205中比较用上述过程(步骤301到305)确定的向量系列和系统字典中所存内容,就能完成字符识别。
现在,作为字符识别的具体实例,如图4所示的电子板上的书写区里输入了“”。如图4(a)所示,输入书写区的字符被规格化成34个点组成的集合,由横向x坐标(图中未画出)及纵向y坐标来标识。如图4(b)所示,根据规格化了的34个点组成的集合,此系统确定了六个局部区域(r1到r6)。局部区域的构成包括五个点,这五个点确定为包括已输入字符的每个笔划的起点和末点以及x坐标值和y坐标值成为最大或最小的区域。
图5所示是用此方法鉴别的六个局部区域(r1到r6)以及组成局部区域的点Pn。然而,r1,r2,r3和r6包括图4(a)未示点Po。使用这种虚点的目的是使一个笔划的起点和末点成为局部区域的中心,使鉴别包括起、末点的局部区域的算法与处理其它区域的算法一致对待而不需加以区分。因此,如图5所示,由于局部区域的y坐标是第n+1点,换句话说,因为n=2,就是第3个点,此虚点Po的具体数值就不重要了。
获得了分别与局部区域r1到r6相对应的特征向量f1到f6,并根据输入笔划顺序确定了向量系列(f1,f2,f3,f4,f5,f6)。图6所示为此例中各局部区域的y坐标。因此,含有特征向量和局部区域y坐标的数组A如下数组A(f1,100),(f2,59),(f3,73),(f4,27),(f5,0),(f6,19)用排序程序,按y坐标的递减次序进行,所得结果如下数组A(f1,100),(f3,73),(f2,59),(f4,27),(f6,19),(f5,0),因此,只提取特征向量,就能获得根据y值坐标大小排序的向量系列。
即使如图4(C)所示的“ ”的笔划是翻转的,所得向量系列也完全相同。通常,即使是同一个字符,由于笔划顺序不同,也会形成不同的向量系列,因此,即使是一个字符也要求字典中准备许多模式。然而,在本方法中,因为不论笔划顺序如何都能获得同样的特征向量的向量系列,因此字典只需一种模式。结果,能使字典的存储量减少,从而缩短识别时间。
然而,在实际字符识别过程中,笔划少的字符与那些笔划多的字符常常混在一起。在这种情况下,如果同时使用本发明中的根据其在书写区中的空间位置进行识别的方法以及根据其笔划顺序进行识别的方法,然后再参考双方的比分,就能提高字符识别率。另外,此方法也适用于如下情况如果因为书写者的原因,字符的笔划顺序很有可能会不一样,那么就强调用本发明方法的比分;如果字符的笔划顺序不大有可能不同,那就强调根据笔划次序进行识别的比分。在此情况下,就需要计算出两个向量系列其中一个是根据联机输入字符或图形的笔划顺序来数组特征向量,另一种是根据书写区局部区域(对应于特征向量)的排列顺序来排列特征向量,然后比较各向量系列的模式以便获得比分。
在本发明中,由于能获得相同的特征向量而不受用户输入字符笔划顺序的影响,因此字符模式数量就能减少。由此,存储模式的字典的容量就能减小,这样就能高速进行字符识别。
〔符号说明〕102-手写识别程序104-前端108-模式单元110-计算机平台112-操作系统114-微指令代码116-硬件部件118-随机存取存储器(RAM)120-中央处理机(CPU)122-输入/输出接口124-终端
126-电子书写板128-数据存储装置130-打印机
权利要求
1.识别一个字符或一个图形的方法,此方法包括以下步骤对某一区域中存在的一个字符或图形采样,以提取采样信息;根据上述采样信息,确定上述字符或上述图形中的多个局部区域。为每个上述局部区域计算出一个特征向量。通过依次排列每个上述特征向量来获取上述特征向量系列,这种排列是根据上述局部区域在上述字符或图形所在区域中的位置确定的;以及根据上述特征向量系列识别上述字符或上述图形。
2.如权利要求1中所述方法,其特征在于获取上述特征向量系列的上述步骤是根据上述字符所在的平面区域中从一边到另一边上述每个局部区域的位置次序完成的。
3.一种识别联机输入的字符或图形的方法,该方法包括以下步骤对输入到书写区域中的字符或图形采样,以便提取采样信息;根据上述采样信息,从上述字符或图形中确定多个局部区域;对每个上述局部区域计算出一个特征向量;根据每个上述特征向量在上述书写区域中的位置获取一系列上述特征向量;以及根据上述特征向量系列识别上述字符或图形;。
4.如权利要求3中所述方法,其特征在于获取上述特征向量系列的步骤是根据上述书写区域中从一到另一边各局部区域的位置次序完成的。
5.如权利要求1到4所述的方法,其特征在于上述字符是汉字字符。
6.用于识别联机输入到一个书写区域的图形中的字符的方法,此方法包括以下步骤对输入的字符或图形采样,以便提取采样信息;根据上述采样信息,从上述字符或上述图形中确定多个局部区域;为每个上述局部区域计算出一个特征向量;根据联机写入的上述字符或图形的笔划顺序获取第一组上述特征向量。根据每个上述特征向量在上述书写区域内的位置获得第二组上述特征向量;以及根据第一组和第二组特征向量识别已输入的上述字符或上述图形。
7.如权利要求6中所述方法,其特征在于获得第二组上述特征向量的步骤是根据上述局部区域在上述书写区域内从一边到另一边的次序进行的。
8.如权利要求1到7所述方法,其特征在于上述识别步骤利用隐蔽式马尔可夫模型方法或动态编程(DP)匹配方法识别输入的上述字符或图形。
9.用于识别已输入到书写区域的一个字符或一个图形的系统,此系统包括对一个已输入字符或图形采样以便提取采样信息的装置;由上述采样信息确定上述字符或图形的多个局部区域并对每个上述局部区域计算出一个特征向量的装置;根据每个上述特征向量在上述书写区域中的位置而得到上述特向量系列的装置;以及根据上述特征向量系列识别上述字符或图形的装置。
10.如权利要求9中所述系统,其特征在于获得上述特征向量系列的装置根据在上述书写区域中上述局部区域从一边到另一边的位置次序计算上述特征向量系列。
11.如权利要求9中所述系统,其特征在于上述识别装置中使用了隐蔽式马尔可夫模型或动态编程匹配方法。
全文摘要
一种不是使用输入字符的笔划顺序而是使用其他信息来完成字符识别的方法。用于识别联机输入书写区的字符或图形的方法,此方法包括以下步骤对联机输入的字符或图形采样,以便提取采样信息;根据采样信息从已输入字符或图形中确定多个局部区域;为每个局部区域计算出特征向量;根据每个特征向量在书写区的位置计算出向量系列;然后根据向量系列对已输入的字符或图形进行识别。
文档编号G06K9/46GK1145494SQ9610699
公开日1997年3月19日 申请日期1996年7月31日 优先权日1995年8月24日
发明者山崎一孝 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1