字符检索装置的制作方法

文档序号:6559005阅读:202来源:国知局
专利名称:字符检索装置的制作方法
技术领域
本发明涉及基于由可输入笔迹的指示装置以手写方式输入的图形,进行字符或符号的检索的字符检索装置,特别涉及可以高效地进行与所输入的图形的至少一部分一致的字符或符号的检索的字符检索装置。
背景技术
以往,可以通过手写板或鼠标等可输入笔迹的指示装置用手写方式来输入字符或符号的信息处理装置是广泛熟知的。以往关于在这样的信息处理装置中,通过比较所输入的图形和字典中登记的字符或符号的图形,来判断手写输入的图形与字符字典中登记的字符或符号中的哪一个一致或相似的手写字符识别(也称为手写字符检索),提出了各种方法。
此外,从下述方面考虑而非常方便在用户要输入汉字的情况下,由于汉字比假名笔划数多,所以即使字符整体的输入未结束,只要能够基于部分图形检索字符而向用户提示相似度高的字符候选,就可省去用户输入的麻烦,即使用户不记得汉字整体的结构也可进行汉字输入。在图7中示出通过部分图形进行的字符检索的一例。在图7所示的例子中,用户手写输入汉字的至少一部分时,显示包含与所输入的部分图形相似的图形的字符候选作为检索结果。从而,用户从显示出的字符候选中选择自己要输入的汉字即可。
作为现有的手写字符识别或手写字符检索方法,例如公知有如下的技术。
例如,在日本特开平7-57056号公报中公开了如下的在线字符识别装置通过按照笔划、部分图形、以及字符的顺序识别手写字符,从而可以进行高速且高精度的字符识别。
此外,在日本专利第3155577号公报中公开了如下的字符识别方法通过在输入和字典的各笔划之间求出相似度而生成相似度矩阵,对各行唯一地确定在各列上具有最大的相似度的元素,通过取其最大相似度之和而求出字符间的相似度,从而识别字符。根据该字符识别方法,可以进行不取决于笔顺的字符检索。
进而,在小高和巳、若原徹、梅田三千雄,‘ 択的ストロ一ク結合による画数·筆順に依存しないオンライン文字認識’,电子通信学会论文志,昭和58年5月,J66-D,No.5,p.593-600中公开了如下的技术在笔划-笔划列间取大致的对应,然后,与笔划对应不重复地取得匹配,从而实现允许笔顺不同或笔划的连写的字符识别。
此外,在日本特开平8-123903号公报中公开了如下的技术以部分图形作为对象进行图形识别,从部分图形和汉字之间的对应表中搜索汉字,由此实现部分图形字符检索。
此外,在日本特开平9-190499号公报中公开了如下的方法使用存储了笔划形状和笔划间的相对关系的字典,一笔一划地依次对照输入图形和字典图形的笔划,从而进行部分图形字符检索。该方法不受可检索的部分图形的类型的限制,所以可以进行灵活的检索。
在通过手写进行字符输入的情况下,特别是在笔划数多且复杂的汉字的情况下,有时难以正确地书写字符整体。此外,本来由多笔构成的部分图形常常因连写而被按照1笔来输入。因此,最好在没有正确地书写字符整体的情况下,或在多笔按照1笔来输入的情况下,均可进行基于部分图形的字符检索。
例如,在上述的日本特开平8-123903号公报所记载的检索方法中,无法检索在部分图形和字符之间的对应表中不存在的字符,写了部分图形字典中所不存在的图形也无法检索。此外,难以作成完整的对应表或部分图形字典。
此外,在日本特开平9-190499号公报所记载的方法中,由于一笔一划地将输入图形的笔划与字典图形的笔划进行对照,因此在多笔被按照1笔来输入的情况下,不能进行正确的检索。
作为应对多笔连写的字符识别方式,提出了上述的小高等的‘選択的ストロ一ク結合による画数·筆順に依存しないオンライン文字認識’所记载的方法,但该方法是以完成了整个字符的书写为前提的方式,不能减轻用户输入的麻烦。此外,该方法包含除去对应的重复的处理,以使笔顺不同的笔划对应起来,高精度地进行识别,这导致处理量的大幅增加。

发明内容
鉴于上述课题,本发明的目的在于提供在多笔被按照1笔来输入的情况下,也可以进行基于部分图形的字符或符号的检索的字符检索装置。
为了达成上述目的,本发明的字符检索装置将可输入笔迹的指示装置的输入图形和登记在字典存储部中的字符或符号的图形进行对比,提示整体或部分与所述输入图形一致或相似的字符或符号,其特征在于,在所述字典存储部中至少登记了表示作为构成字符或符号的笔划的字典笔划的数据和表示各字典笔划的笔顺的笔顺数据,作为表示该字符或符号的图形的数据,所述字符检索装置具有笔划相似度计算部,其参照所述字典存储部,求出输入图形中所包含的输入笔划和一个字典笔划或作为连续书写的多个字典笔划的字典笔划列之间的相似度;相似度表作成部,其基于由所述笔划相似度计算部求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算部,其根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有的输入笔划的最大相似度的总和,作为最大相似度和;惩罚值减法部,其参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值作为图形一致度,在预定的惩罚条件不成立时,将所述最大相似度和作为图形一致度;以及检索结果提示部,其按照所述惩罚值减法部求出的图形一致度的高低顺序,提示字符或符号,作为检索结果。
关于本发明,‘笔划’是指一次落笔到提笔为止书写的笔迹。此外,‘图形’是指由一个或多个‘笔划’形成的、字符或符号的整体或部分图形。
根据上述结构,相似度表作成部基于由笔划相似度计算部求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表,相似度和计算部根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有的输入笔划的最大相似度的总和,作为最大相似度和,从而在本来应多笔书写的图形被按照1笔来输入的情况下,也可以进行基于部分图形的字符或符号的检索。此外,惩罚值减法部参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值,求出图形一致度,可以提高基于部分图形的字符或符号的检索精度。
在上述的字符检索装置中,所述惩罚条件如下例如,对某一输入图形中所包含的一个输入笔划提供最大的相似度的字典笔划列对于同一输入图形中所包含的其它的输入笔划也提供最大的相似度。
在上述的字符检索装置中,所述惩罚条件如下例如,存在对某一输入笔划以大于等于一定值的相似度对应的字典笔划,并且在该字典笔划之后,没有对所述输入笔划的下一个输入笔划以大于等于所述一定值的相似度对应的字典笔划。
在上述的字符检索装置中,所述惩罚条件如下例如,没有对输入笔划以大于等于一定值的相似度对应的字典笔划。
在上述的字符检索装置中,优选为所述笔划相似度计算部根据弹性匹配法,求出输入笔划和字典笔划列之间的相似度。
此外,为了达成上述目的,本发明的程序使计算机执行文字检索处理,该文字检索处理将可输入笔迹的指示装置的输入图形和登记在字典存储部中的字符或符号的图形进行对比,提示整体或部分与所述输入图形一致或相似的字符或符号,该程序的特征在于,在所述字典存储部中,至少登记了表示作为构成字符或符号的笔划的字典笔划的数据和表示各字典笔划的笔顺的笔顺数据,作为表示该字符或符号的图形的数据,所述程序使计算机执行以下处理笔划相似度计算处理,参照所述字典存储部,求出输入图形中所包含的输入笔划和一个字典笔划或作为连续书写的多个字典笔划的字典笔划列之间的相似度;相似度表作成处理,基于由所述笔划相似度计算处理求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算处理,根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有的输入笔划的最大相似度的总和,作为最大相似度和;惩罚值减法处理,参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值,作为图形一致度,在预定的惩罚条件不成立时,将所述最大相似度和作为图形一致度;以及检索结果提示处理,按照所述惩罚值减法处理所求出的图形一致度的高低顺序提示字符或符号,作为检索结果。
根据本发明,可以提供在多笔被按照1笔来输入的情况下,也可以进行基于部分图形的字符或符号的检索的字符检索装置。


图1是本发明的一种实施方式的字符检索装置的方框图。
图2是用于说明本发明的一种实施方式的字符检索装置中的输入图形(a)和字典图形(b)之间的对应关系的图。
图3是表示本发明的一种实施方式的字符检测装置中的附加了惩罚条件的情况下的输入图形(a)和字典图形(b)的组合的一例的图。
图4是表示本发明的一种实施方式的字符检测装置中的附加了惩罚条件的情况下的输入图形(a)和字典图形(b)的组合的一例、以及在与所述输入图形的组合中未附加惩罚条件的字典图形(c)的例子的图。
图5是表示本发明的一种实施方式的字符检测装置中的附加了惩罚条件的情况下的输入图形(a)和字典图形(b)的组合的一例、以及在与所述输入图形的组合中未附加惩罚条件的字典图形(c)的例子的图。
图6是表示本发明的字符检索方法的步骤的一例的流程图。
图7是现有的部分图形字符检索装置的画面例。
具体实施例方式
以下,参照

本发明的一种实施方式。
另外,本发明涉及用于进行基于部分图形的字符或符号的检索的装置、方法、以及程序等,在作为检索对象的字符或符号中包含假名、汉字、以及数字以外,还包含任意的符号。此外,在本说明书以及权利要求书中,将这些字符或符号的检索简称为‘字符检索’。
本发明被作为连接了手写板或鼠标等可输入笔迹的指示装置的、计算机或便携信息终端等来实施。在这样作为计算机或便携信息终端等来实施本发明的字符检索装置的情况下,计算机或便携信息终端可具有字符检索功能以外的任意的功能。此外,本发明也可以作为在连接了可输入笔迹的指示装置的计算机环境上执行的字符检索程序、或记录了这样的字符检索程序的程序记录介质来实施。
以下,作为本发明的字符检索装置的一种实施方式,说明具有字符检索功能的计算机。
图1是表示在本实施方式的计算机中,通过执行本发明的字符检索程序而实现的功能结构的方框图。
如图1所示,本实施方式的计算机1具有指示装置11和显示器12,以使用户输入手写字符。此外,计算机1具有笔划相似度计算部13、相似度表作成部14、相似度和计算部15、惩罚值减法部16、笔划字典存储部17、输入笔划存储部18、以及检索结果提示部19,以实现字符检索功能。另外,笔划相似度计算部13、相似度表作成部14、相似度和计算部15、惩罚值减法部16、以及检索结果提示部19通过计算机1的处理器(未图示)执行安装在存储器(未图示)中的字符检索程序而使其功能得以实现,不一定存在与这些各部分分别对应的硬件。
作为指示装置11,使用了鼠标或手写板等的、可手写输入的输入装置。另外,在使用显示器一体型的手写板作为指示装置11的情况下,可省略显示器12。
由用户进行手写输入时,指示装置11对输入图形的每个笔划取得输入笔划数据。所取得的输入笔划数据被存储在输入笔划存储部18中。另外,‘1笔’是指从落笔到提笔为止(在鼠标的情况下,从拖动开始到拖动结束为止)绘制出的连续的轨迹。
这里,输入笔划数据是表示为(xi,yi,ti)0≤i<n的时序的特征点数据。xi,yi是特征点坐标,ti是提笔落笔信息,i是特征点序号,n是整数。特征点是从笔划的采样数据中提取特征性的点而得到的。对于特征点提取提出了递归最远点分离法、按照一定的时间间隔反复进行采样的方法、对方向成分进行量化的方法等各种方法。本发明不特别取决于特征点提取的方法。此外,在输入了多个笔划的情况下,对这些输入笔划的笔划数据、按照书写的顺序标以笔划号,存储在输入笔划存储部18中。在本实施方式中,附加了笔划号,但只要依次保存笔划数据或保存笔划数据列来以可知笔划顺序的方式保存,就不必非要附加笔划号。
在笔划字典存储部17中存储有以构成该图形的笔划表示各种字符或符号的图形的字典笔划数据。存储有以时序的特征点数据定义的字典笔划数据。字典笔划数据被表示为(vxij,vyij,vtij)0≤i<m,0≤j<k。
vxij,vij是特征点坐标,vtij是提笔落笔信息。j是特征点序号。i是该字符图形中的笔划号。按照各笔划的笔顺来附加笔划号。m、k是整数。
笔划相似度计算部13参照笔划字典存储部17,求出输入笔划和构成一个字符图形的字典笔划组中、一个字典笔划或连续书写的字典笔划列之间的相似度。所求出的相似度传递给相似度表作成部14。另外,‘字典笔划列’是指构成一个字符图形的多个字典笔划中、时序连续的多个笔划。换言之,在用户进行手写输入时,由于连写,常常将本来应多笔书写的部分按照1笔来书写。因此,笔划相似度计算部13通过将一个输入笔划与多个字典笔划(即,字典笔划列)依次进行对比来求出相似度。
笔划相似度计算部13在求出输入笔划和字典笔划列之间的相似度时,使用弹性匹配的方法。作为在弹性匹配中最为周知的方法之一有基于动态规划法的匹配(所谓DP匹配),但可应用于本发明的弹性匹配不限于DP匹配。另外,为了确定到字典笔划列的第几笔为止与一个输入笔划对应,考虑了如下的方法。即例如,在一个输入笔划和从字典笔划列的第1笔的笔划到第t笔的笔划为止所形成的图形之间的相似度s(t)大于同一输入笔划和从同一字典笔划列的第1笔的笔划到第(t+1)笔的笔划为止形成图形之间的相似度s(t+1)的情况下,确定为从字典笔划列的第1笔到第t笔为止的笔划与所述一个输入笔划对应。
由此,例如,在存在图2(a)所示的输入笔划Sin1和图2(b)所示的字典图形的情况下,笔划相似度计算部13可确定为与图2(a)的输入笔划Sin1对应的字典笔划是图2(b)的Sdic1以及Sdic2。
作为笔划相似度计算部13求出输入笔划和字典笔划列之间的相似度用的其它的方法,还有如下的方法。例如,将输入笔划的特征点(xp,yp)和字典笔划的特征点(vxiq,vyiq)之间的对应表示为[p,q],其局部的评价值由f(p,q)给出时,按照使f(p’,q’)最大的方式、从[p+1,q]、[p,q+1]、[p+1,q+1]中选择对应[p,q]的下一个对应[p’,q’],重复该动作。然后,在其重复处理的过程中,在输入笔划以及字典笔划同时达到最终笔划的时刻,结束匹配。
相似度表作成部14基于笔划相似度计算部13的处理结果,关于输入图形和登记在字典中的所有的字符图形的组合,作成字典笔划列相对于输入笔划的相似度的表(以后,将该表称为‘相似度表’。),至少暂时地进行存储。另外,‘作成相似度表’是指关于输入笔划和字典笔划列的所有的组合循环地求出相似度,不一定要求出表形式的输出。
这里,相似度表作成部14在作成一个输入图形和一个字符图形的相似度表时,关于构成该一个输入图形的各个笔划和以该一个字符图形的各个字典笔划为开头的字典笔划列的组合,使用笔划相似度计算部13求出相似度。换言之,如果将输入图形的笔划数设为nin,将登记在字典中的某一字符图形的笔划数设为ndic,则关于该输入图形和字符图形的组合作出nin×ndic大小的相似度表。
例如,假设输入图形的笔划数为3,登记在字典中的某一字符图形的笔划数为5。在该情况下,关于该输入图形和字符图形的组合,分别对于输入图形的三个笔划,通过笔划相似度计算部13求出与如下的(1)~(5)的5种字典笔划列之间的相似度,作成3×5的相似度表。假设将该相似度表的各元素表示为ss(i,j)。这里,i是输入图形中的笔划号,j是作为字典笔划列的开头的字典笔划号。
(1)由字符图形的字典笔划的第1笔~第5笔构成的字典笔划列;(2)由第2笔~第5笔构成的字典笔划列;(3)由第3笔~第5笔构成的字典笔划列;(4)由第4及第5笔构成的字典笔划列;(5)由第5笔构成的字典笔划列。
相似度和计算部15从由相似度表作成部14作成的相似度表中选出对各输入笔划提供最大的相似度的字典笔划列,关于所有的输入笔划,求出所选出的最大相似度之和st。即,通过以下的算式来求出和st。
st=∑[i=0~(nin-1)]max{ss(i,j)| 0≤j<ndic}惩罚值减法部16参照由相似度表作成部14作成的相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述笔划字典存储部中的字符或符号的图形之间成立的情况下,从由相似度和计算部15计算出的最大相似度和st中减去与该惩罚条件对应的预定的惩罚值。作为其结果得到的值成为输入图形和字符图形之间的图形一致度。在后面详细说明惩罚值的计算。
检索结果提示部19按照分别对于输入图形和登记在字典中的所有的字符图形的组合求出的图形一致度的大小顺序、将字符图形显示在显示器12上,作为检索结果。
这里,说明惩罚值减法部16的处理的细节。作为在惩罚值减法部16中,要进行惩罚值的减法运算的惩罚条件,例如考虑了以下的第一~第三条件。
第一条件是,惩罚值减法部16参照由相似度表作成部14作成的相似度表,使对某一输入图形中包含的一个输入笔划提供最大相似度的字典笔划列对同一输入图形中包含的其它输入笔划也提供最大相似度。在该情况下,惩罚值减法部16视为输入笔划和字典笔划之间的对应有重复,从最大相似度和st中减去预定的惩罚值p1。
如上所述,在本实施方式中,笔划相似度计算部13、相似度表作成部14、以及相似度和计算部15进行允许输入图形和字典的字符图形中的笔划对应的重复而计算相似度的处理。但是,如果这样允许输入图形的各笔划还与本来应对应的字典笔划以外的笔划重复地对应,则难以进行例如具有排列几个同样的笔划而成的图形的字符间的识别。上述第一条件的惩罚值减法运算具有在一定程度上减轻笔划的重复所引起的识别的困难度、达到高精度的作用。
例如,在将构成图3(a)所示的输入图形的三个输入笔划Sin1~Sin3与图3(b)所示的字符图形的字典笔划Sdic1~Sdic3进行比较来求出相似度的情况下,输入笔划Sin1和Sin2分别相对于字典笔划Sdic1具有最大相似度,输入笔划Sin3相对于字典笔划Sdic3具有最大相似度。如果没有通过惩罚值减法部16进行惩罚值减法运算,则关于所有的输入笔划Sin1~Sin3存在位置、形状都很相似的字典笔划,所以图3(a)的输入图形和图3(b)的字符图形之间的图形一致度变得非常高。但是图3(a)的输入图形不是图3(b)的字符图形的部分图形,所以图形一致度变得过高则不理想。因此,在满足了上述第一条件的情况下,惩罚值减法部16对提供最大相似度的笔划的重复施加惩罚,由此可以提高作为字符整体的检索的准确性。
第二条件是,存在对某一输入笔划a、按照大于等于一定值的相似度对应的字典笔划A时,在该字典笔划A之后,没有对输入笔划a的下一个输入笔划b、按照大于等于一定值的相似度对应的字典笔划。在该情况下,惩罚值减法部16从最大相似度和st中减去预定的惩罚值p2。由此,还可以对笔顺的不同施加一定程度上的惩罚。
例如,图4(a)的输入图形‘白’是图4(b)的字典图形‘鮮’和图4(c)的字典图形‘的’两者的部分图形。另外,假设图4(a)的输入图形是按照字符‘白’的正确的笔顺来手写输入而成的。这里,相对于图4(a)的输入图形的各笔划,图4(b)的字典图形‘鮮’也与图4(c)的字典图形‘白’同样,有具有非常相似的位置和形状的字典笔划。从而,如果仅考虑输入笔划和字典笔划列之间的相似度,则对于图4(a)的输入图形‘白’,图4(b)的字典图形‘鮮’越是与图4(c)的字典图形‘白’排列在同列上,则越能取得高的相似度。但是对于图4(a)的输入图形,最好是在左侧具有‘白’的字符与在左侧具有‘焦’的字符相比在检索结果中处于上位。
对于图4(a)的输入图形,图4(c)的字典图形‘的’的各笔划依次以高的相似度对应。但是,对于图4(a)的输入图形,图4(b)的字典图形‘鮮’的各笔划不一定以高的相似度对应。例如,图4(a)的输入图形‘白’的第一个笔划Sin1和图4(b)的字典图形‘鮮’的第一个笔划Sdic1的位置、形状都相似,可以取得高的相似度。但是,图4(a)的输入图形‘白’的第二个笔划Sin2和图4(b)的字典图形‘鮮’的第二个笔划Sdic2的形状差大,相似度低。
因此,根据上述第二条件,判断字典笔划是否按照输入笔划的笔顺、以高的相似度对应,在未对应的情况下,从最大相似度和st中减去预定的惩罚值p2。由此,得到如下效果对于图4(a)的输入图形‘白’,图4(c)的字典图形‘的’与图4(b)的字典图形‘鮮’相比,其在检索结果中的顺位更高。
第三条件是,存在没有按照大于等于一定值的相似度与字典笔划对应的输入笔划,换言之,没有可视为对应于某一输入笔划的字典笔划。此时,惩罚值减法部16从最大相似度和st中减去预定的惩罚值p3。
例如,图5(a)的输入图形的笔划Sin1~Sin5按照非常高的相似度与图5(b)的字典图形‘龍’的笔划Sdic1~Sdic5对应。但是图5(a)的输入图形的笔划Sin6与图5(b)的字典图形‘龍’的任何部分均不相似。如果仅考虑输入笔划和字典笔划列之间的相似度,则导致如下结果对于图5(a)的输入图形,尽管图5(b)的字典图形‘龍’不含有与输入笔划Sin6相似的笔划,但与含有与输入笔划Sin6相似的笔划的图5(c)的字典图形‘部’同样,具有高的图形一致度。
因此,根据上述第三条件,在输入图形的一部分与字典图形的任何部分均不相似的情况下,从最大相似度和st中减去预定的惩罚值p3,从而不使该字典图形的字符在检索结果中处于上位。
另外,分别根据上述第一~第三条件应用的惩罚值p1~p3通过实验来求出适当的值即可。例如,在作为惩罚值减法部16的运算结果得到的图形一致度可以取0~1000的值的情况下,一边使用各种手写字符图形进行仿真,一边每过预定值(例如每次50)变更惩罚值,采用得到最适当的检测结果的惩罚值即可。
如以上所述,关于惩罚值减法部16的惩罚值的应用条件,例示了第一~第三的三个具体条件,但在通过惩罚值减法部16计算惩罚值时,组合多个上述第一~第三条件而应用的做法也是有效的。
接着,参照图6说明本发明的字符检索方法的步骤。
用户使用指示装置11输入手写图形时,指示装置11对输入图形的每1个笔划取得输入笔划数据,存储在输入笔划存储部18中(步骤Op1)。
接着,相似度表作成部14选择输入图形的最初的笔划和登记在笔划字典存储部17中的最初的字符图形,作成输入笔划和该字符图形的字典笔划列的相似度表(步骤Op2)。在该步骤Op2中,求出输入笔划和字典笔划列之间的相似度时,笔划相似度计算部13例如使用弹性匹配的方法。
相似度表作成部14重复执行步骤Op2,直到相似度表完成为止,即如果将输入笔划数设为nin,将所述字符图形的字典笔划数设为ndic,则关于输入笔划和字典笔划列的所有的组合,完成nin×ndic大小的相似度表为止(在步骤Op3中为‘是’)。
接着,相似度和计算部15从步骤Op2所作成的相似度表中选出对各输入笔划提供最大的相似度的字典笔划列,关于所有的输入笔划,求出所选出的最大相似度之和st(步骤Op4)。
接着,惩罚值减法部16基于步骤Op2所作成的相似度表计算惩罚值,从步骤Op4所计算出的最大相似度和st中减去所计算出的惩罚值,从而求出输入图形和字符图形之间的图形一致度(步骤Op5)。
重复上述步骤Op2~Op5,直到关于输入图形和登记在笔划字典存储部17中的所有的字符图形的组合求出图形一致度为止(在步骤Op6中为‘是’)。
并且,最后,检索结果提示部19按照相对于输入图形的图形一致度的高低顺序,在显示器12上显示作为检索结果的字符图形(Op7)。
通过以上的步骤,在多笔被按照1笔来输入的情况下,也可以高效地且高精度地检索包含与输入图形部分一致的图形的字符。
本发明可以作为即使在多笔被按照1笔来输入的情况下、也可以进行基于部分图形的字符检索的字符检索装置以及实现该字符检索装置的计算机程序而使用。
权利要求
1.一种字符检索装置,将可输入笔迹的指示装置的输入图形与登记在字典存储部中的字符或符号的图形进行对比,提示整体或部分与所述输入图形一致或相似的字符或符号,其特征在于,在所述字典存储部中至少登记了表示作为构成字符或符号的笔划的字典笔划的数据和表示各字典笔划的笔顺的笔顺数据,作为表示该字符或符号的图形的数据,所述字符检索装置具有笔划相似度计算部,其参照所述字典存储部,求出输入图形中所包含的输入笔划和一个字典笔划或作为连续书写的多个字典笔划的字典笔划列之间的相似度;相似度表作成部,其基于由所述笔划相似度计算部求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算部,其根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有输入笔划的最大相似度的总和,作为最大相似度和;惩罚值减法部,其参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值,作为图形一致度,在预定的惩罚条件不成立时,将所述最大相似度和作为图形一致度;以及检索结果提示部,其按照所述惩罚值减法部所求出的图形一致度的高低顺序,提示字符或符号,作为检索结果。
2.如权利要求1所述的字符检索装置,其中,所述惩罚条件是对某一输入图形中所包含的一个输入笔划提供最大的相似度的字典笔划列对同一输入图形中所包含的其它的输入笔划也提供最大的相似度。
3.如权利要求1所述的字符检索装置,其中,所述惩罚条件是存在对某一输入笔划、按照大于等于一定值的相似度对应的字典笔划,并且在该字典笔划之后,没有对所述输入笔划的下一个输入笔划、按照所述大于等于一定值的相似度对应的字典笔划。
4.如权利要求1所述的字符检索装置,其中,所述惩罚条件是没有对于输入笔划、按照大于等于一定值的相似度对应的字典笔划。
5.如权利要求1~4中的任意一项所述的字符检索装置,其中,所述笔划相似度计算部根据弹性匹配法,求出输入笔划和字典笔划列之间的相似度。
6.一种字符检索方法,将可输入笔迹的指示装置的输入图形与登记在字典存储部中的字符或符号的图形进行对比,提示整体或部分与所述输入图形一致或相似的字符或符号,其特征在于,在所述字典存储部中至少登记了表示作为构成字符或符号的笔划的字典笔划的数据和表示各字典笔划的笔顺的笔顺数据,作为表示该字符或符号的图形的数据,所述字符检索方法包括笔划相似度计算处理,参照所述字典存储部,求出输入图形中所包含的输入笔划和一个字典笔划或作为连续书写的多个字典笔划的字典笔划列之间的相似度;相似度表作成处理,基于由所述笔划相似度计算处理求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算处理,根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有输入笔划的最大相似度的总和,作为最大相似度和;惩罚值减法处理,参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值,作为图形一致度,在预定的惩罚条件不成立时,将所述最大相似度和作为图形一致度;以及检索结果提示处理,按照所述惩罚值减法处理所求出的图形一致度的高低顺序,提示字符或符号,作为检索结果。
7.一种程序,使计算机执行文字检索处理,该文字检索处理将可输入笔迹的指示装置的输入图形和登记在字典存储部中的字符或符号的图形进行对比,提示整体或部分与所述输入图形一致或相似的字符或符号,该程序的特征在于,在所述字典存储部中至少登记了表示作为构成字符或符号的笔划的字典笔划的数据和表示各字典笔划的笔顺的笔顺数据,作为表示该字符或符号的图形的数据,所述程序使计算机执行以下处理笔划相似度计算处理,参照所述字典存储部,求出输入图形中所包含的输入笔划和一个字典笔划或作为连续书写的多个字典笔划的字典笔划列之间的相似度;相似度表作成处理,基于由所述笔划相似度计算处理求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算处理,根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有输入笔划的最大相似度的总和,作为最大相似度和;惩罚值减法处理,参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值,作为图形一致度,在预定的惩罚条件不成立时,将所述最大相似度和作为图形一致度;以及检索结果提示处理,按照所述惩罚值减法处理所求出的图形一致度的高低顺序,提示字符或符号,作为检索结果。
8.一种程序记录介质,记录了使计算机执行字符检索处理的程序,该字符检索处理将可输入笔迹的指示装置的输入图形和登记在字典存储部中的字符或符号的图形进行对比,提示整体或部分与所述输入图形一致或相似的字符或符号,该程序记录介质的特征在于,在所述字典存储部中至少登记了表示作为构成字符或符号的笔划的字典笔划的数据和表示各字典笔划的笔顺的笔顺数据,作为表示该字符或符号的图形的数据,所述程序使计算机执行以下处理笔划相似度计算处理,参照所述字典存储部,求出输入图形中所包含的输入笔划和一个字典笔划或作为连续书写的多个字典笔划的字典笔划列之间的相似度;相似度表作成处理,基于由所述笔划相似度计算处理求出的相似度,关于一个输入图形中所包含的输入笔划和登记在所述字典存储部中的一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算处理,根据所述相似度表,确定对各输入笔划提供最大相似度的字典笔划列,求出对于所有输入笔划的最大相似度的总和,作为最大相似度和;惩罚值减法处理,参照所述相似度表,在应降低相似度的预定的惩罚条件在输入图形和登记在所述字典存储部中的字符或符号的图形之间成立时,从所述最大相似度和中减去与所述条件对应的预定的惩罚值,作为图形一致度,在预定的惩罚条件不成立时,将所述最大相似度和作为图形一致度;以及检索结果提示处理,按照所述惩罚值减法处理所求出的图形一致度的高低顺序,提示字符或符号,作为检索结果。
全文摘要
本发明的字符检索装置在多笔被按照1笔来输入的情况下、也可以进行基于部分图形的字符检索。所述字符检索装置具有笔划相似度计算部(13),其参照至少登记了字典笔划和笔顺数据的笔划字典存储部(17),求出输入笔划和字典笔划列之间的相似度;相似度表作成部(14),其关于一个输入图形中所包含的输入笔划和一个字符或符号的字典笔划列的组合,作成相似度表;相似度和计算部(15),其根据所述相似度表,求出对于各输入笔划的最大相似度的总和;惩罚值减法部(16),其参照所述相似度表,在预定的惩罚条件成立时,从最大相似度和中减去预定的惩罚值来求出图形一致度;以及检索结果提示部(18),其按照图形一致度的高低顺序,提示字符或符号,作为检索结果。
文档编号G06K9/62GK101017531SQ20061008508
公开日2007年8月15日 申请日期2006年5月31日 优先权日2006年2月10日
发明者秋山胜彦 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1