手写文字识别方法及系统的制作方法

文档序号:6416518阅读:673来源:国知局
专利名称:手写文字识别方法及系统的制作方法
技术领域
本发明涉及识别手写文字的方法及系统。
近年来,一些携带式信息设备,用笔而不是用键盘进行文字输入。例如,对于PDC等所安装的显示输入一体型图形输入板,手写输入文字的识别率在对商品价值的评价上已成为重要的因素。作为这种文字识别方法,有将手写文字的笔划坐标与词典信息进行比较的方法、或将手写文字的笔迹方向连同其下笔顺序一起与词典信息进行比较的方法等。
前一种文字识别方法,必须对所有笔划坐标进行比较,特别是对于笔划顺序变化及笔划数变化大的文字,应处理的信息量将变得庞大,所以必需备有用于词典信息及处理程序的大容量存储器,此外,还存在着处理速度迟缓的问题。
另一方面,后一种文字识别方法,更具体地说,一面使手写文字中的各笔划的方向与该笔迹的开始时间(下笔顺序)相互对应一面进行检测,并将其与存储器内的词典信息进行比较,从而将词典内与其最相符的文字作为识别文字。与上述的比较笔划坐标的方法相比,在这种方法中,用于词典信息的存储器容量小,而速度也快。但是,由于是一面使笔迹方向与下笔时间相互对应一面进行检测,所以,当笔划顺序出错时,存在着识别率显著降低这样的问题。
特开平10-154206号公报,公开了一种检测手写文字中各笔划转折点的特征量并将其与词典信息进行比较而识别文字的方法。这种方法,通过对各笔划转折点的位置和转折角度进行检测并将其与词典信息进行比较而识别文字,所以可减少文字识别所需的信息量,此外,即使笔划顺序出错,也能正确地识别文字。但是,即使是这种方法,在各笔划连续书写的连笔字的情况下,由于随着这种书写方式将产生不规则的转折点,所以仍存在着不能准确地检测转折点的位置因而使识别率降低的问题。这种问题,在上述的比较笔划坐标的方法或比较笔迹方向的方法中,同样也会发生。
本发明的目的,是提供一种在限制文字识别处理所需信息量的同时即使是连笔字也能迅速且高效率地识别的文字识别方法及系统。
按照本发明的一个方面,识别输入手写文字的方法,包括以下步骤用虚拟笔划从输入手写文字的各实际笔划的终点连接到其下一个实际笔划的起点而形成1条线;检测用于特定1条线的转折的特征量;将所检出的特征量与预先生成的多个词典手写文字的各特征量进行对照,并计算输入手写文字与各词典手写文字的类似度;将计算出的类似度中具有最大类似度的词典手写文字判定为输入手写文字。上述特征量最好包含转折的位置,进一步,最好还包含转折方向及转折角度。
按照本发明的另一方面,识别输入手写文字的系统,备有形成装置,其构成是为了用虚拟笔划从输入手写文字的各实际笔划的终点连接到其下一个实际笔划的起点而形成1条线;检测装置,其构成是为了检测用于特定由形成装置形成的1条线的转折的特征量;词典存储器,用于存储预先生成的多个词典手写文字的特征量;对照装置,其构成是为了将由检测装置检出的特征量与词典存储器中的多个词典手写文字的各特征量进行对照,并计算输入手写文字与各词典手写文字的类似度;及判定装置,其构成是为了将由对照装置计算出的类似度中具有最大类似度的词典手写文字判定为输入手写文字。上述特征量最好包含转折的位置,进一步,最好还包含转折方向及转折角度。
上述系统,最好还备有包含多个输入特征空间存储区的暂存存储器。多个输入特征空间存储区,与预先设定的多个基准方向对应设置,且存储用于特定转折角度的方向变化特征量。上述词典存储器,包含多个词典特征空间存储区。多个词典特征空间存储区,与多个基准方向对应设置,且存储用于特定多个词典手写文字的转折角度的方向变化特征量。上述检测装置,按照与暂存存储器内的所检出的转折位置对应的地址存储方向变化特征量。上述对照装置,将暂存存储器内的各输入特征空间存储区与词典存储器内的对应的词典特征空间存储区进行对照。
上述检测装置,最好将多个基准方向中与转折方向邻接的两个基准方向看作转折方向。上述检测装置,最好还根据两个基准方向各自与转折方向的接近度对方向变化特征量进行加权,并将该加权后的方向变化特征量存储在与两个基准方向分别对应的输入特征空间存储区内。
上述方法及系统,在将手写文字的各实际笔划用虚拟笔划连接后检测转折位置,并将其与词典信息进行比较而识别文字,所以,即使是连笔字,也很容易使输入手写文字的转折位置与词典手写文字的转折位置相对应,其结果是使识别率提高。并且,除转折位置外还检测转折方向和角度,因而使识别率得到进一步提高。
另外,通过使转折方向按预先设定的多个基准方向规格化,可以减少应存储在词典存储器内的信息量,同时,也加快了处理速度。


图1是表示本发明第1实施形态的手写文字识别系统的总体结构的功能框图。
图2是表示构成图1所示手写文字识别系统的计算机系统的总体结构的功能框图。
图3是表示用于使图2所示计算机系统起到作为图1所示的手写文字识别系统的作用的程序的流程图。
图4是表示用于生成应存储在图1所示词典存储器内的文字识别词典的方法的流程图。
图5是用于根据图3所示的程序说明图1所示手写文字识别系统的动作的图。
图6是表示在图3所示的程序中用于检测转折方向的8个基准方向和输入网格存储器的图。
图7是表示在图3所示的程序中检出的转折角度的图。
图8是用于说明在图3所示的程序中将方向变化特征量存储在输入网格存储器内的步骤的图。
图9是表示本发明第2实施形态的手写文字识别系统用的程序的流程图。
图10A和B是用于说明图9所示平滑处理步骤的一例的图。
图11是表示图10A和B所示平滑处理用的程序的流程图。
图12A~C是用于说明图9所示平滑处理步骤的另一例的图。
图13是表示图12A~C所示平滑处理用的程序的流程图。
图14表示本发明第3实施形态的手写文字识别系统用的程序的流程图。
第1实施形态参照图1可知,第1实施形态的手写文字识别系统,备有显示输入一体型图形输入板1、主控制单元2、文字识别单元3、词典存储器4、及暂存存储器5。
图形输入板1,包含LCD(液晶显示)装置1a及二维数字化转换器1b。数字化转换器1b,用于检测用笔输入的手写文字的坐标。LCD装置1a,用于随时显示输入到数字化转换器1b的手写文字。LCD装置1a的坐标与数字化转换器1b的坐标一一对应。因此,用户可以像用笔在纸上写字一样在图形输入板1上输入文字。
主控制单元2,根据存储在存储器内的手写文字识别程序,对图形输入板1、文字识别单元3、词典存储器4及暂存存储器5进行控制。文字识别单元3,通过将由图形输入板1供给的输入手写文字的坐标数据与存储在词典存储器内的词典数据进行比较而识别输入手写文字,并将其识别结果供给主控制单元2。在词典存储器4内,存储着利用将在后文中详述的方法生成的文字识别词典。在暂存存储器5内,暂时存储由主控制单元2供给的输入手写文字的坐标数据。
主控制单元2、文字识别单元3、词典存储器4及暂存存储器5,由图2所示的计算机系统构成。参照图2可知,该计算机系统,备有CPU(中央处理装置)6、ROM(只读存储器)7、及RAM(随机存取存储器)8。手写文字识别程序,预先存储在ROM7内,或者可安装存有手写文字识别程序的存储插件9,并将该程序从存储插件9读到RAM8内。文字识别词典,同样也预先存储在ROM7内,或者从存储插件9读到RAM8内。CPU6,根据存储在ROM7或RAM8内的手写文字识别程序,执行文字识别处理。这里,采用存储插件9作为存储手写文字识别程序的存储媒体,但也可以采用CD-ROM、软盘、DVD(数字视盘)等代替存储插件9。
当用笔等在图形输入板1上写下文字时,数字化转换器1b按规定的时间间隔(例如1/100秒)检测该手写文字的坐标,并将该手写文字的时间序列坐标数据供给主控制单元2。主控制单元2,根据所供给的坐标数据,将该手写文字显示在LCD装置1a上,同时将该坐标数据传送到文字识别单元3。文字识别单元3,随时将所供给的坐标数据存储在暂存存储器5内。主控制单元2,还从检测文字的书写笔划的开始点起利用定时器(图中未示出)判断笔是否在规定时间以后离开了图形输入板1,当判定笔在规定时间以后离开了图形输入板1时,可以认为1个文字的书写已结束,并指令开始文字的识别。
文字识别单元3,响应该文字识别开始指令,根据在此之前存储在暂存存储器5内的坐标数据计算手写文字的特征量。关于该特征量的计算方法,将在后文中说明。文字识别单元3,将该计算出的特征量按每个文字与存储在词典存储器4内的特征量进行比较,从文字识别词典中选择类似度最高的文字作为候选识别文字,并将该识别结果供给到主控制单元2。主控制单元2,根据该识别结果将在此之前显示在LCD装置1a上的手写文字删去,并在其同一位置显示新的印刷体的文字。
更具体地说,如图3所示的手写文字识别程序,存储在ROM7或RAM8内。CPU6,根据该手写文字识别程序执行文字识别处理。此外,存储在词典存储器4内的文字识别词典,利用如图4所示的方法生成。
以下,参照图3~图5说明上述手写文字识别系统的手写文字识别方法及其所需的文字识别词典的生成方法。
首先,在步骤S1中,如图5(a)所示,对在规定的框10内输入的手写文字11按非线性形式进行规格化。由于进行这种规格化处理,所以,即使在框10内的文字写得小时,也能将该文字在框10内最大限度地放大。另外,由于按非线性而不是按线性进行规格化处理,所以,即使输入手写文字11的某1笔划与其他笔划相比特别长因而使文字的整体均衡性恶化时,也能将其修整成均衡性良好的文字。例如,在Tsukumo,“Handprinted Kanji OCR Develment”IEICE TRANS.INF.& SYST,VOL.E79-D.NO.5 MAY 1996.PP.411-416、Hamanaka et.al.“On-LineJapanese CharacterRecognition Experiments by on Off-LineMethod Based on Nomalization-cooperated FeatureExtraction”IEEE,2nd ICDAR,OCT.20-22.1993,pp.204-207等中公开了非线性规格化的方法。这里,按非线性形式对输入手写文字进行了规格化,但代替这种形式也可以按线性进行规格化处理。
其次,在步骤S2中,如图5(b)所示,用虚拟笔划13从规格化后的手写文字11的各实际笔划(实际书写的笔划)12的终点连接到其下一个实际笔划12的起点,由此形成1条线。
然后,在步骤S3~S9中,检测用于特定该一笔写就的文字的转折的特征量。更具体地说,该特征量包括转折位置(转折点的坐标)、转折方向(转折后笔划的延伸方向)、及转折角度(转折前的笔划延伸方向与转折后的笔划延伸方向之间的角度)。
即,首先,在步骤S3中,如图5(b)所示,检测转折位置14。
接着,在步骤S4中,检测转折方向。为检测该转折方向,采用如图6所示的预先设定好的8个基准方向(右、右上、上、左上、左、左下、下、及右下)。这里,应检测的转折方向,如图7所示,是转折后笔划的延伸方向。实际的转折方向,有时与图6所示的8个基准方向中的任何一个方向都一致,但大多数情况下不一致,而是位于任意2个基准方向之间。图6中举例示出的转折方向,位于「右方向」和「右上方向」之间。因此,转折方向,可用后文所述方法按8个基准方向量化。
如图6所示,相对于8个基准方向,设置着8个输入特征空间记录区域(以下也称「输入网格存储器」)IM1~IM8。输入特征空间记录区域IM1~IM8,设置在图1所示的暂存存储器5(图2所示的RAM8)内。各输入网格存储器IM1~IM8,具有8×8网格块。当检测如图6所示的转折方向时,将与该转折方向邻接的两侧的基准方向(右方向和右上方向)看作转折方向,从而选择输入网格存储器IM1和IM2。
下一步,在步骤S5中,检测转折角度Dθ。转折角度Dθ,如图7所示,是转折前的笔划延伸方向与转折后笔划延伸方向(转折方向)之间的角度。这是用于特定转折角度的方向变化特征量。
然后,在步骤S6中,如图6所示,检测转折方向与右基准方向之间的角度差α、及转折方向与右上基准方向之间的角度差β。β/(α+β)为右基准方向对转折方向的接近度,α/(α+β)为右上基准方向对转折方向的接近度。
接着,在步骤S7中,根据角度差α、β对转折角度(方向变化特征量)Dθ进行加权。更具体地说,分别由下式(1)和(2)计算用于右基准方向的加权方向变化特征量f(x、y、1)、及用于右上基准方向的加权方向变化特征量f(x、y、2)。f(x,y,1)=βα+β×Dθ··(1)]]>f(x,y,2)=αα+β×Dθ···(2)]]>
例如,假定α=18°、β=27°,则方向变化特征量Fdc1和Fdc2,如下式所示。
f(x、y、1)=(3/5)Dθf(x、y、2)=(2/5)Dθ对在步骤S3中检出的所有转折位置,进行上述处理。
下一步,在步骤S8中,将输入网格存储器IM1~IM8清除,以便删去与前一个输入手写文字有关的数据。
然后,在步骤S9中,将方向变化特征量存储在输入网格存储器IM1~IM8内。存储方向变化特征量的地址,对应着在步骤S3中检出的转折位置。因此,如图5(b)所示的输入手写文字的第2个转折位置14,如图5(c)所示,对应于第3行第1列的网格块,因此,第2个转折位置14的方向变化特征量按该网格块的地址存储。
另外,在如图6所示的转折方向的情况下,在步骤S7中算出的方向变化特征量f(x、y、1),存储在由步骤S4选择的输入网格存储器IM1内,在步骤S7中算出的方向变化特征量f(x、y、2),存储在由步骤S4选择的输入网格存储器IM2内。其结果是,各转折位置的方向变化特征量f(x、y、1),例如在输入网格存储器IM1中存储在图5(c)所示的全涂黑的网格块内。
在输入网格存储器IM1以外的输入网格存储器IM2~IM8中,方向变化特征量存储在图8所示的涂黑的网格块内。在图8中,在各个输入网格存储器IM1~IM8的下方,示出对应的基准方向。此外,在输入网格存储器IM1~IM8上,输入手写文字用点线示出,但在其上并不一定存储着数据。
例如,在与左上基准方向对应的输入网格存储器IM4内,没有存储任何方向变化特征量。这是因为在添加了虚拟笔划13后的输入手写文字11上不存在转折后向左上方向延伸的笔划12或13。在输入网格存储器IM2内,同样也没有存储任何方向变化特征量。
另外,在与上基准方向对应的输入网格存储器IM3内,按照与向上方向转折的转折位置对应的地址存储着其方向变化特征量。在其他输入网格存储器IM5~IM8内,也按照向对应的基准方向转折的转折位置存储着其方向变化特征量。
如上所述,对1个输入手写文字11,各转折方向的方向变化特征量,在8个输入网格存储器IM1~IM8上形成图案。这里,参照图4说明应存储在图1所示词典存储器4内的文字识别词典的生成方法。
文字识别词典,基本上按照与上述的从输入手写文字检测规定特征量的方法相同的方法生成。即,图4所示的步骤SD1~SD9,分别相当于图3所示的步骤S1~S9。
首先,如图5(d)所示,通过由多人书写相同文字,准备多个样本手写文字15。
其次,在步骤SD1中,按非线性形式对一个样本手写文字15进行规格化。
然后,在步骤SD2中,如图5(e)所示,用虚拟笔划13从样本手写文字15的各实际笔划12的终点连接到其下一个实际笔划12的起点而形成1条线。
下一步,在步骤SD3中,检测添加了虚拟笔划13后的样本手写文字15的转折位置14。
接着,在步骤SD4~SD9中,检测已检出的各转折位置的方向变化特征量,并按词典网格存储器的与该检出的转折位置对应的地址存储该方向变化特征。例如,在如图5(f)所示的状态下,将方向变化特征量存储在与右基准方向对应的词典网格存储器DM1内。
然后,在步骤SD10中,判断是否已对所有的样本完成了上述步骤SD1~SD9的处理。如尚未完成时,对该下一个样本手写文字15进行上述步骤SD1~SD9的处理。另一方面,当已完成时,如图5(f)所示,即可生成按与转折位置对应的地址存储了多个样本手写文字15的方向变化特征量的多个词典网格存储器DM1。
接着,在步骤SD11中,将多个词典网格存储器DM1中相同网格块的方向变化特征量相加并除以样本手写文字15的个数,从而计算出方向变化特征量的平均值。由此,可以得到例如图5(g)所示的1个词典网格存储器DM1。
对作为识别对象的所有文字,进行上述步骤SD1~SD11的处理。即,在步骤SD12中,判断是否已对所有文字进行了上述处理。如未进行时,对该下一个文字进行上述处理。另一方面,当已对所有文字进行了上述处理时,文字识别词典的生成即告结束。
再来参照图3,在步骤S9后面的步骤S10中,使在上述步骤S3中检出的转折位置模糊化。更具体地说,是将存储在输入网格存储器IM1~IM8的各个网格块内的方向变化特征量分散在其周围的网格块内。即,在与所检出的转折位置对应的网格块内存储最大的方向变化特征量,在其周围的8个网格块内存储比其小的方向变化特征量,进一步,在其周围的16个网格块内存储比其更小的方向变化特征量。按照这种方式。在离与所检出的转折位置对应的网格块越远的网格块内存储越小的方向变化特征量。
然后,在步骤S11中,将通过上述步骤S1~S10处理所得到的输入网格存储器IM1~IM8与利用图4方法生成的词典网格存储器进行对照。例如将变换到输入网格存储器IM1上的方向变化特征量与变换到对应的词典网格存储器DM1上的方向变化特征量进行对照。对其他的输入网格存储器IM2~IM8,也按同样的方式与对应的词典网格存储器相对照。由此,可以计算出输入手写文字11与词典手写文字的类似度。类似度rfc由下式(3)计算。rfc=Σv=18Σx,y=18f(x,y,v)×fc(x,y,v)Σv=18Σx,y=18f(x,y,v)2×Σv=18Σx,y=18fc(x,y,v)2···(3)]]>式中,f(x、y、v)是存储在输入网格存储器IMv的各网格块内的方向变化特征量,fc(x、y、v)是存储在词典网格存储器DMv的各网格块内的方向变化特征量。在上述的例中,x=1~8、y=1~8、v=1~8。
对文字识别词典内的所有词典手写文字,进行该类似度的计算。在步骤S12中,当对所有词典手写文字的类似度的计算尚未结束时,在步骤S11中,再次计算与该下一个词典手写文字对应的类似度。
另一方面,当对所有词典手写文字的类似度的计算已结束时,在步骤S13中,从该所计算出的类似度中选择具有最大类似度的词典手写文字,并将该文字识别为输入手写文字。
用户判断该识别结果是否正确,如果不正确,则依次检索具有第2个以下的类似度的词典手写文字,并从其中指定自己输入的文字。
按照如上所述的实施形态,在输入手写文字11上添加虚拟笔划13后检测用于特定转折的特征量,所以,即使是连笔书写的文字,也能正确地识别。此外,由于对转折位置14进行检测,所以,即使是笔划顺序出错时,识别率也不会有多大的降低。并且,由于将输入手写文字11的方向变化特征量与词典手写文字15的方向变化特征量进行对照,所以能使识别率进一步提高。
另外,由于将转折方向按8个基准方向量化,所以,可以削减应处理的信息量,因而能使处理速度加快。
另外,由于将方向变化特征量分散在其周围而使转折位置模糊化,所以,即使由于输入手写文字11形状异常而使输入手写文字11的转折位置14与词典手写文字15的转折位置14稍有差异时,也仍能正确地识别输入手写文字。
另外,由于根据由多人实际书写的样本手写文字生成文字识别词典,所以,对于具有各种书写习惯的非特定的多数用户,也仍能正确地识别其手写文字。
在上述实施形态中,是将与转折方向邻接的两个基准方向看作转折方向并将方向变化特征量存储在对应的2个输入网格存储器内,但也可以代替这种方式而将与转折方向最接近的基准方向看作转折方向并仅将方向变化特征量存储在对应的输入网格存储器内。在这种情况下,可以削减应处理的信息量,因而能使处理速度加快。
另外,在上述实施形态中,对实际笔划12的转折位置的方向变化特征量和实际笔划12与虚拟笔划13之间的转折位置的方向变化特征量不加区别地进行处理,但也可以对实际笔划12与虚拟笔划13之间的转折位置的方向变化特征量赋予比实际笔划12中的转折位置的方向变化特征量轻的权重。但是,相反,为了提高对笔划多的文字的识别率,也可以对实际笔划12与虚拟笔划13之间的转折位置的方向变化特征量赋予比实际笔划12中的转折位置的方向变化特征量重的权重。另外,虚拟笔划13越长,可以对其起点和终点的转折位置的方向变化特征量赋予越轻的权重。这样做的目的是,在从笔划的终点到其下一个笔划的起点的距离越短的部位越容易连笔书写的这样的假定下,提高其识别率。
第2实施形态上述第1实施形态,从实际笔划的终点到其下一个实际笔划的起点,仅简单地用线段连接,所以,在使各笔划连笔而用草书体书写文字时和在笔划不连笔而用楷书体书写文字时,在实际笔划与虚拟笔划的连接部分检测的特征量的图案在大多数情况下是不同的,也有可能导致识别率的降低。即,在连笔字的情况下,当添加虚拟笔划时,其连接部分大多不会成为锐角而是光滑曲线。
因此,在本第2实施形态中,如图9所示,在添加虚拟笔划的步骤S2之后及检测转折位置的步骤S3之前,增加进行平滑处理的步骤S21。在该步骤S21中,对实际笔划和虚拟笔划的连接部分进行平滑处理,使其变成光滑的曲线。对平滑处理可以考虑各种方法。在下文中,说明两种平滑处理方法。
第1种平滑处理方法,如图10A和B所示,变更实际笔划12的终点Pn的位置,以便使笔划12和13的转折部分变得光滑,并且,图中虽未示出,但对实际笔划12的起点Pm的位置也进行变更,以便使笔划12和13的转折部分变得光滑。在图10A所示的实际笔划12上,从已由数字化转换器1b按规定时间间隔检测的多个坐标点中以比其时间间隔长的规定时间间隔有选择地示出已检出的坐标点Pn-2、Pn-1、Pm+1、Pm+2。该第1种平滑处理方法,更具体地说,计算从实际笔划12的终点Pn到上述点Pn-1的距离|Pn-Pn-1|及从上述点Pn-1到上述点Pn-2的距离|Pn-1-Pn-2|,并根据离虚拟笔划13的起点Pn的距离等于上述距离|Pn-Pn-1|的虚拟笔划13上的点Pn+1及离该点Pn+1的距离等于上述距离|Pn-1-Pn-2|的点Pn+2的位置,变更上述终点Pn的位置。
以下,参照图11对该第1种平滑处理方法进行详细的说明。
在步骤S2中添加了虚拟笔划13后,在步骤S211中,在实际笔划12上选择2个点Pn-2、Pn-1。即,计算从实际笔划12的终点Pn到点Pn-1的距离|Pn-Pn-1|,进一步,计算从点Pn-1到点Pn-2的距离|Pn-1-Pn-2|。
然后,在步骤S212中,在虚拟笔划13上计算2个点Pn+1、Pn+2。即,在离实际笔划12的终点Pn的距离为上述距离|Pn-Pn-1|的位置上设定点Pn+1,进一步,在离点Pn+1的距离为上述距离|Pn-1-Pn-2|的位置上设定点Pn+2。
接着,在步骤S213中,计算应与终点Pn置换的新的终点P’n更具体地说,根据下式(4)和(5),计算新终点P’n的坐标。
Pn′(x)={Pn-2(x)+2Pn-1(x)+4Pn(x)+2Pn-1(x)+Pn+2(x)}/10 …(4)Pn′(y)={Pn-2(y)+2Pn-1(y)+4Pn(y)+2Pn+1(y)+Pn+2(y)}/10 …(5)式中,P(x)是P的X坐标,P(y)是P的Y坐标。
下一步,在步骤S214中,将终点Pn置换为算出的新的终点P’n。
对实际笔划12起点Pm,也进行与上述终点Pn同样的平滑处理。更具体地说,在实际笔划12上选择2个点Pm+1、Pm+2,进一步,在虚拟笔划13上计算2个点Pm-1、Pm-2。点Pm-1设定在离起点Pm的距离为距离|Pm+1-Pm|的位置。点Pm-2,设定在离点Pm-1的距离为|Pm+2-Pm+1|的位置。
然后,以与上述同样的方式计算应与起点Pm置换的新的起点P’m,并将起点Pm置换为计算出的新的起点P’m。
对实际笔划12和虚拟笔划13的所有连接点,都进行如上所述的平滑处理。
在这之后,进行与上述第1实施形态的步骤S3~S13同样的处理,以识别输入手写文字。但是,当进行如上所述的平滑处理时,文字识别词典也同样必须在进行平滑处理后生成。
可是,在图10A中,虽然可以在实际笔划12的终点的前面设定2个点Pn-1、Pn-2,但在实际笔划12短的情况下,在其终点之前有时只能设定1个点。在这种情况下,在虚拟笔划13上仅计算1个点Pn+1,而应与终点Pn置换的新的终点P’n,按下式(6)和(7)计算。Pn′(x)={2Pn-1(x)+4Pn(x)+2Pn+1(x)}/8…(6)Pn′(y)={2Pn-1(y)+4Pn(y)+2Pn+1(y)}/8 …(7)
另外,本方法,选择已按规定的时间间隔检出的点Pn-2、Pn-1,但代替这种方式,也可以检测离终点Pn的距离为规定距离D的新的点Pn-1,进一步,检测离该点Pn-1的距离为规定距离D的新的点Pn-2,并以与上述同样的方式根据这两个点Pn-1、Pn-2计算点Pn+1、点Pn+2。
另一方面,第2平滑处理方法,如图12A所示,将实际笔划12延长并添加虚拟终点Pn+1和虚拟起点Pm-1,接着,如图12B所示,添加虚拟笔划13,然后,如图12C所示,以与上述同样的方法进行平滑处理。以该第2平滑处理方法对输入手写文字进行平滑处理,与上述第1平滑处理方法相比,识别率提高。
其次,参照图13详细说明该第2平滑处理方法。
在对输入手写文字进行非线性规格化处理的步骤S1之后及添加虚拟笔划的步骤S2之前的步骤S220中,如图12A所示,将实际笔划12延长并添加虚拟终点Pn+1和虚拟起点Pm-1。虚拟终点Pn+1和终点Pn之间的距离|Pn+1-Pn|,与终点Pn和实际笔划12上终点Pn的前1个点Pn-1之间的距离|Pn-Pn-1|相等。另外,终点Pn的方向变化角与点Pn-1的方向变化角相等。即,一面使实际笔划12以与其终点Pn附近相同的步调趋势弯曲,一面延长而设定一个新的终点Pn+1。
另一方面,将实际笔划12延长并添加虚拟起点Pm-1。虚拟起点Pm-1和起点Pm之间的距离|Pm-1-Pm|,与起点Pm和实际笔划12上其下一个点Pm+1间的距离相等。另外,起点Pm的方向变化角与点Pm+1的方向变化角相等。即,也是一面使实际笔划12以与其起点Pm附近相同的步调趋势弯曲,一面延长而设定一个新的起点Pm-1。
接着,在步骤S2中,如图12B所示,添加虚拟笔划13。
然后,在步骤S221~S224中,以与上述步骤S211~S214同样的方法进行平滑处理。
即,在步骤221中,选择已检出的点Pn-1、Pn、Pm、Pm+1。
下一步,在步骤S222中,在虚拟笔划13上计算离虚拟终点Pn+1的距离为|Pn+1-Pn|的点Pn+2,进一步,在虚拟笔划13上计算离该点Pn+2的距离为|Pn-Pn-1|的点Pn+3。此外,在虚拟笔划13上计算离虚拟起点Pm-1的距离为|Pm-Pm-1|的点Pm-2,进一步,在虚拟笔划13上计算离该点Pm-2的距离为|Pm+1-Pm|的点Pm-3。
接着,在步骤S223中,与根据上述式(4)和(5)计算新的点P’n的坐标一样,计算应与虚拟终点Pn+1置换的新的虚拟终点P’n+1的坐标、及应与虚拟起点Pm-1置换的虚拟起点P’m-1的坐标。
然后,在步骤S224中,如图12C所示,将虚拟终点Pn+1置换为该算出的新虚拟终点P’n+1,进一步,将虚拟起点Pm-1置换为该算出的新虚拟起点P’m-1。
当按如上所述方法对输入手写文字进行平滑处理时,对词典手写文字也同样在进行平滑处理后生成文字识别词典即可。
另外,该第2平滑处理方法,将实际笔划12延长并只设定1个虚拟终点或虚拟起点,但代替这种方法,也可以在设定多个虚拟终点或虚拟起点,然后进行平滑处理。在这种情况下,只须按照与上述同样的方法计算虚拟终点或虚拟起点的坐标即可。即,某个虚拟终点或虚拟起点,可以根据其前一个点与在其更前面的另一个点之间的距离、及其更前面的另一个点的方向变化角设定。
上述第2实施形态,由于在添加虚拟笔划后对手写文字进行平滑处理,所以,可以使实际笔划与虚拟笔划的连接部分的形状与实际上连笔书写文字时的形状更为接近,其结果是使识别率进一步提高。
第3实施形态在上述实施形态中,在预先生成文字识别词典后,其内容不再变更。因此,当用户实际上书写的文字与样本手写文字明显不同时,识别率有可能降低。
本第3实施形态,涉及具有根据输入手写文字特征量更新词典手写文字特征量的学习功能的文字识别系统。
更具体地说,本第3实施形态,在上述步骤S13之后进行如图14所示的处理。如果用户实际输入的文字是类似度最大的文字,就指定该文字,如果不是则从类似度更低的文字中指定用户实际输入的文字。当文字识别词典中没有所输入的文字时,对该文字进行新的登录。
在步骤S31中,判断在文字识别词典中是否存在用户指定的文字。
当不存在时,在步骤S32中,根据输入手写文字将存储在输入网格存储器中的方向变化特征量存储在词典网格存储器内。由此,可将新的词典手写文字登录在文字识别词典内。
另一方面,当在文字识别词典中存在用户指定的文字时,在步骤S33中,对与该指定的文字对应的8个词典网格存储器进行选择。
接着,在步骤S34中,根据存储在输入网格存储器内的方向变化特征量,计算应存储在该选定的词典网格存储器内的新的方向变化特征量。假定存储在输入网格存储器内的方向变化特征量为f(x、y、v)、存储在词典网格存储器内的方向变化特征量为fc(x、y、v),则应存储在该词典网格存储器内的新的方向变化特征量fc’(x、y、v),可按下式(8)计算。fc′(x,y,v)=fc(x,y,v)+w×f(x,y,v)1+w···(8)]]>式中,w是权重系数,其范围为0<w<1。权重系数w越接近0,输入手写文字的方向变化特征量对词典手写文字的方向变化特征量的影响越小,而权重系数w越接近1,输入手写文字的方向变化特征量对词典手写文字的方向变化特征量的影响越大。
然后,在步骤S35中,将所算出的新的方向变化特征量fc’(x、y、v)存储在词典网格存储器内,以代替词典手写文字的方向变化特征量fc(x、y、v)。由此,即可将文字识别词典更新。
如上所述,本第3实施形态,由于可以根据输入手写文字更新文字识别词典,所以能学习用户的实际手写文字,其结果是使识别率进一步提高。
以上实施例仅是为了说明发明所例举的例子,本发明不限于此,本领域的技术人员均可在本发明的精神和主旨下进行各种变更。本发明的保护范围由下述的权利要求所界定。
权利要求
1.一种识别输入手写文字的方法,包括用虚拟笔划(13)从输入手写文字(11)的各实际笔划(12)的终点连接到其下一个实际笔划(12)的起点而形成1条线的步骤(S2);检测用于特定上述1条线的转折的特征量的步骤(S3~S9);将所检出的上述特征量与预先生成的多个词典手写文字的各特征量进行对照,并计算上述输入手写文字(11)与各词典手写文字的类似度(rfc)的步骤(S11);将上述计算出的类似度(rfc)中具有最大类似度的词典手写文字判定为输入手写文字(11)的步骤(S13)。
2.根据权利要求1所述的识别输入手写文字的方法,其特征在于上述特征量,包含上述转折的位置。
3.根据权利要求2所述的识别输入手写文字的方法,其特征在于上述特征量,还包含上述转折方向及上述转折角度中的至少一个。
4.根据权利要求3所述的识别输入手写文字的方法,其特征在于上述进行检测的步骤(S3~S9),包括根据预先设定的多个基准方向决定上述转折方向的步骤(S4)。
5.根据权利要求4所述的识别输入手写文字的方法,其特征在于上述进行决定的步骤(S4),包括将上述多个基准方向中与上述转折方向最接近的基准方向看作上述转折方向的步骤。
6.根据权利要求4所述的识别输入手写文字的方法,其特征在于上述进行决定的步骤(S4),包括将上述多个基准方向中与上述转折方向邻接的两个基准方向看作上述转折方向的步骤。
7.根据权利要求6所述的识别输入手写文字的方法,其特征在于上述进行决定的步骤(S4),还包括根据上述两个基准方向各自与上述转折方向的接近度对上述转折角度进行加权的步骤(S7)。
8.根据权利要求2所述的识别输入手写文字的方法,其特征在于在上述进行检测的步骤(S3~S9)之后及上述进行对照的步骤(S11)之前,包含使所检出的上述转折位置模糊化的步骤(S10)。
9.根据权利要求8所述的识别输入手写文字的方法,其特征在于上述模糊化步骤(S10),对所检出的上述转折位置赋予最高评分,而对离所检出的上述转折位置越远的位置赋予越低的评分。
10.根据权利要求1所述的识别输入手写文字的方法,其特征在于上述词典手写文字的各特征量,通过将多个样本手写文字(15)的特征量以其样本数求得平均值进行计算。
11.根据权利要求1所述的识别输入手写文字的方法,其特征在于还包括根据所检出的上述输入手写文字(11)的特征量对所决定的上述词典手写文字的特征量进行更新的步骤(S33~S35)。
12.根据权利要求1所述的识别输入手写文字的方法,其特征在于上述进行对照的步骤(S11),将用于特定上述实际笔划(12)的转折的特征量及用于特定上述实际笔划(12)与上述虚拟笔划(13)之间的转折的特征量不加区别地与上述词典手写文字的各特征量进行对照。
13.根据权利要求1所述的识别输入手写文字的方法,其特征在于上述进行对照的步骤(S11),以第1系数对用于特定上述实际笔划(12)的转折的特征量进行加权、且以与上述第1系数不同的第2系数对用于特定上述实际笔划(12)与上述虚拟笔划(13)之间的转折的特征量进行加权,然后与上述词典手写文字的各特征量进行对照。
14.根据权利要求13所述的识别输入手写文字的方法,其特征在于上述第2系数小于上述第1系数。
15.根据权利要求1所述的识别输入手写文字的方法,其特征在于上述进行对照的步骤(S11),以第1系数对用于特定上述实际笔划(12)与具有第1长度的上述虚拟笔划(13)之间的转折的特征量进行加权、且以小于上述第1系数的第2系数对用于特定上述实际笔划(12)与具有比上述第1长度长的第2长度的上述虚拟笔划(13)之间的转折的特征量进行加权,然后与上述词典手写文字的各特征量进行对照。
16.根据权利要求1所述的识别输入手写文字的方法,其特征在于还包括对上述实际笔划(12)和上述虚拟笔划(13)的连接部分进行平滑处理的步骤(S21)。
17.根据权利要求16所述的识别输入手写文字的方法,其特征在于上述进行平滑处理的步骤(S21),将上述实际笔划(12)的起点(Pm)和/或终点(Pn)的位置变更到比上述实际笔划(12)及连接于上述实际笔划(12)的起点(Pm)或终点(Pn)的虚拟笔划(13)更接近的位置。
18.根据权利要求17所述的识别输入手写文字的方法,其特征在于上述进行平滑处理的步骤(S21),包括步骤(S211),选择按规定时间在上述实际笔划(12)的起点(Pm)和/或终点(Pn)之后和/或之前检出的上述实际笔划(12)上的点(Pn-1、Pn-2、Pm+1、Pm+2),并计算从上述实际笔划(12)的起点(Pm)和/或终点(Pn)到上述实际笔划(12)上的上述选定的点(Pn- 1、Pn-2、Pm+1、Pm+2)的距离;步骤(212),检测离连接于上述实际笔划(12)的起点(Pm)或终点(Pn)的虚拟笔划(13)的终点(Pm)和(或)起点(Pn)的距离等于上述计算出的距离的上述虚拟笔划(13)上的点(Pn+1、Pn+2、Pm-1、Pm-2);及步骤(S213),根据上述实际笔划(12)上的上述选定的点(Pn-1、Pn-2、Pm+1、Pm+2)的位置及上述虚拟笔划(13)上的上述检出的点(Pn+1、Pn+2、Pm-1、Pm-2)的位置,决定上述更接近的位置。
19.根据权利要求17所述的识别输入手写文字的方法,其特征在于上述进行平滑处理的步骤(S21),根据离上述实际笔划(12)的起点(Pm)和/或终点(Pn)的距离为规定距离的上述实际笔划(12)上的点(Pn-2Pn-1、Pm+1、Pm+2)的位置、及离连接于上述实际笔划(12)的起点(Pm)或终点(Pn)的虚拟笔划(13)的终点(Pm)和/或起点(Pn)的距离为规定距离的上述虚拟笔划(13)上的点(Pn+1、Pn+2、Pm-2、Pm-1)的位置,决定上述更接近的位置。
20.根据权利要求16所述的识别输入手写文字的方法,其特征在于还包括将上述实际笔划(12)延长并添加虚拟起点(Pm-1)和虚拟终点(Pn+1)的步骤(S220),上述形成步骤(S2),用虚拟笔划(13)从上述输入手写文字(11)的各实际笔划(12)的上述虚拟终点(Pn+1)连接到其下一个实际笔划(12)的上述虚拟起点(Pm-1)而形成1条线,上述进行平滑处理的步骤(S21),将上述虚拟起点(Pm-1)和上述虚拟终点(Pn+1)的位置变更到比上述实际笔划(12)及连接于上述实际笔划(12)的上述虚拟起点(Pm-1)或上述虚拟终点(Pn+1)的虚拟笔划(13)更接近的位置。
21.一种识别输入手写文字的系统,备有形成装置(6、S2),其构成是为了用虚拟笔划(13)从上述输入手写文字(11)的各实际笔划(12)的终点连接到其下一个实际笔划(12)的起点而形成1条线;检测装置(6、S3~S9),其构成是为了检测用于特定由上述形成装置(6、S2)形成的1条线的转折的特征量;词典存储器(4),用于存储预先生成的多个词典手写文字的特征量;对照装置(6、S11),其构成是为了将由上述检测装置(6、S3~S9)检出的特征量与上述词典存储器(4)中的上述多个词典手写文字的各特征量进行对照,并计算上述输入手写文字(11)与上述各词典手写文字的类似度(rfc);及判定装置(6、S13),其构成是为了将在由上述对照装置(6、S11)计算出的上述类似度(rfc)中具有最大类似度的词典手写文字判定为上述输入手写文字(11)。
22.根据权利要求21所述的识别输入手写文字的系统,其特征在于上述特征量,包含上述转折的位置。
23.根据权利要求22所述的识别输入手写文字的系统,其特征在于上述特征量,还包含上述转折方向及上述转折角度中的至少一个。
24.根据权利要求23所述的识别输入手写文字的系统,其特征在于还备有暂存存储器(5),它包含与预先设定的多个基准方向对应设置且用于存储特定上述转折角度用的方向变化特征量的多个输入特征空间存储区(IM1-IM8);上述词典存储器(4),包含与上述多个基准方向对应设置且用于存储特定上述词典手写文字的转折角度用的方向变化特征量的多个词典特征空间存储区(DM1-DM8);上述检测装置(6、S3~S9),按照与上述暂存存储器(5)内的上述检出的转折位置对应的地址存储上述方向变化特征量;上述对照装置(6、S11),将上述暂存存储器(5)内的各上述输入特征空间存储区(IM1-IM8)与上述词典存储器(4)内的对应的词典特征空间存储区(DM1-DM8)进行对照。
25.根据权利要求24所述的识别输入手写文字的系统,其特征在于上述检测装置(6、S3~S9),将上述多个基准方向中与上述转折方向最接近的基准方向看作上述转折方向。
26.根据权利要求24所述的识别输入手写文字的系统,其特征在于上述检测装置(6、S3~S9),将上述多个基准方向中与上述转折方向邻接的两个基准方向看作上述转折方向。
27.根据权利要求26所述的识别输入手写文字的系统,其特征在于上述检测装置(6、S3~S9),根据上述两个基准方向各自与上述转折方向的接近度,对上述方向变化特征量进行加权,并将该加权后的方向变化特征量存储在与上述两个基准方向分别对应的上述输入特征空间存储区(IM1-IM8)内。
28.根据权利要求22所述的识别输入手写文字的系统,其特征在于还备有使由上述检测装置(6、S3~S9)检出的转折位置模糊化并将其供给上述对照装置(6、S11)的模糊化装置(6、S10)。
29.根据权利要求28所述的识别输入手写文字的系统,其特征在于上述模糊化装置(6、S10),对由上述检测装置(6、S3~S9)检出的转折位置赋予最高评分,而对离由上述检测装置(6、S3~S9)检出的转折位置越远的位置赋予越低的评分。
30.根据权利要求21所述的识别输入手写文字的系统,其特征在于上述词典存储器(4)中的上述词典手写文字的各特征量,通过将多个样本手写文字(15)的特征量以其样本数求得平均值进行计算。
31.根据权利要求21所述的识别输入手写文字的系统,其特征在于还备有更新装置(6、S33~S35),根据由上述检测装置(6、S3~S9)检出的上述输入手写文字(11)的特征量,对由上述判定装置(6、S13)判定的词典手写文字的特征量进行更新。
32.根据权利要求31所述的识别输入手写文字的系统,其特征在于上述对照装置(6、S11),将用于特定上述实际笔划(12)的转折的特征量及用于特定上述实际笔划(12)与上述虚拟笔划(13)之间的转折的特征量不分主次地与上述词典手写文字的各特征量进行对照。
33.根据权利要求31所述的识别输入手写文字的系统,其特征在于上述对照装置(6、S11),以第1系数对用于特定上述实际笔划(12)的转折的特征量进行加权、且以与上述第1系数不同的第2系数对用于特定上述实际笔划(12)与上述虚拟笔划(13)之间的转折的特征量进行加权,然后与上述词典手写文字的各特征量进行对照。
34.根据权利要求33所述的识别输入手写文字的系统,其特征在于上述第2系数小于上述第1系数。
35.根据权利要求31所述的识别输入手写文字的系统,其特征在于上述对照装置(6、S11),以第1系数对用于特定上述实际笔划(12)与具有第1长度的上述虚拟笔划(13)之间的转折的特征量进行加权、且以小于上述第1系数的第2系数对用于特定上述实际笔划(12)与具有比上述第1长度长的第2长度的上述虚拟笔划(13)之间的转折的特征量进行加权,然后与上述词典手写文字的各特征量进行对照。
36.根据权利要求21所述的识别输入手写文字的系统,其特征在于还备有对上述实际笔划(12)和上述虚拟笔划(13)的连接部分进行平滑处理的平滑处理装置(6、S21)。
37.根据权利要求36所述的识别输入手写文字的系统,其特征在于上述平滑处理装置(6、S21),将上述实际笔划(12)的起点(Pm)和/或终点(Pn)的位置变更到比上述实际笔划(12)及连接于上述实际笔划(12)的起点(Pm)或终点(Pn)的上述虚拟笔划(13)更接近的位置。
38.根据权利要求37所述的识别输入手写文字的系统,其特征在于上述平滑处理装置(6、S21),备有选择按规定时间在上述实际笔划(12)的起点(Pm)和/或终点(Pn)之后和/或之前检出的上述实际笔划(12)上的点(Pn-1、Pn-2、Pm+1、Pm+2)并计算从上述实际笔划(12)的起点(Pm)和/或终点(Pn)到上述实际笔划(12)上的上述选定的点(Pn-1、Pn-2、Pm+1、Pm+2)的距离的装置;检测离连接于上述实际笔划(12)的起点(Pm)或终点(Pn)的上述虚拟笔划(13)的终点(Pm)和/或起点(Pn)的距离等于上述计算出的距离的上述虚拟笔划(13)上的点(Pn+1、Pn+2、Pm-1、Pm-2)的装置;及根据上述实际笔划(12)上的上述选定的点(Pn-1、Pn-2、Pm+1、Pm+2)的位置及上述虚拟笔划(13)上的上述检出的点(Pn+1、Pn+2、Pm-1、Pm-2)的位置决定上述更接近的位置的装置。
39.根据权利要求37所述的识别输入手写文字的系统,其特征在于上述平滑处理装置(6、S21),根据离上述实际笔划(12)的起点(Pm)和/或终点(Pn)的距离为规定距离的上述实际笔划(12)上的点(Pn-2、Pn-1、Pm+1、Pm+2)的位置、及离连接于上述实际笔划(12)的起点(Pm)或终点(Pn)的上述虚拟笔划(13)的终点(Pm)和/或起点(Pn)的距离为规定距离的上述虚拟笔划(13)上的点(Pn+1、Pn+2、Pm-2、Pm-1)的位置,决定上述更接近的位置。
40.根据权利要求36所述的识别输入手写文字的系统,其特征在于还备有将上述实际笔划(12)延长并添加虚拟起点(Pm-1)和虚拟终点(Pn+1)的添加装置(6、S220),上述形成装置(6、S2),用虚拟笔划(13)从上述输入手写文字(11)的各实际笔划(12)的上述虚拟终点(Pn+1)连接到其下一个实际笔划(12)的上述虚拟起点(Pm-1)而形成1条线,上述平滑处理装置(6、S21),将上述虚拟起点(Pm-1)和上述虚拟终点(Pn+1)的位置变更到比上述实际笔划(12)及连接于上述实际笔划(12)的上述虚拟起点(Pm-1)或上述虚拟终点(Pn+1)的上述虚拟笔划(13)更接近的位置。
全文摘要
文字识别方法,用虚拟笔划(13)从各实际笔划(12)的终点连接到下一个实际笔划(12)的起点形成1条线,检测用于特定该1条线的转折位置及该位置的转折方向和转折角度的特征量,将该输入网格存储器(IM1~IM8)与预先生成的词典网格存储器进行对照,计算输入手写文字或各词典手写文字的类似度,并将具有最大类似度的词典手写文字识别为输入手写文字。本方法,由于在输入手写文字上添加虚拟笔划,所以,即使是各笔划连续书写的文字,也能正确地识别。
文档编号G06K9/22GK1234565SQ99107380
公开日1999年11月10日 申请日期1999年4月27日 优先权日1998年4月27日
发明者冈本正义 申请人:三洋电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1