在线字符识别系统的制作方法

文档序号:6413697阅读:144来源:国知局
专利名称:在线字符识别系统的制作方法
技术领域
本发明涉及一种用于识别利用笔式输入装置手写输入的字符的在线字符识别系统。
在许多常规的在线字符识别系统中,是通过检验输入字符图案与事先准备好的参考字符图案的匹配来进行字符识别的。因此,为了精确地识别,要求输入字符图案与参考字符图案的方向不能相差太大。然而,当输入字符图案为手写体时,特别是利用一种电子袖珍图书的小输入板输入时,输入字符图案可能经常被书写得倾斜于输入框或输入板,这已成为导致识别性能降低的一个主要因素。
为了解决这个问题,提出了一些用于将这些倾斜的字符的方向规范化的装置,如日本专利申请临时公开号No.269265/’88(此后称之为第一现有技术)或日本专利申请临时公开号No.337963/’94(此后称之为第二现有技术)中所公开的装置。
在第一现有技术中,在用户开始输入字符之前先写下一条如图6所示的直线10以指示其所要手写图案的最佳图案倾度。沿直线10,用户书写一个想要书写字符‘A’的图案9。通过参考直线10的倾度对图案方向进行规范化,第一现有技术的一个在线字符识别系统对图案9进行图案匹配。
为了指明最佳的图案倾度,在第一现有技术中还提出了一种如图7所示的旋转开关11。用户根据手写图案9的倾度操纵旋转开关11而不用再书写直线10。第一现有技术的在线字符识别系统参考旋转开关11的旋转角来规范化图案的方向。
在第二现有技术中,其被应用于当两个或更多的相互面对面的用户利用一个单独的输入板输入手写字符的情况中,例如,一个输入图案的方向是根据该输入字符是在输入板中的哪个区域被写入的或通过准备两支或多支记录笔而根据该输入字符被由哪一支记录笔输入的来鉴别的。对每个输入区或每个记录笔,字符方向被预先设置且输入图案的坐标根据该字符方向被规范化。该字符方向可以利用字符串的一个起始点或一个由用户所指定的输入模式的信息来鉴别。
然而,根据第一现有技术的倾度规范化方法,用户为了指示图案方向被迫书写一条直线10或操纵旋转开关11,其对用户来说有些累赘。
根据第二现有技术,除非利用为每个输入区或记录笔所预设的字符方向,否则不能规范化图案的倾度。因此,当该字符图案是以不同于该预设字符方向的方向书写的,其将不会被正确地识别,其与当该字符方向是利用其它信息来鉴别时的情况相同。
因此,本发明的主要目的是提供一种能够利用关于书写该字符图案的记录笔自身的倾角信息精确地规范化输入字符图案的倾度而正确地识别手写字符图案且只给用户极小的额外负担的在线字符识别系统。
为了实现该目的,本发明的一种在线字符识别系统包括一个笔式输入装置,其用于输出利用一支记录笔在该笔式输入装置的一个输入板上手写出来的一个字符图案的数据,并输出该记录笔相对于该输入板的倾角信息;一个用于从该倾角信息中获得该记录笔的一个斜角的斜角检测器,所述斜角代表了该记录笔在该输入板上的垂直投影的一个角度;一个用于存储该记录笔的标准斜角数据的斜角寄存器;一个用于通过利用由该斜角检测器所获得的该倾斜角及存储在该斜角寄存器中的标准斜角对从基于笔的该输入装置输出的该字符图案的数据进行补偿而输出补偿数据集的斜度补偿单元,及一个用于识别一个由从该斜度补偿单元中输出的补偿数据集所代表的字符的字符识别单元。
在字符图案的方向和输入该字符图案的记录笔的斜角之间大体上是相对应的。当斜角变化时,该字符图案的方向也将明显改变相同的角度。因此,根据本发明,不需要对用户有额外的负担便可以正确地规范化输入字符图案的倾度从而获得一个精确的字符识别结果。
至于标准斜角数据,其可以根据一个统计检验被预先确定,或可以从斜角检测器对应于数据由一个用户为学习进程而手写输入的字符数据的输出中获得。
可以对用户的每种书写字体类别将标准斜角数据分类,并提供一个用于根据其中一个用户的书写字体从标准斜角数据中选择将被斜角补偿单元参考的合适的标准斜角数据的选择器。
本发明上述的和另外的目的、特点及优点将从对接下来的说明,附加的权利要求,及附图中变得显而易见,附图中相同的标号表示相同或对应的部件。
在附图中

图1所示为本发明的第一实施例的方框图;图2所示为图1所示的第一实施例的操作的流程图;图3所示为记录笔12的倾角与斜角之间的关系简图;图4所示为本发明的第二实施例的方框图;图5A所示为控制在一个学习模式中的图4所示的第二实施例的操作的流程图;图5B所示为图4所示的第二实施例在一个识别模式中的操作的流程图;图6所示为在第一现有技术中被书写以指明一个最佳图案倾度的一条直线10的简图;图7所示为在第一现有技术中被操纵以指明一个最佳倾度的一个旋转开关11的简图;图8所示为在图1所示的笔式输入装置的输入板上手写的一个字符图案‘ぁ’(日文字母表的第一个字母)的简图;图9所示为字符‘ぁ’的一个补偿后的图案的简图;及图10所示为一个用于学习操作而在输入板上手写的字符图案‘ぁ’的简图。
现在将参照附图对本发明的实施例进行说明。
图1所示为本发明的第一实施例。
参照图1,根据第一实施例的一个在线字符识别系统包括一个笔式输入装置1,其用于输出利用一支记录笔在输入板上手写出来的一个字符图案的数据,并输出该记录笔相对于该输入板的倾角信息,
一个用于从该倾角信息中获得该记录笔的一个斜角的斜角检测器2,所述斜角代表了该记录笔在该输入板上的垂直投影的一个角度,一个用于存储该记录笔的标准斜角数据的第一斜角寄存器3,一个用于通过利用斜角检测器2所获得的斜角及存储在斜角寄存器3中的标准斜角对从笔式输入装置1输出的字符图案的数据进行补偿并输出补偿数据集的斜度补偿单元4,及一个用于识别一个由从斜度补偿单元4中输出的补偿数据集所代表的字符的字符识别单元5。
有多种可以输出记录笔的倾角信息的笔式输入装置,其中一个例子是一种由日本的WACOM公司生产的名为“WACOM UD-SeriesDigitizer”的数字化仪。
图3所示为一支记录笔12的倾角和斜角之间的关系简图,其中X轴和Y轴表示在一个输入板上的正交坐标系而Z轴表示输入板的一个法线方向。
在“WACOM UD-Series Digitizer”中,通过利用记录笔中提供的线圈检测形成在输入板上的一个弱电磁场的分量,并以如“WACOMUD-Series Digitizer的WACOM命令参考书”第四卷第四页所说明的格式输出图3所示的一个x方向的倾角αn(记录笔12的XZ投影到Z轴的角度)及一个y方向的倾角βn(记录笔12的YZ投影到Z轴的角度)的信息(n代表第n次取样时间)。
斜角检测器2计算斜角θn,即记录笔12的XY投影13到X轴的角度。
下文中,将结合记录笔12的x轴方向倾角αn及y轴方向倾角βn从笔式输入装置(如上述的“WACOM UD-Series Digitizer”)中输出的实例对本发明的实施例进行说明。
然而,如果能够与输入图案数据一起获得用于计算记录笔12的上述斜角θn的必要信息,即用户正在书写的手相对于输入板的方向信息,则任何其它合适的图案输入装置均可被应用作本发明的笔式输入装置1。
现在,将参照图1及图2的流程图对本发明的第一实施例的操作进行说明。
在记录笔接触输入板的过程中,笔式输入装置1同时输出(在步骤S1)记录笔12在每个取样时间的倾角信息(αn,βn)及通过以固定的时间间隔(n=1,2,...,N;N为字符的总取样次数)对记录笔12写在输入板上的一个字符的每个笔划或点迹的坐标(Xn,Yn)进行取样而获得的坐标数据。
斜角检测器2根据如下公式(1)得到记录笔12的斜角θn,并根据如下公式(2)计算字符的一个平均斜角θ(在步骤S2)。θ=arctan(tanβntanαn)----(1)]]>θ=(1N)Σn=1Nθn----(2)]]>斜度补偿单元4从该平均斜角θ及存储在第一斜角寄存器3中的标准斜角θ0中计算出Δθ,Δθ=θ0-θ,并根据如下公式对每个坐标数据(xn,yn)进行补偿后输出字符图案的一个补偿数据集P={(x′n,y′n)|n=1,2,...,N}(在步骤S3)。
x′n=xncosΔθ+ynsinΔθ (3)y′n=-xnsinΔθ+yncosΔθ(4)字符识别单元5利用图案匹配技术从补偿数据集P中识别出(在步骤S5)一个字符,例如在第二届国际文献分析及识别大会论文集中由Hamanaka等人所写的“利用基于结合规范化的特征提取的离线方法的在线日文字符识别实验”第204页到207页所说明的技术。
至于标准斜角θ0,即当充分多的用户以正确的方向将字符写到输入板上时其以统计方式获得的记录笔的斜角,被存储到第一斜角寄存器3中。在字符图案的方向和输入该字符图案的记录笔的斜角之间有着显著对应的关系。当斜角变化时,该字符图案的方向也将明显改变相同的角度。因此,输入字符图案的斜度可以被正确地规范化,根据本发明而不需要对用户有额外的负担便可以得到一个精确的字符识别结果。
图4所示为本发明的第二实施例的方框图。
对比图1所示的第一实施例,图1所示的第一斜角寄存器3被一个第二斜角寄存器8代替,在笔式输入装置1与斜度补偿单元4之间提供了一个连接开关6,而且图4所示的第二实施例还包括一个用于将斜角寄存器2的输出转换到第二斜角寄存器8的转换开关7。
在第二实施例中,寄存在第二斜角寄存器8中的标准斜角θ0通过学习该用户自己的斜角而与一个特定用户相适应,这是通过在学习模式中控制连接开关6和转换开关7来进行的。
当图4所示的在线字符识别系统被控制于学习模式时,连接开关6被控制以被断开,而转换开关7被转向第二斜角寄存器8,而当该字符识别系统工作于识别模式中时,其被控制到另一侧。
第二斜角寄存器8存储着适用于该特定用户的标准斜角θ0。然而,该标准斜角θ0是一个参考值并可以通过提供一个例如用于从寄存在第二斜角寄存器8中的数据中选择一个对应于每个用户或每个用户群的标准斜角θ0的选择器(未示出)而为每个单独的用户或为每个具有相同书写字体的用户群准备该值。
现在,将参照图4和图5A和5B的流程图对第二实施例的操作进行说明。
图5所示为处于学习模式的第二实施例的操作。
为了开始学习进程,连接开关6被断开而转换开关7被转向学习侧(在步骤S11)以将斜角寄存器2的输出连接到第二斜角寄存器8。坐标数据(xn,yn)和倾角信息(αn,βn)被提取出来(在步骤S12),为学习进程而书写的输入图案的一个平均倾斜角θ被计算(在步骤S13),其方法分别相同于图2所示的步骤S2和步骤S3。得到的平均倾斜角θ随后作为标准斜角θ0寄存进第二斜角寄存器8中(在步骤S14)。
图5B所示为第二实施例在识别模式中的操作。
为了进行字符识别,连接开关6被闭合而转换开关7被转向识别侧(在步骤S21)以将斜角寄存器2的输出连接到斜度补偿单元4。坐标数据(xn,yn)和倾角信息(αn,βn)被提取出来(在步骤S22),对每个输入字符图案计算一个平均斜角θ(在步骤S23),其方法分别相同于图2所示的步骤S2和步骤S3的方法。
斜度补偿单元4参考在学习模式中寄存在第二斜角寄存器8中的标准斜角θ0计算(在步骤S24)补偿角Δθ,Δθ=θ0-θ,并输出补偿数据集P,其被送到字符识别单元5以识别(在步骤S25)该手写字符,其方法与图2所示的步骤S2和S3的方法相同。
如上所述,通过正确地学习由每个特定用户手写的字符图案的斜角而使标准斜角θ0与该用户的书写字体相适应,第二实施例还可以进行更加精确的识别。
下文中将对根据上述实施例的斜度补偿的具体实例及斜角学习进行说明。
假设一个用户输入一个如图8所示的字符图案“ぁ”(日文字母表的第一个字母),有18个取样的坐标数据集{(xn,yn)}(n=1,2,...,18)与一个如下所示的倾角信息集{(αn,βn)}同时从第一实施例具笔式输入装置1中输出。
{(xn,yn)}={(0,4)(1,5)(2,6)(0,6)(1,5)(2,4)(3,3)(4,2)(3,5)(3,4)(3,3)(2,2)(1,3)(2,4)(4,5)(5,4)(5,3)(5,2)};{(αn,βn)}={(60°,20°)(58°,23°)(61°,25°)(70°,30°)(68°,40°)(62°,22°)(63°,32°)(59°,32°)(80°,40°)(85°,45°)(72°,30°)(77°,38°)(76°,43°)(59°,43°)(66°,38°)(70°,36°)(78°,41°)(77°,39°)}.
斜角检测器2在每个取样时间根据公式(1)计算倾斜角θn并根据公式(2)得到字符图案‘ぁ’的平均倾斜角θ如下{θn}={11.9°,14.9°,14.5°,11.9°,18.7°,12.1°,17.7°,20.6°,8.4°,5.0°,10.6°,10.2°,13.1°,29.3°,19.2°,14.8°,10.5°,10.6°}
参考存储在第一斜角寄存器3中的标准斜角θ0=60°,斜度补偿单元4根据公式(3)和(4)计算出补偿角Δθ=θ0-θ=60°-14.1°=45.9°并输出如下所示的补偿数据集P,其代表了如图9所示的字符‘ぁ’的一个补偿图案。
P={(x′n,y′n)}={(2.9,2.8)(4.3,2.8)(5.7,2.7)(4.3,4.2)(4.3,2.8)(4.3,1.4)(4.2,-0.1)(4.2,-1.5)(5.7,1.3)(5.0,0.6)(4.2,-0.1)(2.8,0.0)(2.9,1.4)(4.3,1.4)(6.4,0.6)(6.4,-0.8)(5.6,-1.5)(4.9,-2.2)}字符识别单元5对补偿数据集P进行图案匹配。
到此,一次精确的字符识别被完成了。
为了学习用户的标准斜角θ0,第二实施例的在线字符识别系统被设置为学习模式,用户输入一个字符图案例如‘ぁ’,条件是其不斜到输入板上,如图10所示。
字符图案分别在20次取样时间被取样并输出一个如下所示的倾角信息集{(αn,βn)}(n=1,2,...,20),例如{(αn,βn)}={(50°,80°)(55°,78°)(45°,80°)(60°,80°)(62°,78°)(58°,78°)(58°,70°)(52°,67°)(55°,64°)(56°,60°)(48°,60°)(50°,62°)(53°,72°)(54°,82°)(63°,82°)(69°,73°)(54°,68°)(53°,62°)(48°,64°)(55°,87°)}.
斜角检测器2根据公式(1)和(2)从倾角信息集{(αn,βn)}中得到平均倾斜角θ=66.0°,其作为对该用户的标准斜角θ0存储进图4所示的第二斜角寄存器8中。
上文中,结合一些实施例对本发明进行了说明。然而,本发明的范围并不局限于这些实施例。例如,斜角检测器2可以输出其它值诸如斜角{θn}的最小均方值,以代替简单平均值
,或者补偿角Δθ可以根据标准斜角θ0与斜角检测器2的输出θ的其它函数来计算,而不仅仅是它们之间的简单差值。
权利要求
1.一种在线字符识别系统,具有一个用于输出利用一支记录笔在该笔式输入装置的一个输入板上手写出来的一个字符图案的数据及输出该记录笔相对于该输入板的倾角信息的笔式输入装置;所述在线字符识别系统包括一个用于从该倾角信息中获得该记录笔的一个斜角的斜角检测器,所述斜角代表了该记录笔在该输入板上的垂直投影的一个角度;一个用于存储该记录笔的标准斜角数据的斜角寄存器;一个用于通过利用由该斜角检测器所获得的斜角及存储在该斜角寄存器中的标准斜角对从该笔式输入装置输出的该字符图案的数据进行补偿而输出补偿数据集的斜度补偿单元;及一个用于识别由从该斜度补偿单元中输出的补偿数据集所代表的字符的字符识别单元。
2.如权利要求1所述的在线字符识别系统,其特征在于标准斜角是预先确定的。
3.如权利要求2所述的在线字符识别系统,其特征在于标准斜角数据是根据一个统计检验来预先确定的。
4.如权利要求1所述的在线字符识别系统,其特征在于标准斜角数据是从斜角检测器对应于由一个用户为了学习进程而手写的字符图案的数据的输出中得到的。
5.如权利要求1所述的在线字符识别系统,其特征在于对该在线字符识别系统用户的每种书写字体类别将标准斜角数据分类;及还提供一个选择器,以用于根据其中一个用户的书写字体从标准斜角数据中选择将被斜度补偿单元参考的相应的标准斜角数据。
全文摘要
提供一种正确地识别手写字符图案的在线字符识别系统,其包括:一个同时输出图案数据及其记录笔的倾角信息的笔式输入装置(1),一个用于从该倾角信息中获得一个代表了该记录笔的垂直投影的一个角度的斜角的斜角检测器(2),一个用于存储标准斜角数据的斜角寄存器(3),一个用于利用斜角及标准斜角对图案数据进行补偿而输出补偿数据集的斜度补偿单元(4),及一个用于识别来自斜度补偿单元的字符的字符识别单元(5)。
文档编号G06K9/32GK1202669SQ9810224
公开日1998年12月23日 申请日期1998年6月9日 优先权日1997年6月9日
发明者池端义和 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1