识别距离调整装置和方法以及文本行识别装置和方法

文档序号:6638285阅读:138来源:国知局
专利名称:识别距离调整装置和方法以及文本行识别装置和方法
技术领域
本发明涉及字符识别装置及字符识别方法,更具体地,涉及对退化文本行中的字符进行识别的文本行识别装置和方法。
背景技术
随着数码相机和数码摄像机在文档图像拍摄上的日益普及,退化文本行识别越来越受重视。对退化文本行的识别包括单个字符识别和文本行的分割两个部分。这两个部分又是有机结合在一起的。
对于文本行分割来说,基于识别的分割方法是使用最为广泛的一种。图1是传统的基于识别的分割方法的原理图。输入的图像首先经过二值化操作,然后通过对二值图像的连接组件分析得到文字的笔画(图1中的最上一排)。针对图像的连接组件分析算法可以参见冈萨雷斯,《数字图像处理(第二版)》,第435页,阮秋琦,阮宇智等译。可以将每一个连接组件看作一个基本分割字符(图1中的中间一排)。而将连接组件的组合看作合成分割字符(图1中的最下面一排)。在本文中,基本分割字符和合成分割字符都被称为字符,即使它们可能仅仅是无任何文字意义的连接组件、偏旁部首。然后,对于每一个基本分割字符和合成分割字符都进行字符识别并给出一个识别距离。一个文本行可以被分解为很多条由不同基本分割字符和合成分割字符组合在一起的分割路径,每一个分割路径的识别距离是组成它的基本分割字符和合成分割字符的识别距离之和。该文本行的分割结果是由具有最小识别距离之和的分割路径来决定的。在实现了分割的同时,对每个基本分割字符和合成分割字符的识别结果也就是对字符的最后识别结果。
如图1所示,由“ハ”,”リ”,和“を”组成的分割路径具有最小的识别距离值,72。因此它们被输出为最后的分割和识别的结果。
从图1可以看出,识别距离的值不仅对于识别结果,而且对于正确分割也是非常重要的。例如,在图1中,对于“ハ”的最小识别距离是21,该字符的左右两个笔画的识别距离分别是19和26。如果这两个笔画的识别距离之和小于21,即使“ハ”的识别结果是正确的,它仍然会被错误分割为“ノ”和“丶”两个部分。
目前已经有很多关于文本行分割的文章和专利,比如Y.Lu于1995年1月在Pattern Recognition(Vol.28,no.1,pp.67-80)上发表的“Machine Printed Character Segmentation-AnOverview”。
S.W.Lee,D.J.Lee,H.S.Park 1996年19月在IEEE transactionon pattern analysis and machine intelligence(Vol.18,no.10,pp.1045-1050)上发表的“A New Methodology for Gray-Scale CharacterSegmentation and Recognition”。
Kamitani的美国专利第6,327,385号“Character segmentationdevice and character segmentation system”。
Hanson的美国专利第5,692,069号,“Apparatus for performingcharacter segmentation using slant histograms”。
Tan的美国专利第5,172,422号,“Fast character segmentationof skewed text lines for optical character recognition”。
这些文章和专利的大部分都是针对粘连文字的处理,而且大多的处理对象都是二值化图像。
对于退化的文本行图像,传统的二值化方法常常会引起严重的断笔(笔画像素点丢失)或者笔画的粘连。因此识别的效果不佳。基于双子空间(dual eigenspace)的方法对于退化字符具有很好的识别效果。该方法直接从灰度字符图像中提取特征。图2是利用双子空间方法来进行字符识别的流程图。输入是一个经过归一化的字符图像,首先通过第一个字典(图2中的字典一)来提取字符图像的特征。然后,通过第二个字典(图2中的字典二),该字符图像被预分类到M个类别之一。最后,第三个字典(图2中的字典三)对输入的字符特征进行精细的分类,指定为M个类别中的某一类。最后,系统输出识别出的字符编码和识别距离。
基于双子空间的方法不需要二值化,它直接作用于灰度图像,二值化的结果只用于预分割。由于基于双子空间的方法从灰度图像中直接提取特征,避免了二值化的环节,因此它对于由于图像退化所引起的噪声具有更好的抵抗能力。但是,直接在基于识别的分割方法中利用双子空间方法有一些问题。
图3是示出了现有技术的字符识别方法的缺陷的示意图。如图3所示,最上面的图像是一个文本行图像。第二行是二值化的结果。二值化图像用来进行预分割。图中的虚线边框是预分割的结果。第三行是经过归一化后的基本分割字符的灰度图像,在每一个分割图像的下面是识别的结果和对应的识别距离。第四行是经过归一化后的合成分割字符“年”和“開”的归一化灰度字符图像,以及对应的识别结果和识别距离。如果使用传统的基于识别的分割方法,“開”将会被分割为四个部分。因为“開”对应的四个基本分割字符的识别距离之和是5.39+61.01+45.69+20.37=132.46。而“開”本身的识别距离是409.71,大于它的四个部分的识别距离之和。因此这个文本行会被识别为“年1回1!11ㄑ”。
目前尚没有针对退化文本行分割的专利和文章。

发明内容
本发明鉴于以上情况提出。本发明的目的是利用字符结构特征来调整原来的识别距离,使其更加有利于分割,从而解决利用双子空间进行分割所出现的问题。
根据本发明的一个方面,本发明提供了一种调整候选字符的初始识别距离的方法,包括以下步骤结构特征值计算步骤,计算所述候选字符的训练样本的结构特征值;调整步骤,根据所述结构特征值计算步骤所计算出来的结构特征值对所述初始识别距离进行调整。
根据本发明的另一方面,提供了一种调整候选字符的初始识别距离的装置,包括结构特征值计算单元,计算所述候选字符的训练样本的结构特征值;调整单元,根据所述结构特征值计算单元所计算出来的结构特征值对所述初始识别距离进行调整。
根据本发明的又一方面,提供了一种文本行识别方法,包括特征提取步骤、粗分类步骤、特征重构步骤、精细识别步骤,所述精细识别步骤输出候选字符的初始识别距离,其特征在于,还包括结构特征值计算步骤,计算所述候选字符的训练样本的结构特征值;调整步骤,根据所述结构特征值计算步骤所计算出来的结构特征值对所述初始识别距离进行调整。
根据本发明的再一方面,提供了一种文本行识别装置,包括特征提取单元、粗分类单元、特征重构单元、精细识别单元,所述精细识别单元输出候选字符的初始识别距离,其特征在于,还包括结构特征值计算单元,计算所述候选字符的训练样本的结构特征值;调整单元,根据所述结构特征值计算单元所计算出来的结构特征值对所述初始识别距离进行调整。
优选地,所述结构特征值为形状特征值,所述调整步骤采用乘法或含有乘法的运算对所述初始识别距离进行调整。
优选地,所述形状特征值为所述候选字符的训练样本的字符笔画像素点的稀疏程度值、所述候选字符的训练样本的字符笔画的稀疏程度值或所述候选字符的训练样本的字符笔画的行列平均笔画段数目。
优选地,所述候选字符的训练样本的字符笔画像素点的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画像素点的数目的比值,所述候选字符的训练样本的字符笔画的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画的数目的n次幂的比值,n为正整数。
优选地,通过所述候选字符的字符编码获得所述候选字符的训练样本。
优选地,所述含有乘法的运算为将所述结构特征值经取对数后与所述初始识别距离的相乘。
优选地,所述结构特征值相对于字符结构的变化趋势与所述识别距离相对于字符结构的变化趋势相同,所述调整步骤(装置)采用相除或含有除法的运算对所述初始识别距离进行调整。
本发明能够克服现有技术中出现的问题,正确进行文本行的分割与识别,具有显著的技术效果。


所包括的附图用于进一步解释本发明,与说明书一起用于解释本发明的原理。
图1是传统的基于识别的分割方法的原理图;图2是利用双子空间方法进行字符识别的流程图;图3是示出了现有技术的字符识别方法的缺陷的示意图;图4是本发明的一个实施例的流程图;图5是示出了字符形状特征的特点及计算的示意图;图6示出了与图3相对应的调整后识别距离。
具体实施例方式
下面将参照

本发明的优选实施例。这些实施例仅仅是解释性和示意性的,并不是对本发明的保护范围的限制。
图4是本发明的一个实施例的流程图。对于输入的经过归一化的字符图像401,特征提取单元402利用第一字典403提取图像的特征Y=UT(X-X),(1)其中X=[x1,x2,...xw*h]T代表一个长宽分别为w和h的经过归一化的字符图像。X=[x1,x2,...xw*h]T是所有训练样本的归一化字符图像的平均值。U=[u1,u2,...,un]是一个变换矩阵,其中ui=[ui1,ui2,...,uiw*h]T,ui是一个一维的列向量,此向量是矩阵U的一个分量,它的意义和获取的方式可以参见后面引用的书目。ui1是这个向量ui的第一个分量,依次类推,n是维数。第一字典403由U和X组成。公式(1)使用的特征提取方法称为主成份分析方法(Principal Component Analysis,简称PCA)。关于PCA的具体实现可参见A Wiley-Interscience Publication John Wiley&Sons公司的“Pattern classification”第二版(2001.pp.115~117,568~569),作者为R.O.Duda,P.E.Hart,和D.G.Stork.。
粗分类单元404将所提取的特征Y与预先存储在第二字典405中的各类字符的特征进行比较。特征比较的算法很多,其中一种是基于欧式距离的比较方法Di=|Y-Yi|,其中Di是特征Y距离第i个字符类别特征Yi的欧式距离。假设粗分类单元输出的候选字符类别的数目是M,具有最小欧式距离的M个字符类别被选择作为粗分类的输出。
特征重构单元406利用第三字典407来重构出对应于M个候选类别的M个重构特征。第三字典407保存着每个字符类别的变换矩阵U~i=[u1i,u2i,...,un1i]]]>和平均特征矢量Ci。重构特征 通过公式(2)得到ηi=U~iT(Y-Ci),Y^i=U~iTηi+Ci---(2)]]> 是一个通过一定的计算得到的矩阵,具体的算法实现可以参见后面的文章。 是 的转置矩阵。关于重构,可以参见文章J.Sun,Y.Hotta,Y.Katsuyama,S.Naoi,“Low resolutioncharacter recognition by dual eigenspace and synthetic degradedpatterns”ACM 1st Hardcopy Document Processing Workshop,pp.15~22,2004。
图4中的精细识别单元408计算原始特征Y和M个重构特征 之间的差别,具有最小差别的字符类别就是精细识别的结果,对应字符类别(候选字符)的编码被输出为识别出的字符编码409。其最小差别被输出为初始识别距离410。注意在图2所示的传统方法中,410被当作是最后的识别距离,这有可能导致分割错误的发生。
在本实施例中,字符形状特征值计算单元411被用来计算所识别出来的字符的形状特征,简单地说,字符形状特征是字符结构特征的一种,可以看作是字符笔画复杂程度的一种描述,笔画越复杂,形状特征的值越小,笔画越简单,形状特征的值越大。形状特征计算值单元的输入是识别出的字符编码和对应于该编码的二值字符图像(与候选字符对应的训练样本,也可称为候选字符的训练样本)。二值字符图像根据图4中识别出的字符编码409来得到,二值字符图像和每类图像对应的字符编码都预先存储在存储介质(比如硬盘等)中,根据编码就能够检索到所有对应该编码的字符图像,反之亦然。如果有超过一个的二值图像被选择,则字符形状特征的取值为所有二值图像字符的形状特征Wg取值的平均值或加权平均值,在使用加权平均值的情况下,在所述存储介质中应相对应地存储有该二值图像的权值。在本实施例中,以字符笔画像素点的稀疏程度为例计算字符形状特征。具体地,通过下面的公式计算字符形状特征,Wg=s×s/字符笔画像素点的数目其中s是二值图像中字符的最小外接正方形的边长,字符笔画像素点就是二值图像中代表字符笔画的那些点,可以通过从上到下,从左到右扫描图像,判断每一个点的取值来知道这个点是否为字符笔画像素点。对于二值图像来说,每个点的取值只有2种,0或者1。0对应于背景,1对应于笔画,因此通过计算1的数目就可以得到笔画像素点的数目。最小外接正方形可以通过搜索字符笔画像素点的最上、最下、最左、和最右的位置来确定。假设这4个值分别是xs、xe、ys、ye。则它们能够唯一确定字符笔画图像的外接矩形。这个矩形的宽w=xe-xs+1,高h=ye-ys+1。最小外接正方形的边长是宽和高的最大者。如果w>h,则最小外接正方形由外接矩形在高的方向上向上向下各扩展(w-h)/2个像素点。如果h>w,则最小外接正方形由外接矩形在宽的方向上向左向右各扩展(h-w)/2个像素点。
在上面的示例中,以像素点的稀疏程度为例,对字符形状特征的计算进行了说明。但本发明不限于此,只要能够区别出复杂结构字符和简单结构字符的特征都可以用,比如说笔画的稀疏程度。具体地,可以使用下面的公式计算字符形状特征Wg=s×s/(字符笔画的数目)n其中,n为大于1的整数,可以经验地确定,优选地在4到10之间。
之所以要使用字符形状特征的原因是在相同的退化程度下,具有简单笔画结构的字符比如“1”和“ㄑ”的识别距离很小,具有复杂笔画结构的字符比如“楽”和“開”的识别距离比较大。从图3中可以看到这个现象。字符形状特征的取值特点是具有复杂笔画结构的字符的字符形状特征值比较小,具有简单笔画结构的字符的字符形状特征值比较大。从图5中的例子可以看出这点。因此字符形状特征可以用来补偿由于字符结构不同对识别距离带来的影响。本发明并不限于采用形状特征,只要能够补偿由于字符结构不同对识别距离的影响,也可以用其他的结构特征。因此,在本文中,应对字符形状特征进行广义的解释,即其值相对于字符结构的变化趋势与识别距离相对于字符结构的变化趋势相反的结构特征。比如其也可为行列平均笔画段数目。首先扫描字符图像的每一行,统计笔画的数目,然后扫描每一列,统计笔画数目,最后的平均值也能够代表字符的笔画复杂程度。具体地,图像中一行的笔画段的统计方法如下对于图像中的每一行,从左向右扫描,记录下来遇到的第一个值为1的象素点,这是一个笔画的左边缘,然后往下扫描,再记录下从1变为0的象素点,这是笔画的右边缘,左边缘和右边缘对应一个笔画段。继续往下搜索从0变为1的象素点(第二个笔画段的左边缘)和从1变为0的象素点(第二个笔画段的右边缘),依次类推直到扫描结束。同理可获得一列的笔画数。
识别距离调整单元413利用字符形状特征来调整初始的识别距离。具体地,可以采用公式R1=Wg×R进行调整。R1是图4中最后的识别距离414。R是图4中的初始识别距离。不是只能用相乘,含有相乘的运算(如将形状特征值取对数(log)后再与初始识别距离相乘)也可以。因为对于2个具有相同退化程度的不同的字符图像的初始识别距离R来说,字符结构复杂的图像R值比较大,字符结构简单的图像R值比较小,这样就对分割造成了困难。wg和R对于字符结构的变化趋势是相反的,wg对于简单字符图像具有较大值,对于复杂结构字符具有较小的值,因此可以通过相乘等运算来消除R对结构的敏感。
在以上的实施例中,采用形状特征对初始识别距离进行调整、补偿,在其它实施例中,也可使用相对于字符结构的变化趋势与初始识别距离相对于字符结构的变化趋势相同的其它结构特征。即该结构特征与识别距离一样,在字符结构复杂时,其值较大,当字符结构简单时,其值较小。在这种情况下,可以采用相除或含有相除的运算对初始识别距离进行调整,总之,只要能够消除R对结构的敏感就可以,显然,本领域技术人员可以在本发明的提示下,进行各种变型,为节约篇幅,本文对此不予一一赘述。
图6显示的是图3中对应字符图像的最后识别距离。经过调整以后,“開”的最终识别距离是471,但是它对应的四个组成部分的识别距离之和是678。因此“開”被正确分割。
虽然本发明中的事例是用日文字符来表示的,但本发明不仅仅限于日语,它的原理也适用于中文、韩文等其它文字。另外,在上面的实施例中,文本行有多个字符,但实际上,文本行也可能只有一个字符,本发明也适用于这样的情况。
应该理解,对于本领域的技术人员来说,显而易见地,可以在本发明的精神和范围内进行各种变型和修改。因此应对本发明的保护范围进行最大的解释,并覆盖这些变型和修改,只要它们落入本发明的权利要求及其等同物的范围内。
权利要求
1.一种调整候选字符的初始识别距离的方法,包括以下步骤结构特征值计算步骤,计算所述候选字符的训练样本的结构特征值;调整步骤,根据所述结构特征值计算步骤所计算出来的结构特征值对所述初始识别距离进行调整。
2.根据权利要求1所述的调整候选字符的初始识别距离的方法,其特征在于,所述结构特征值为形状特征值,所述调整步骤采用乘法或含有乘法的运算对所述初始识别距离进行调整。
3.根据权利要求2所述的调整候选字符的初始识别距离的方法,其特征在于,所述形状特征值为所述候选字符的训练样本的字符笔画像素点的稀疏程度值、所述候选字符的训练样本的字符笔画的稀疏程度值或所述候选字符的训练样本的字符笔画的行列平均笔画段数目。
4.根据权利要求3所述的调整候选字符的初始识别距离的方法,其特征在于,所述候选字符的训练样本的字符笔画像素点的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画像素点的数目的比值,所述候选字符的训练样本的字符笔画的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画的数目的n次幂的比值,n为正整数。
5.根据权利要求1所述的调整候选字符的初始识别距离的方法,其特征在于,通过所述候选字符的字符编码获得所述候选字符的训练样本。
6.根据权利要求2所述的调整候选字符的初始识别距离的方法,其特征在于,所述含有乘法的运算为将所述结构特征值计算步骤所计算出来的结构特征值经取对数后与所述初始识别距离的相乘。
7.根据权利要求1所述的调整候选字符的初始识别距离的方法,其特征在于,所述结构特征值相对于字符结构的变化趋势与所述识别距离相对于字符结构的变化趋势相同,所述调整步骤采用相除或含有除法的运算对所述初始识别距离进行调整。
8.根据权利要求1到7任一项所述的调整候选字符的初始识别距离的方法,其特征在于,当所述候选字符有多个训练样本时,所述结构特征值计算步骤所计算出来的结构特征值为针对所有该多个训练样本计算出来的结构特征值的平均或加权平均。
9.一种调整候选字符的初始识别距离的装置,包括结构特征值计算单元,计算所述候选字符的训练样本的结构特征值;调整单元,根据所述结构特征值计算单元所计算出来的结构特征值对所述初始识别距离进行调整。
10.根据权利要求9所述的调整候选字符的初始识别距离的装置,其特征在于,所述结构特征值为形状特征值,所述调整单元采用乘法或含有乘法的运算对所述初始识别距离进行调整。
11.根据权利要求10所述的调整候选字符的初始识别距离的装置,其特征在于,所述形状特征值为所述候选字符的训练样本的字符笔画像素点的稀疏程度值、所述候选字符的训练样本的字符笔画的稀疏程度值或所述候选字符的训练样本的字符笔画的行列平均笔画段数目。
12.根据权利要求11所述的调整候选字符的初始识别距离的装置,其特征在于,所述候选字符的训练样本的字符笔画像素点的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画像素点的数目的比值,所述候选字符的训练样本的字符笔画的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画的数目的n次幂的比值,n为正整数。
13.根据权利要求9所述的调整候选字符的初始识别距离的装置,其特征在于,通过所述候选字符的字符编码获得所述候选字符的训练样本。
14.根据权利要求13所述的调整候选字符的初始识别距离的装置,其特征在于,还包括存储单元,所述存储单元相对应地存储所述候选字符的字符编码与所述候选字符的训练样本,或相对应地存储所述候选字符的字符编码、所述候选字符的训练样本以及所述候选字符的训练样本的权重。
15.根据权利要求10所述的调整候选字符的初始识别距离的装置,其特征在于,所述含有乘法的运算为将所述结构特征值计算单元所计算出来的结构特征值经取对数后与所述初始识别距离的相乘。
16.根据权利要求9所述的调整候选字符的初始识别距离的装置,其特征在于,所述结构特征值相对于字符结构的变化趋势与所述识别距离相对于字符结构的变化趋势相同,所述调整单元采用相除或含有除法的运算对所述初始识别距离进行调整。
17.根据权利要求9到16任一项所述的调整候选字符的初始识别距离的装置,其特征在于,当所述候选字符有多个训练样本时,所述结构特征值计算单元所计算出来的结构特征值为针对所有该多个训练样本计算出来的结构特征值的平均或加权平均。
18.一种文本行识别方法,包括特征提取步骤、粗分类步骤、特征重构步骤、精细识别步骤,所述精细识别步骤输出候选字符的初始识别距离,其特征在于,还包括结构特征值计算步骤,计算所述候选字符的训练样本的结构特征值;调整步骤,根据所述结构特征值计算步骤所计算出来的结构特征值对所述初始识别距离进行调整。
19.根据权利要求18所述的文本行识别方法,其特征在于,所述结构特征值为形状特征值,所述调整步骤采用乘法或含有乘法的运算对所述初始识别距离进行调整。
20.根据权利要求19所述的文本行识别方法,其特征在于,所述形状特征值为所述候选字符的训练样本的字符笔画像素点的稀疏程度值、所述候选字符的训练样本的字符笔画的稀疏程度值或所述候选字符的训练样本的字符笔画的行列平均笔画段数目。
21.根据权利要求20所述的文本行识别方法,其特征在于,所述候选字符的训练样本的字符笔画像素点的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画像素点的数目的比值,所述候选字符的训练样本的字符笔画的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画的数目的n次幂的比值,n为正整数。
22.根据权利要求18所述的文本行识别方法,其特征在于,通过所述候选字符的字符编码获得所述候选字符的训练样本。
23.根据权利要求19所述的文本行识别方法,其特征在于,所述含有乘法的运算为将所述结构特征值计算步骤所计算出来的结构特征值经取对数后与所述初始识别距离的相乘。
24.根据权利要求18所述的文本行识别方法,其特征在于,所述结构特征值相对于字符结构的变化趋势与所述识别距离相对于字符结构的变化趋势相同,所述调整步骤采用相除或含有除法的运算对所述初始识别距离进行调整。
25.根据权利要求18到24任一项所述的文本行识别方法,其特征在于,当所述候选字符有多个训练样本时,所述结构特征值计算步骤所计算出来的结构特征值为针对所有该多个训练样本计算出来的结构特征值的平均或加权平均。
26.一种文本行识别装置,包括特征提取单元、粗分类单元、特征重构单元、精细识别单元,所述精细识别单元输出候选字符的初始识别距离,其特征在于,还包括结构特征值计算单元,计算所述候选字符的训练样本的结构特征值;调整单元,根据所述结构特征值计算单元所计算出来的结构特征值对所述初始识别距离进行调整。
27.根据权利要求26所述的文本行识别装置,其特征在于,所述结构特征值为形状特征值,所述调整单元采用乘法或含有乘法的运算对所述初始识别距离进行调整。
28.根据权利要求27所述的文本行识别装置,其特征在于,所述形状特征值为所述候选字符的训练样本的字符笔画像素点的稀疏程度值、所述候选字符的训练样本的字符笔画的稀疏程度值或所述候选字符的训练样本的字符笔画的行列平均笔画段数目。
29.根据权利要求28所述的文本行识别装置,其特征在于,所述候选字符的训练样本的字符笔画像素点的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画像素点的数目的比值,所述候选字符的训练样本的字符笔画的稀疏程度值为所述候选字符的训练样本的最小外接正方形的面积与所述候选字符的训练样本的字符笔画的数目的n次幂的比值,n为正整数。
30.根据权利要求26所述的文本行识别装置,其特征在于,通过所述候选字符的字符编码获得所述候选字符的训练样本。
31.根据权利要求30所述的文本行识别装置,其特征在于,还包括存储单元,所述存储单元相对应地存储所述候选字符的字符编码与所述候选字符的训练样本,或相对应地存储所述候选字符的字符编码、所述候选字符的训练样本以及所述候选字符的训练样本的权重。
32.根据权利要求27所述的文本行识别装置,其特征在于,所述含有乘法的运算为将所述结构特征值计算单元所计算出来的结构特征值经取对数后与所述初始识别距离的相乘。
33.根据权利要求26所述的文本行识别装置,其特征在于,所述结构特征值相对于字符结构的变化趋势与所述识别距离相对于字符结构的变化趋势相同,所述调整单元采用相除或含有除法的运算对所述初始识别距离进行调整。
34.根据权利要求26到33任一项所述的文本行识别装置,其特征在于,当所述候选字符有多个训练样本时,所述结构特征值计算单元所计算出来的结构特征值为针对所有该多个训练样本计算出来的结构特征值的平均或加权平均。
全文摘要
识别距离调整装置和方法以及文本行识别装置和方法。所述调整候选字符的初始识别距离的方法包括以下步骤结构特征值计算步骤,计算所述候选字符的训练样本的结构特征值;调整步骤,根据所述结构特征值计算步骤所计算出来的结构特征值对所述初始识别距离进行调整。
文档编号G06K9/34GK1916938SQ20051009281
公开日2007年2月21日 申请日期2005年8月18日 优先权日2005年8月18日
发明者孙俊, 堀田悦伸, 胜山裕, 直井聪 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1