用于识别字符的装置和方法

文档序号:6416703阅读:212来源:国知局
专利名称:用于识别字符的装置和方法
目前,对外围输入设备的高级字符识别技术的要求很高。本发明涉及一种用于识别字符的装置和方法,和一种用于存储字符识别程序的存储介质。尤其是,本发明涉及一种用于识别字符的装置和方法,和一种用于存储字符识别程序的存储介质,其中所涉及的装置和方法区别文件中的打印字符和手写字符从而更准确地识别字符。
在现有技术中,如果要识别一个包括有手写字符和打印字符的文件,则首先需要执行两个处理,即识别手写字符的处理和识别打印字符的处理。然后,对这两个处理的结果进行比较以获得一个更可靠的识别结果,从而识别文件。
上述现有技术中通过执行两个处理(分别识别手写字符和打印字符)并对这两个处理的识别结果进行比较,从而获得更可靠的识别结果。由于现有技术需要花费很长的时间来执行识别处理,因此现有技术中的字符识别还存在不足。
本发明致力于解决现有技术中的上述问题,其目的在于更准确地识别手写字符和打印字符,并缩短执行字符识别处理所需要的时间。
为了解决上述问题,本发明对一个图案的特征进行识别,当图案的特征表示该图案为手写字符时,则执行识别手写字符的处理,当图案的特征表示该图案为打印字符时,则执行识别打印字符的处理。
因此,甚至当文件包括手写字符和打印字符时,也可通过只执行手写字符识别处理和打印字符识别处理中的一种处理而获得精确的识别结果,从而可以成功地缩短执行字符识别处理所需要的时间,而不会降低字符识别的精确度。
根据本发明的一个方面,可根据图案的格式或规律性来辨别手写字符或打印字符。
由于打印字符在图案形状和排列方面比手写字符更规律,因此可通过检查图案形状和排列的规律性把手写字符与打印字符区别开来,从而缩短执行子处理所需要的时间。


图1为一个根据本发明的第一实施例的字符识别装置的结构框图。
图2为一个根据本发明的第二实施例的字符识别装置的结构框图。
图3表示本发明所应用的一个系统的结构的示例。
图4为一个根据本发明的第三实施例的字符识别装置的结构框图。
图5表示根据本发明的一个实施例的手写/打印字符辨别单元的结构。
图6为由手写/打印字符辨别单元执行的处理的流程图。
图7表示每个字符类型/集合和特征参数间的关系。
图8表示用于辨别手写字符和打印字符的方法。
图9表示明朝字体的线宽差异。
图10为根据本发明的一个实施例的复杂性提取处理的流程图。
图11表示提取复杂性(线密度)的处理的概念。
图12为根据本发明的一个实施例的线性提取处理的流程图。
图13表示线性提取处理的概念。
图14为根据本发明的一个实施例的线宽差异提取处理的流程图。
图15表示线宽差异提取处理的概念。
图16表示手写字符和打印字符的底线坐标位置的差异,和差异提取处理;和图17为一个字符位置差异的提取处理的流程图。
下面将参看附图来描述根据本发明的一个实施例的字符识别装置。图1为一个根据本发明的第一实施例的字符识别装置的结构框图。图1中,特征识别单元111用于识别从输入图象中所提取的图案的特征。例如,特征识别单元111根据图案的规律性来辨别图案是手写字符还是打印字符。也即,由于打印字符比手写字符更有规律性,因此在图案的规律性比较高时,则特征识别单元111判定该图案为一个打印字符,在图案的规律性比较低时则判定该图案为一个手写字符。
由特征识别单元111所识别的图案的特征包括图案的复杂性,图案的线性,图案的线宽差异,图案排列位置的差异,图案倾斜度的差异,图案尺寸的差异等。可根据图案的线密度,黑色象素的密度,欧拉数,轮廓线长度等来识别图案的复杂性。可结合经过辨别分析等处理后所得到的多个特征来识别图案的特征。
手写字符识别单元113用于识别手写字符。打印字符识别单元114用于识别打印字符。打印字符可为印刷字符,打字机打印字符,由字处理人员所输入的字符等。
字符识别选择单元112根据特征识别单元111的辨别结果选择手写字符识别单元113或打印字符识别单元114。也即,当特征识别单元111判定将要识别的图案为手写字符时,则字符识别选择单元112选择手写字符识别单元113,并通知手写字符识别单元113对将要识别的图案的字符进行识别。当特征识别单元111判定将要识别的图案为打印字符时,则字符识别选择单元112选择打印字符识别单元113,并通知打印字符识别单元113对将要识别的图案的字符进行识别。
因此,有可能使用手写字符识别单元113或打印字符识别单元114来实现字符识别处理,从而可缩短执行字符识别处理所需要的时间,而不会降低识别的精确度,甚至在只使用手写字符识别单元113和打印字符识别单元114中的一个来执行字符识别处理的情况下也是如此。
图2为一个根据本发明的第二实施例的字符识别装置的结构框图。如图2所示,第二实施例解决了上述问题。
字符图案提取单元1从文件或列表的图象中提取一个字符图案。然后,复杂性提取单元2a和线性提取单元2b获得第N个特征向量,其中特征向量中至少包括表示字符图案的复杂性和线性的特征。接下来,手写/打印字符辨别单元2f使用上述特征向量来辨别该字符图案是手写字符还是打印字符。根据辨别结果,字符识别单元3执行相应的手写字符识别处理或打印字符识别处理。线密度可作为表示字符图案的复杂性的特征。线宽差异提取单元2c从由字符图案提取单元1所提取的字符图案中提取表示线宽差异的特征量,其中线宽差异是通过移去一定的图案后得到的,其中所移去的图案为其与包括在字符图案中的字符笔画的结束点,交点和角点相距预定距离的图案。然后根据所提取的特征量辨别字符图案是手写字符还是打印字符。根据辨别结果,相应地执行手写字符识别处理或打印字符识别处理。
由于打印字符可以明朝字体等字体的形式表示,因此线宽差异提取单元2c可获得每个笔画或每个笔画方向上的线宽差异,其中明朝字体在每个笔画方向上有不同的线宽。
字符位置差异提取单元2d用于获得字符位置的差异。当一个字符图案表示字符位置差异很大时,则手写/打印字符辨别单元2f判定该图案为手写字符,并通知手写字符识别单元3a对该图案的字符进行识别。另一方面,当一个字符图案表示字符位置差异很小时,则手写/打印字符辨别单元2f判定该图案为打印字符,并通知打印字符识别单元3b对该图案的字符进行识别。
除了字符位置的差异,也可通过检查字符的倾斜度的差异,尺寸的差异等来辨别字符图案是手写字符还是打印字符。
在本实施例中,需获得第N个特征向量以在手写字符和打印字符间进行辨别,并识别字符是手写字符还是打印字符,其中特征向量中至少包括表示字符图案的复杂性的特征和表示字符图案的线性的特征。因此,可精确地辨别出手写字符和打印字符,并可在短时间内执行字符识别处理。而且,通过使用线密度作为一个表示字符图案的复杂性的特征,可方便并快速地获得特征量。
可通过使用表示线宽差异的特征量来辨别手写字符或打印字符从而获得线宽差异,而不会受到因对明朝字体添加修饰符等所造成的影响,从而可准确地辨别出手写字符或打印字符,其中线宽差异是通过移去一定的图案后得到的,其中所移去的图案为距包括在字符图案中的字符笔画的结束点,交点和角点预定距离的图案。
另外,通过获取每个笔画或每个笔画方向上的线宽差异,可以获得线宽差异而不会受到由于明朝字体的笔画方向而造成的线宽的不同的影响,从而可以正确地辨别手写字符或打印字符。
图3表示本发明所使用的一个系统的结构的例子。
图3中,11为同总线10相连的CPU,其中。同总线10相连的还有RAM 12,ROM 13,一个通信接口14,一个外部存储设备15,一个存储介质读取设备16,一个用于读取图象的扫描仪17,一个输入/输出设备18例如显示器,键盘等。ROM 13中存储了OS等,RAM 12中存储了用于执行根据本发明的处理的程序,数据等。
扫描仪17读取一个图象,其中所读取的图象中存储了将被识别的字符等。输入/输出设备18包括一个输入设备例如键盘,鼠标等,和一个输出设备例如显示检测器,打印机等,输入/输出设备18输入处理数据时所要用到的数据,并输出处理后的数据。
执行字符识别处理时所用到的程序,数据等存储在存储设备15例如硬盘等中,或者存储在存储介质例如CD-ROM,软盘等中,或者存储在RAM 12中,当要处理数据时则由读取设备17从存储设备15中或存储介质中读取处理中所要用到的程序,数据,并由CPU 11执行处理。通信接口14与总线10相连,并且通信接口可以通过通信线路传送和接收数据和程序。
图4为一个由根据本发明的第三实施例的字符识别装置来执行的功能的框图。如图4所示,根据本实施例的字符识别装置包括一个用于对图象数据进行预处理的预处理单元21;一个字符提取单元22;一个手写/打印字符辨别单元23,和一个用于实现字符识别处理的字符识别单元24。预处理单元21,字符提取单元22,和字符识别单元24可由现有技术实现。
在图4中,对由图象输入单元例如扫描仪17等从文件或列表中所读取的图象数据进行预处理例如噪音去除处理,倾斜修正处理等,并把预处理后的数据传送给字符提取单元22。字符提取单元22对预处理后的图象数据的字符数据进行分段。手写/打印字符辨别单元23辨别手写字符和打印字符间的分段字符数据,并把数据划分成手写字符和打印字符。
字符识别单元24根据字符数据是手写字符还是打印字符而执行相应的字符识别处理。也即,字符识别单元24包括用于识别手写字符的手写字符识别单元和用于识别打印字符的打印字符识别单元。当手写/打印字符辨别单元23识别字符图象数据为手写字符时,则上述手写字符识别单元进行字符识别。当手写/打印字符辨别单元23识别字符图象数据为打印字符时,则上述打印字符识别单元进行字符识别。因此,通过预先辨别出字符图案是手写字符还是打印字符,并由字符识别单元24根据辨别结果执行相应的识别处理,可成功地缩短执行字符识别所需的时间。
在上述字符提取处理和手写字符/打印字符辨别处理中,可对字符数据中的每个字符进行分段,并且可对每个分段字符执行手写字符/打印字符辨别处理。否则,可对多个字符进行分段,以在手写字符/打印字符辨别处理中进行集中地处理。
图5表示手写/打印字符辨别单元23的结构。图6表示一个由手写/打印字符辨别单元23执行的处理的流程图。
如图5所示,手写/打印字符辨别单元23包括一个用于规格化分段字符数据的规格化单元31;一个用于从分段字符数据中提取特征参数的特征参数提取单元32;和一个用于识别手写字符或打印字符的辨别单元33。
特征参数提取单元32包括一个复杂性提取单元34,一个线性提取单元35,一个线宽差异提取单元36,和一个字符位置差异提取单元37。
手写/打印字符辨别单元23执行如下的手写字符/打印字符辨别处理。
首先,规格化单元31对图象的大小进行规格化(步骤S1)。
然后,特征参数提取单元32从规格化的字符数据中提取特征参数,并获得一个特征向量,其中所提取的特征参数表示例如字符的复杂性,字符数据的线性,字符的线宽差异,字符位置的差异等(步骤S2)。
接下来,辨别单元33把特征向量分配给一个辨别函数,识别手写字符或打印字符,并存储识别结果(步骤S3)。
辨别单元33通过预先获得一个用于识别手写字符和打印字符的界线,并根据从字符数据中所提取的特征参数判定特征向量位于界线的哪一边来辨别字符,从而执行识别手写字符和打印字符的处理,其中界线是通过在以特征参数为元素的向量空间里执行辨别和分析处理后所得到的。
图7表示每个字符类型/集合和特征参数间的关系。图7中的单词‘大’,‘中’,和‘小’表示特征参数由数值表示时字符类型/集合的相对值。
(1) 表示‘复杂性’的特征参数对于汉字(中文字符)是大,对于其它字符类型(字母字符,数字字符,平假名(日文字符),和片假名(日文字符))则是小,而不管是手写字符还是打印字符。
(2)表示‘线性’的特征参数对于手写字符是小,对于打印字符则是中或大。
(3)表示‘线宽差异’的特征参数对于手写字符一般是大,对于打印字符一般是小。在打印字符中,当明朝字体包括一个结束点或一个角点时则该字符的线宽差异是大。然而,如后面所述,如图7中所示,除了结束点或角点外,该字符的线宽差异是小。另外,由于各个方向上明朝字体的字符线宽是不同的,因此如果获得各个方向上的线宽差异,则线宽差异可更小。
(4)表示‘字符位置差异’的特征参数对于手写字符一般是大,对于打印字符则一般是小。
如上所述,手写字符一般有较少的线性元素,而打印字符一般有较多的线性元素。尤其是,中文字符中包括有较多的线性元素,而其它字符集合例如字母字符,数字字符,平假名字符和片假名字符中则包含有较少的线性元素。
因此,根据字符的复杂性和字符的线性可准确地辨别出手写字符和打印字符,其中字符的复杂性为一种可根据它可从其它字符类型中辨别出中文字符的特征量,其中字符的线性为打印字符的一种特征。
表示复杂性的参数可为笔画的数目等,但是对于下面所描述的快速处理则需要使用字符图案的线密度。
图8表示上述辨别方法。图8表示一个辨别函数的例子,该辨别函数用于选择‘复杂性X1’和‘线性X2’作为特征参数,并在二维坐标中辨别手写字符和打印字符,其中二维坐标以‘复杂性X1’为纵坐标轴,以‘线性X2’为横坐标轴。
复杂性和线性是从各种手写字符和打印字符中获得的。当把结果绘制在上述二维坐标中时,则数字打印字符,字母打印字符,平假名打印字符,片假名打印字符和中文打印字符一般分布在图8中所示的二维坐标的左上部分41,42和43。另一方面,数字手写字符,字母手写字符,平假名手写字符,片假名手写字符和中文手写字符一般分布在二维坐标的右下部分44,45和46。
因此,在这种情况下,通过如图8中所示来定义辨别函数Z,可根据上述两个特征参数从打印字符中辨别出手写字符。
假设G1表示一组打印字符,G2表示一组手写字符,则每组距离重心向量的中心的距离(Mahalanobis距离)可由下面的等式(1)和(2)获得的,其中获得Mahalanobis距离时考虑了每个改变量的差异和改变量间的关系。
G1的Mahalanobis距离为D12=(X-X1-)′Σ1-1(X-X1-)---(1)]]>G2的Mahalanobis距离为D22=(X-X2-)′Σ2-1(X-X2-)---(2)]]>Xk表示组K的重心向量的中值∑k表示组K的方差—均方差矩阵Z=D22-D12(3)对于未知向量,可获得每组的Mahalanobis距离以辨别更接近的组。
因此,可通过求解上述等式(3)来获得辨别函数,并且可根据Z是正还是负来辨别组。例如,当一个未知图案的特征向量位于二维坐标的P点时,则需检查P’点是正还是负,其中P’是把P点投影到辨别函数上所获得的点。如果点P’为正,则辨别该未知图案为一个打印字符。如果点P’为负,则辨别该未知图案为一个手写字符。
在图8中,如同上述参考二维坐标来辨别字符图案一样,可使用参考了N维特征向量空间的辨别方法和分析方法来精确地识别出字符图案为手写字符还是打印字符,其中二维坐标使用了复杂性和线性两个特征量。
也即,如上所述,复杂性,线性,线宽差异,字符位置的差异等的特征量取决于手写字符,打印字符,字符类型或字符集合。因此,通过对多个特征参数适当地进行组合,可更精确地辨别出手写字符和打印字符。
如后面所描述的,通过获得每个笔画或笔画的各个方向上复杂性,线性,线宽差异等的特征量,并使用这些特征量来辨别手写字符或打印字符,可更精确地识别字符。其它特征量也可与字符的倾斜度的特征量结合起来使用。
图7中,表示线宽差异的特征量对于手写字符是大,对于打印字符是小。因此,可使用一个或多个在手写字符和打印字符间具有很大差异的特征量的特征参数来辨别手写字符或打印字符。
在明朝字体中,图9A所示的字符的笔画的结束点51和角点52处被添加了修饰符。因此,在计算线宽差异时如果把明朝字体中的结束点51和角点52也计算了进去,则线宽差异会变大,从而会把打印字符错误地识别为手写字符。
如下面所述,获得一个笔画的结束点51,交点52,和角点53,并从这些点中减去一个预定的长度,从而可获得笔画的线宽差异。在明朝字体中,图9B中所示的笔画方向61和62间的线宽是不同的。相应地,需获得笔画61和62的笔画线宽差异或笔画61和62方向上的笔画线宽差异。
因此,可获得表示线宽差异的特征量。根据所获得的特征量,识别手写字符或打印字符,从而可更准确地实现辨别处理。
下面将要描述提取上述各种特征参数的处理。
(1)提取复杂性(线密度)字符的复杂性是一个表示用于从上述其它的字符类型中辨别出中文字符的特征量的有效参数。可从笔画的数目等中获得字符的复杂性,但是对于更方便更快速的处理来讲,则需要根据线密度来获得字符的复杂性。下面将要描述根据线密度提取复杂性的处理。
图10为根据本发明的一个实施例的复杂性提取处理的流程图。图11表示提取复杂性(线密度)的处理的概念。
为了从字符图象数据中提取复杂性,如图10和11(步骤S11)所示,需把字符数据的线密度投影到0度,45度和90度的方向上。然后,获得并存储根据0度,45度和90度方向上的投影所得到的线密度平均值(步骤S12)。
例如,为了获得45度方向上的线密度,则需对字符图象数据的象素进行对角扫描以获得象素的数目,其中象素中的白色象素被转换成黑色象素。在图11中所示的情况下,除去字符‘+’71的中央部分外,象素的数目为2,其中象素中的白色象素被转换成黑色象素。由于该字符的中央部分为1,因此进行如图11所示的处理。
如上所述,获得每个方向上的线密度,和一个密度值的平均值,从而可提取相应于字符图象数据的复杂性的特征参数。
(2)提取线性打印字符包括多个线性元素,并且在从手写字符中辨别打印字符时,线性为一个有效参数。
图12为一个表示根据本发明的实施例的线性提取处理的流程图。图13表示线性提取处理的概念。
为了从字符图象数据中提取线性,首先需提取字符图象数据的边缘(步骤S21)。例如,在图13中所示的字符图象‘+’81的情况下,需提取边缘图象82,其中边缘图象82表示为用黑色框起的白色字符。
然后,计算水平游程的长度,并且存储比预定长度长的游程的数目(步骤S22)。在图13所示的例子中,提取水平方向上比预定长度长的游程,并把这种游程的数目存储起来。
相似地,计算垂直方向上连续游程的长度,并且存储比预定长度长的游程的数目(步骤S23)。在图13所示的例子中,提取垂直方向上比预定长度长的游程,并把这种游程的数目存储起来。
如上所示,提取在水平方向上和垂直方向上比预定长度长的游程,并且计算这种游程的数目,从而可提取相应于每个方向的线性的特征参数。
(3)提取线宽差异笔画的线宽差异是一个用于从打印字符中辨别手写字符的有效参数。如上所述,手写字符一般表示较大的线宽差异,然而打印字符一般表示较小的线宽差异。然而,在明朝字体中,修饰符被添加到笔画的结束点和角点上。如果在线宽差异的计算中也对这些修饰符进行了计算,则线宽差异将变大,打印字符就会被误认为是手写字符。另外,在明朝字体中,线宽取决于上述笔画的方向。
根据本实施例,需获得笔画的一个结束点,一个交点,和一个角点,并从这些点中移去预定长度的部分,获得笔画的线宽差异,并获得每个笔画或每个笔画方向上的线宽差异。
图14表示一个根据本发明的实施例的线宽差异提取处理的流程图。图15表示线宽差异提取处理的概念。
为了从字符图象数据中提取线宽差异,首先需对字符图象的行进行细化,以获得一个细化行图象(步骤S31)。例如,在图15中所示的例子中,可通过对一个原始图象91的行进行细化来获得一个细化行图象92。
然后,从该细化行图象92中获得结束点93-96,交点97,和角点。通过从该细化行图象92中移去结束点93-96,交点97,和角点的周围的象素,可获得一个细化行图象98(步骤S32和S33)。
然后,获得每个点的向量,其中点为留在步骤S33中所获得的细化行图象中的点,并获得垂直于向量方向上的线宽(步骤S34)。在图15所示的例子中,获得每个留在细化行图象98中的点在水平方向上的线宽H和在垂直方向上的线宽V。
获得向量在各个方向上的线宽H的差异和V的差异(标准偏差),并且存储一个平均值(步骤S35)。
如上所述,根据所获得的特征参数,可辨别手写字符或打印字符,从而精确地识别出手写字符和打印字符。另外,在明朝字体中,可通过获得从笔画中移去笔画的结束点,交点和角点后所得到的线宽差异,并获得上述每个向量方向上的线宽差异,从而更精确地从打印字符中识别出手写字符。
(4)提取字符位置差异每个字符的底线坐标的位置差异对于图16A中所示的打印字符来讲是小,对于图16B中所示的手写字符则是大。因此,位置差异是一个用于识别手写字符和打印字符的有效参数。尤其是,这一方法对于某个领域是高效的,例如对于将输入数字字符的列表的数值列。
图17表示根据本发明的一个实施例的提取字符位置差异的处理的流程图。
为了从字符图象数据中提取线宽差异,需获得一个区域内的连通黑色象素的封闭矩形(步骤S41)。例如,对于图16B所示的连通元素,需获得图16C所示的封闭矩形101-106。
然后,(步骤S42)获得并存储封闭矩形101-106的底线坐标Y1-Y6的差异(标准偏差)。
通过执行上述处理,可获得有关于字符位置差异的特征参数。通过使用这些特征参数,可在某个领域中准确地识别出手写字符和打印字符,例如在将输入数字字符的列表的值列等中。
根据上述实施例,可获得下述效果。
(1)由于可使用特征向量来识别手写字符和打印字符,因此可在短时间内实现准确的识别处理,其中特征向量中包括一个至少表示字符图案的复杂性和线性的特征量。
(2)可通过把线密度作为表示复杂性的特征来快速,方便地获得表示复杂性的特征。
(3)通过使用一个特征量来识别手写字符和打印字符,可更准确地从打印字符中识别出手写字符,而不会受到由于对字体例如明朝字体添加修饰符等所造成的影响,其中所使用的特征量为线宽差异,其中线宽差异是通过从图案中移去一定的图案后得到的,所移去的图案为距离包括在字符图案中的字符笔画的结束点,交点和角点预定距离的图案。
(4)通过获得每个笔画或每个笔画方向上的线宽差异,可提取线宽差异,而不会受到由于明朝字体的笔画方向所造成的线宽不同的影响,从而可更准确地识别手写字符和打印字符。
权利要求
1.一种用于识别一个字符的方法,包括如下步骤从文件或列表的图象中提取一个字符图案;从该字符图案中获得N个特征向量,其中特征向量中包括一个至少表示该字符图案的复杂性和线性的特征;和使用该特征向量来辨别手写字符和打印字符间的字符图案,并根据辨别结果执行字符识别处理。
2.根据权利要求1所述的方法,其中线密度用作一种表示复杂性的特征。
3.一种用于识别一个字符的方法,包括如下步骤从文件或列表的图象中提取一个字符图案;提取一个表示线宽差异的特征量,其中线宽差异是通过从字符图案中移去一定图案后得到的,其中所移去的图案为距包括在字符图案中的字符笔画的结束点,交点和角点预定距离的图案;至少根据特征量从打印字符中辨别出手写字符;和根据辨别结果识别一个字符。
4.根据权利要求3所述的方法,其中获得每个笔画或笔画方向上的所述线宽差异。
5.一种字符识别装置,包括用于从文件或列表的图象中提取字符图案的装置;用于在手写字符和打印字符间辨别字符图案的手写/打印字符辨别装置;和用于根据辨别结果识别字符的字符识别装置,其中所述手写/打印字符辨别装置包括复杂性提取装置,用于从字符图案中提取表示字符图案的复杂性的特征;线性提取装置,用于提取表示线性的特征;和辨别装置,用于根据N个特征向量来辨别手写字符和打印字符间的字符图案,其中特征向量中至少包括一个表示复杂性的特征和一个表示线性的特征。
6.根据权利要求5所述的装置,其中所述复杂性提取装置通过从字符图案中获得线密度来提取表示复杂性的特征。
7.一种字符识别装置,包括用于从文件或列表的图象中提取字符图案的装置;用于在手写字符和打印字符间辨别字符图案的手写/打印字符辨别装置;和用于根据辨别结果识别字符的字符识别装置,其中所述手写/打印字符辨别装置包括线宽差异提取装置,用于提取一个表示线宽差异的特征量,其中线宽差异是通过从字符图案中移去一定图案后得到的,其中所移去的图案为距包括在字符图案中的字符笔画的结束点,交点和角点预定距离的图案;和辨别装置,用于至少根据一个表示线宽差异的特征量,在手写字符和打印字符间辨别字符图案。
8.根据权利要求7所述的装置,其中所述线宽差异提取装置需获得每个笔画或笔画方向上的线宽差异。
9.一种字符识别装置包括特征识别装置,用于识别从输入图象中所提取的图案的特征;手写字符识别装置,用于识别手写字符;打印字符识别装置,用于识别打印字符;和字符识别选择装置,用于根据所述特征识别装置的识别结果来选择所述手写字符识别装置或所述打印字符识别装置。
10.根据权利要求9所述的装置,其中所述特征识别装置根据图案的规律性来辨别手写字符和打印字符间的图案。
11.根据权利要求9所述的装置,其中图案的特征至少包括复杂性,线性,线宽差异,排列位置差异,倾斜度差异,和图案的大小差异中的一个。
12.根据权利要求11所述的装置,其中所述复杂性至少包括线密度,黑色象素的密度,欧拉数目,和轮廓长度中的一个。
13.根据权利要求11所述的装置,其中所述线性是根据图案中多个比预定长度长的行进行计算的。
14.一种计算机可读存储介质中存储有字符识别程序,其中所存储的字符识别程序用于识别从文件或列表的图象中所提取的字符图案,其中所述字符识别程序指示计算机执行如下步骤从该字符图案中获得N个特征向量,其中特征向量中包括一个至少表示该字符图案的复杂性和线性的特征;和使用该特征向量在手写字符和打印字符间辨别字符图案。
15.一种计算机可读存储介质中存储有字符识别程序,其中所存储的字符识别程序用于识别从文件或列表的图象中所提取的字符图案,其中所述字符识别程序指示计算机执行如下步骤提取一个表示线宽差异的特征量,其中线宽线宽是通过从字符图案中移去一定图案后得到的,其中所移去的图案为距包括在字符图案中的字符笔画的结束点,交点和角点预定距离的图案;和至少根据特征量从打印字符中辨别出手写字符。
全文摘要
一个字符图案是从从文件,列表等中所读取的图象数据中提取的,并且由手写/打印字符辨别单元在手写字符和打印字符间进行辨别。手写/打印字符辨别单元从字符图案中获得N个特征向量,其中特征向量中包括一个至少表示该字符图案的复杂性和线性的特征;并使用所获得的特征向量来识别手写字符和打印字符间的字符图案。一个字符识别单元根据辨别结果,即为手写字符还是打印字符,执行相应的字符识别处理。
文档编号G06K9/46GK1258894SQ99110710
公开日2000年7月5日 申请日期1999年7月28日 优先权日1998年12月16日
发明者柏冈润二, 直井聪 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1