文字辨识方法

文档序号：6609441阅读：277来源：国知局

专利名称：文字辨识方法
技术领域：
本发明是有关于一种文字辨识方法，且特别是有关于一种利用印刷线将文字分群辨识的方法。
背景技术：
在资讯爆炸的时代，一般人时常会需要阅读大量的书籍或报章杂志，若看到值得保存的文章段落或是重点时，通常是采用影印或剪辑的方式存档或是直接用笔标记。而对于文字工作者来说，在阅读完一篇文章后，若需
要使用里面的资料,就必需借由重新键入(Key-in)的方式输入到电脑中,才能够对此资料进行编辑或存档的动作，不仅费力且耗时。
为了解决这个问题，目前有业者研发了光学辨识技术，使用者只需借由一般的扫描器设备，将所欲保存的文件扫描成图档，再利用文字辨识的软件，将此图档中的文字部份撷取出来，并转换成对应的数字字元，借以提供使用者迅速取得文件的电子档，方便地编辑或处理文件。目前的光学辨识技术所运用的领域十分广泛，举凡图书馆文献资料存档、企业内部文件管理，甚至证照、票据的辨识，都可利用此光学辨识技术轻易达成，不仅能精准地辨识资料，更能够省下大量资料比对与查核的人力与时间。
光学文字辨识通常简称为OCR (Optical Character Recognition),其主要用途是针对既有的书面文件进行文字识别的动作。首先文件需先通过平台型或掌上型扫描器，将^&夂辨识的文件先行扫描成图档。由于在扫描文件时可能会因为文件本身不千净、字元模糊，或是扫描器解析度的问题，使得输入的影像可能存在着一些杂讯，这些杂讯都会影响到后续文字辨识的准确率。因此,光学文字辨识软件会先针对扫描的文件图档进行倾斜校正、杂讯移除、影像边缘锐利化等处理。接着，光学文字辨识软件会对处理后的图档进行图文分离的动作，将文件中所有的文字、图形和表格分离，并且针对部份文字笔划不连接的情形，正确地切割或合并文字。然后，光学文
字辨识软件将进行文件辨识的动作，利用将文字图像拿来与文字资料库比对，并同时通过中文校正的功能，进行词库、前后文相关字词的确认后，最后输出精准的辨识结果。而辨识出来的文字可直接存成Word、 PDF、纯文字等格式的档案，如此不但可减轻资料输入的负担，同时也可增加资料输入的速度及正确性。
然而，在上述辨识文字的过程中,必须逐一将文件中的每个字元与文字资料库中的所有字元进行比对，此举将会耗费大量的运算资源，且增加文字辨识的处理时间。此外，上述这种无差别式的比对方式，极有可能因为杂讯的千扰而造成文字的误判，并无法针对各个文字之间或文字与印刷线之间的相对位置，有效地改善文字的辨识率及辨识速度。

发明内容
本发明提供一种文字辨识方法，借由印刷文字与印刷线之间的相对位置将印刷文字分类，而仅取文字资料库中对应字元类别的字元与此印刷文字进行比对，因此能够提高文字辨识的正确率及速度。
本发明提出一种文字辨识方法，包括下列步骤:a.扫描一行印刷文字,其中此行印刷文宇包括多个第一字元；b.利用这些第一字元，产生多条印刷线;c.依据各个第一字元在这些印刷线中的一相对位置，判断各个第一字元所属的字元类别；以及d.将各个第一字元与一资料库中属于此字元类别的多个第二字元比对，找出各个第一字元所对应的第二字元，而辨识出第一字元，其中此资料库包括记录多种字元类别及各种字元类别所属的第二字元。
在本发明的一实施例中，上述的印刷线包括顶线(top line)、上层线 (upper line )、基线(base line )及底线(bottom line ),而顶线与上层线之间为上层区(upper zone )、上层线与基线之间为中间区(central zone )、基线及底线之间为下层区(downer zone )。
在本发明的一实施例中，上述的步骤c.包括cl.判断各个第一字元是否属于小字元；c2.若属于小字元,则进行小字元分类;c3.若不属于小字元，则进行非小字元分类。
在本发明的一实施例中，上述的步骤cl.包括cl-l.分别计算各个第一字元的字元高度；cl-2.将各个第一字元的字元高度与一预设高度值比较,而将字元高度小于此预设高度值的第一字元归类为小字元。
在本发明的一实施例中，其中在步骤cl-2.之后更包括cl-3.分别撷取剩余的各个第一字元中心的中心参考点；cl-4.利用最小平方法，求取这些中心参考点所趋近的一条中心线；cl-5.判断各个第一字元的下缘是否位于此中心线的上方，而将下缘位于中心线的上方的第一字元归类为小字元;以及cl-6.判断各个第一字元的上缘是否位于中心线的下方，而将上缘位于中心线的下方的第一字元归类为小字元。
在本发明的一实施例中，上述的步骤c.更包括依据所产生的印刷线的数目及种类，将这些印刷线归类为多个状态其中之一，而这些状态包括第一状态、第二状态、第三状态及第四状态。其中，第一状态代表这些印刷线包括上述的顶线、上层线、基线及底线。第二状态代表这些印刷线包括上述的基线、底线，以及由顶线与上层线合并的印刷线。第三状态代表这些印刷线包括上述的顶线、上层线，以及由基线与底线合并的印刷线。而第四状态则代表这些印刷线包括由顶线及上层线合并的印刷线，以及由基线与底线合并的印刷线。
在本发明的一实施例中，上述的步骤d.包括dl.计算各个第一字元的第一特征值；以及d2.针对各个第一字元，将其第一特征值与前述资料库中属于其字元类别的各个第二字元的第二特征值比较，找出特征值最相近的第二字元做为此第一字元的辨识字元。此外，更包括使用各个第一字元所对应的预测模型，来辨识第一字元。
本发明因采用将印刷文字分群比对的结构，利用印刷文字位于印刷线上的相对位置资讯，将印刷文字分类，同时也在进行文字辨识时，仅取文字资料库中对应其字元类别的字元来进行比对，因此可减少文字比对的范围及数目，而能够提高文字辨识的正确率及速度。
为让本发明的上述特征和优点能更明显易懂，下文特举较佳实施例，并配合所附图式，作详细说明如下。

图1是依照本发明较佳实施例所绘示的印刷线示意图。图2是依照本发明较佳实施例所绘示的文字辨识方法的流程图。图3是依照本发明较佳实施例所绘示的字元分类图。图4是依照本发明较佳实施例所绘示的特征值计算方法的流程图。图5则是依照本发明较佳实施例所绘示的特征值计算方法的一范例。图6是依照本发明较佳实施例所绘示的小字元判断方法流程图。图7A及图7B是依照本发明较佳实施例所绘示的小字元分类方法的流程图。
图8是依照本发明较佳实施例所绘示的非小字元分类方法的流程图。 S201 S204:本发明较佳实施例的文字辨识方法的各步骤 S401 S406:本发明较佳实施例的特征值计算方法的各步骤 S601 S607:本发明较佳实施例的小字元判断方法的各步骤 S701 S720:本发明较佳实施例的小字元分类方法的各步骤 S801 S811:本发明较佳实施例的非小字元分类方法的各步骤
具体实施例方式
通常在撰写英文语系的文字时，依照其字型的特性，都会依循着一定的轨迹调整或排列书写文字的大小及位置，这些隐藏的"参考线"就类似当初在学习书写这些文字时，写字本上所打印的四条直线，使用者只要依照这些直线书写文字，就能够写出整齐、清楚的文章。同样地，这些英文语系的文字在打印时也会遵循着这些参考线，这些参考线也就是本文所谓的印刷线。
图l是依照本发明较佳实施例所绘示的印刷线示意图。请参照图1，本
实施例是依照印刷文字"typeface analysis"中各个印刷字元的字型，定义出四条印刷线，这些印刷线依其所在位置可区分为顶线(top line)、上层线 (upper line )、基线(base line )及底线(bottom line ),而这些印刷线之间的区域则可分为上层区(upper zone )、中间区(central zone )及下层区(lower zone)。值得注意的是，图1中每个印刷字元都可视为是由多个互相连接的区块(connect-component， CC )所构成，而这些连接在一起的区块则称为 CC群。
由上述可知，依照英文语系文字的特性，其印刷时的位置均会落在这四条印刷线之间，且不同特性的字元(例如小写字母、大写字母、上标字元、下标字元)也会占据这些印刷线之间的不同区域。本发明即利用此特点，将文字资料库中的所有的字元分门别类，而在实际进行文字辨识时,先找出所欲辨识文字的字元类别，再取文字资料库中对应的此字元类别的字元来做比对，而能够得到较准确的比对结果。为了使本发明的内容更为明了，以下特举实施例作为本发明确实能够据以实施的范例。
图2是依照本发明较佳实施例所绘示的文字辨识方法的流程图。请参照图2，本实施例是用以辨识一行印刷文字，借由将此行印刷文字中的每个印刷字元与资料库中某一字元类别的字元进行比对，而辨识出各个印刷字元。
首先,扫描此行印刷文字,其中此行印刷文字中包括多个第一字元(步骤 S201 )。此处所指的印刷文字可以是自一份文件中撷取的任何一行文字，本发明并不限定其范围，以下仅就单一行印刷文字的辨识进行说明。
接着即可利用这些第一字元，产生多条印刷线(步骤S202)，所产生的印刷线的种类如图1所示，包括顶线、上层线、基线及底线，而这些印刷线之间的区域则可分为上层区、中间区及下层区。然而，随着印刷字元种类的不同，也有可能会产生二至四条不等的印刷线。
然后，依据各个第一字元在印刷线中的相对位置，判断各个第一字元所属的字元类别(步骤S203 )。举例来说,图3是依照本发明较佳实施例所绘示的字元分类图。请参照图3，本实施例是将资料库中的英文字元依其在印刷线中所占的区域位置分为八类。其中，第一分类(FULL)占了上层区、中间区及下层区。第二分类(HIGH)占了上层区及中间区。第三分类(DEEP) 占了下层区。第四分类(SHORT)占了中间区。第五分类(SUPER)为小字元，且位于中心线附近。第六分类(SUBSCRIPT)占了中心线与上层线之间。第七分类(CENTER)占了中心线与基线之间。第八分类(UNKNOWN) 为剩余无法按照印刷线分类者。当然，在本发明的其它实施例中，也可以将英文字元分类成其它不同种类，而不限制其范围。
在决定了各个第一字元的字元类别后，即可将这些第一字元分别与资料库中字元类别相同的第二字元进行比对，找出各个第一字元所对应的第二字元，而辨识出这些第一字元(步骤S204)。举例来说，若欲辨识印刷字元"N"，则可将其归类为图3中的第二类。而实际在进行文字辨识时，也是只取第二类所包含的字集，逐一与印刷字元"N"进行比对。据此，即可大幅减少所需比对的字元数目，同时也因为在同一个字元类别中，每一个字元在印刷线中的相对位置均相同或相似，因此也较不会有辨识错误的情况发生，而能够提高辨识率。
值得一提的是，上述辨识第一字元的方式例如是先计算第一字元的第一特征值，再将此第一特征值与资料库中同一个字元类别中的第二字元的第二特征值比较，而找出特征值最相近的第二字元做为第一字元的辨识字元。
举例来说，图4是依照本发明较佳实施例所绘示的特征值计算方法的流程图，图5则是依照本发明较佳实施例所绘示的特征值计算方法的一范例。请参照图4，本实施例是将一个字元(或者说是一个CC群)分成数个等份，并计算各个部份所涵括的区块(CC)个数，而求得一个能够代表此字元的特征值矩阵。
首先，找出一条通过此字元中心参考点的中央垂直线，并计算位于此中央垂直线上1/3及2/3位置的参考点(如图5所示的A点及B点)的座标(步骤S401 )。接着则取一个参考半径(步骤S402 ),此参考半径R例如
是此字元对角线长度的一半，即^ =在2+『2/2，其中L為字元長度、『為字元寬度。
此时若以A点为圆心，R为半径画圆，并将360度划分为18个方向，则这18个方向及此圓的圓周将会把字元切分为36个区域。因此，下一步则是分别计算这36个区域所包括的区块(CC)个数，并记录于A矩阵中 (步骤S403 )。同理，若以B点为圆心，R为半径画圓，也会把字元切分为36 个区域。因此，可再分别计算此36个区域中所包括的区块(CC)个数,并记录于B矩阵中(步骤S404)。
然后再将这两个矩阵分别予以正规化(步骤S405 )，此即分别将这两个矩阵中各个元素除以该矩阵中所有元素的和，借此消除因字元的字型大小
不同所可能造成的影响。最后则将这两个矩阵合并为一个一维矩阵，而做为此字元的特征值矩阵(步骤S406)。
以图5所绘示的字元"N"为例,其A点及B点的座标分别是(5，4)及(5，8),而其参考半径11=7.5。因此，若以(5,4)为圆心，7.5为半径画圆,并以l8 个方向切分区域以计算区块数目，则可获得矩阵A:
A[2] [ 18]=436432732541000132 000404000000000000
其中，矩阵A的第一列为圆内18个区域的区块数目；而第二列则为圓外18个区域的区块数目。同理，若以(5，8)为圓心，7.5为半径画圆，并以 18个方向切分区域以计算区块数目，则可获得矩阵B:
B[2][18]=436100332436511362 000000000000202000
其中，矩阵B的第一列为圓内18个区域的区块数目；而第二列则为圆外18个区域的区块数目。最后则可将这两个阵列进行正规化后，再合并为一个一维矩阵，而获得所需的特征值矩阵。
除了上述特征值比对的方法外，本发明亦包括使用各个第一字元所对应的预测模型，来辨识第一字元。然而，上述这些字元比对的方式仅为举例说明，熟知本领域技术者当可视实际需要，采用其它种类的字元比对方式。
由上述的内容可知，本发明的重点在于依据一个字元在印刷线中的相对位置，来判断该字元所属的字元类别。其中，本发明是将资料库中的所有字元分成小字元及非小字元两部份，而针对这两个种类的字元则个别制定一套字元类别的判断方法，兹分述如下
首先必需判定一个字元是否属于小字元，请参照图6，本实施例是在扫描完一行印刷文字后，会找出其中较小或位置较偏的印刷字元，而将其归类为小字元。
首先，扫描影像中的每个印刷字元会先被标记一个外框，此外框包括印刷字元的上、下、左、右等四个边缘，此时就可根据这些标记的外框,计算出每个印刷字元的字元高度(步骤S601)。
这些印刷字元的字元高度则接着拿来和一个预设高度值比较，而判断出各个印刷字元的字元高度是否小于此预设高度值(步骤S602 )。此预设高度值例如是所有印刷字元的字元高度平均值的一半，在此不限定其范围。
其中，若印刷字元的字元高度小于预设高度值,则可将此印刷字元归类为小字元(步骤S607)。在剔除字元高度较小的印刷字元后，下一步则分别撷取剩余的各个印刷字元的一个中心参考点(步骤S603 )，并利用最小平方法(least square)，求取这些中心参考点所趋近的一条中心线(步骤S604)，而使各个印刷字元的中心参考点距离此中心线的总和为最小。
在中心线定义出来后，即可用来判断剩余的印刷字元中是否还存在着小字元。其中例如先判断印刷字元的下缘是否位于中心线的上方(步骤S605 )，若为真则将此印刷字元归类为小字元(步骤S607);否则就继续判断印刷字元的上缘是否位于中心线的下方(步骤S606)，若为真则将此印刷字元归类为小字元(步骤S607)。简单来说，本实施例的目的就是要找出不会通过中心线的印刷字元，这些印刷字元可能是杂讯或是标点符号，其外型往往比实际的字母小，也通常不会印在中心线上。
借由上述方法即可判定出印刷文字中的小字元，接着就可进行小字元的分类步骤。图7A及图7B是依照本发明较佳实施例所绘示的小字元分类方法的流程图。请先参照图7A,本实施例是根据上述产生的印刷线的数目及种类，归类出印刷线的状态(步骤S701)，并依照此印刷线的状态，针对一个小字元进行分类。其中，上述这些状态例如包括第一状态、第二状态、第三状态及第四状态。其中，第一状态代表这些印刷线包括上述的顶线、上层线、基线及底线。第二状态代表这些印刷线包括上述的基线、底线，以及由顶线与上层线合并的印刷线。第三状态代表这些印刷线包括上述的顶线、上层线，以及由基线与底'线合并的印刷线。而第四状态则代表这些印刷线包括由顶线及上层线合并的印刷线，以及由基线与底线合并的印刷线。
首先，找出顶线与上层线之间的一条中心线，并分别计算小字元的中心参考点至顶线、上层线、基线、中心线的第一距离、第二距离、第三距离、第四距离及第五距离(步骤S702)。在一实施例中，上述中心线的y 截距例如是顶线与上层线的y截距的平均，而其斜率则等于上层线的斜率,然而本发明并不限制其范围，使用者可依其需要，取用顶线与上层线之间的任一条直线做为中心线。
接着，则可计算此小字元的高度与宽度的比值(步骤S703 ),此比值则接着被拿来和一个第一临界值做比较，以判断其是否大于此第一临界值(步骤S704)。其中此第一临界值例如为整数4，而不限制其范围。
在步骤S704中，若此小字元的比值大于第一临界值，则可继续判断印刷线的分类是否属于第一状态或第二状态(步骤S705 )。若否，则可将小字元归类为第八分类(步骤S706);若是，则可计算此小字元的下缘与顶线及上层线的距离，而判断出其下缘是否与上层线的距离较近(步骤S707)。若是，则将小字元归类为第四分类(步骤S708);反之则将其归类为第二分类 (步骤S709 )。
另一方面，请继续参照图7B，在步骤S704中，若小字元的比值不大于第一临界值，则会继续判断是否第五距离小于第二临界值,或者是第五距离小于第二距离及第三距离(步骤S710)。若符合上述条件其中之一者，则继续判断是否第三距离小于第五距离及第二距离(步骤S711)。若是，则将小字元归类为第六分类(步骤S712);反之则继续判断是否第二距离小于第五距离及第三距离(步骤S713)。若是，则将小字元归类为第五分类(步骤S714);否则就归类为第七分类(步骤S715)。
再者，若在步骤S710中没有任何一个条件相符，则会判断是否小字元的中心参考点落在中心线上(步骤S716)。若否，则将小字元归类为第六分类(步骤S717);若是，则分别计算小字元的下缘与上层线及基线的距离，并判断其下缘是否与上层线的距离较近(步骤S718)。若是，则将小字元归类为第五分类(步骤S719);否则归类为第四分类(步骤S720)。
在以上小字元的分类方法中，所分类而得的第一至第八分类例如是图3 所列示的分类，然不限定其范围。而图3的分类亦延用至非小字元的分类方法中，以下即介绍非小字元的分类方法的详细步骤
图8是依照本发明较佳实施例所绘示的非小字元分类方法的流程图。请参照图8，如同前个实施例的做法，本实施例一开始亦根据印刷线的数目及种类，判断印刷线的状态(步骤S801)，并依照此印刷线的状态，针对一个非属于小字元的字元进行分类。其中，这些状态例如包括第一状态、第二状态、第三状态及第四状态，而其定义均与前个实施例相同，故在此不再赘述。
若印刷线的分类属于第一状态时，则会判断字元的上缘是否位于顶线的上方(步骤S802)。若是，则继续判断此字元的下缘是否位于底线的上方 (步骤S803 )。若是，则可将此字元归类为第一分类(步骤S804);反之则将此字元归类为第二分类(步骤S805 )。
其中，在步骤S802中，若判断字元的上缘不是位于顶线的上方时，则会继续判断此字元的下缘是否位于底线的上方(步骤S806)。若是，则将此字元归类为第三分类(步骤S807);反之则将此字元归类为第四分类(步骤 S808 )。
另一方面，若印刷线的分类属于第二状态时，则会判断此字元的上缘是否位于顶线的上方(步骤S809)，若是，则将此字元归类为第二分类(步骤S810);反之则将其归类为第四分类(步骤S811)。
最后，若印刷线的分类属于第三状态或第四状态时，则是将第一字元归类为第八分类(步骤S812)，意即归类为无法按照印刷线分类的类别。
在以上非小字元的分类方法中，判断所得的第一至第八分类同样是采用如图3所列示的分类，然不限定其范围。而结合上述小字元及非小字元的分类方法即能够针对所有类型的字元，筛选合适的光学文字辨识(Optical Character Recognition, OCR)资料来做辨识，而能够有效提高辨识率。
综上所述，本发明的文字辨识方法至少具有下列优点
1. 在进行文字辨识前先针对所有要辨识的文字，按照可能在印刷线的位置做分类，个别产生特征值等光学文字辨识资料。
2. 使用已知字元与印刷线之间的相对位置资讯来评估字元属于哪一个分类，并用此分类对应的OCR资料来进行辨识，因此能够提高辨识速度。
虽然本发明已以较佳实施例揭露如上，然其并非用以限定本发明，任何所属技术领域中具有通常知识者，在不脱离本发明的精神和范围内，当可作些许的更动与润饰，因此本发明的保护范围当视所附的权利要求所界定者为准。
权利要求
1. 一种文字辨识方法，其特征在于其包括下列步骤a. 扫描一行印刷文字，其中该行印刷文字包括多个第一字元；b. 利用该些第一字元，产生多条印刷线；c. 依据各该些第一字元在该些印刷线中的一相对位置，判断各该些第一字元所属的一字元类别；以及d. 将各该些第一字元与一资料库中属于该字元类别的多个第二字元比对，找出各该些第一字元所对应的该第二字元，而辨识出该些第一字元，其中该资料库包括记录多种字元类别及各该些字元类别所属的该些第二字元。
2. 根据权利要求1所述的文字辨识方法，其特征在于该些印刷线包括一顶线、一上层线、一基线及一底线，而该顶线与该上层线之间为一上层区、该上层线与该基线之间为一中间区、该基线及该底线之间为一下层区。
3. 根据权利要求2所述的文字辨识方法，其特征在于该步骤c.包括 cl.判断各该些第一字元是否属于一小字元； c2.若属于该小字元，则进行一小字元分类；以及 c3.若不属于该小字元，则进行一非小字元分类。
4. 根据权利要求3所述的文字辨识方法，其特征在于该步骤cl,包括 cl-l.分别计算各该些第一字元的一字元高度；以及 cl-2.将各该些第一字元的该字元高度与一预设高度值比较，而将该字元高度小于该预设高度值的该些第一字元归类为该些小字元。
5. 根据权利要求4所述的印刷线生成方法，其特征在于在步骤cl-2. 之后更包括c 1 -3 .分别撷取剩余的各该些第一字元中心的一中心参考点； cl-4.利用一最小平方法，求取该些中心参考点所趋近的一中心线； cl-5.判断各该些第一字元的一下缘是否位于该中心线的上方，而将该下缘位于该中心线的上方的该些第一字元归类为该些小字元；以及cl-6.判断各该些第一字元的一上缘是否位于该中心线的下方，而将该上缘位于该中心线的下方的该些第一字元归类为该些小字元。
6. 根据权利要求3所述的文字辨识方法，其特征在于该步骤c.更包括依据所产生的该些印刷线的数目及种类，将该些印刷线归类为多个状态其中之一。
7. 根据权利要求6所述的文字辨识方法，其特征在于该些状态包括一第一状态，该第一状态代表该些印刷线包括上述的该顶线、该上层线、该基线及该底线；一第二状态,该第二状态代表该些印刷线包括上述的该基线、该底线，以及由该顶线与该上层线合并的该印刷线；一第三状态，该第三状态代表该些印刷线包括上述的该顶线、该上层线，以及由该基线与该底线合并的该印刷线；以及一第四状态，该第四状态代表该些印刷线包括由该顶线及该上层线合并的该印刷线，以及由该基线与该底线合并的该印刷线。
8. 根据权利要求7所述的文字辨识方法，其特征在于每一该小字元的分类步骤包括c2-l.找出该顶线与该上层线之间的一中心线，并计算该小字元的一中心参考点至该顶线、该上层线、该基线、该中心线的一第一距离、一第二距离、一第三距离、一第四距离及一第五距离；c2-2 .计算该小字元的一高度与一宽度的一比值；c2-3 .判断该比值是否大于一第一临界值；c2-4.若是，则判断该些印刷线的分类是否属于该第一状态或该第二状态； c2-4-l.若是，则计算该小字元的下缘与该顶线及该上层线的距离，并判断是否与该上层线的距离较近；c2-4-l-l.若是，则将该小字元归类为一第四分类； c2-4-1 -2.若否，则将该小字元归类为一第二分类； c2-4-2.若否，则将该小字元归类为一第八分类； c2-5.若否，则判断是否该第五距离小于一第二临界值,或者是该第五距离小于该第二距离及该第三距离；c2-5-l.若是，则判断是否该第三距离小于该第五距离及该第二距离；c2-5-l-l.若是，则将该小字元归类为一第六分类； c2-5-l-2.若否，则判断是否该第二距离小于该第五距离及该第三距离；c2-5-l-2-l.若是，则将该小字元归类为一第五分类； c2-5-l-2-2.若否，则将该小字元归类为一第七分类； c2-5-2.若否，则判断是否该中心参考点落在该中心线上；c2-5-2-l.若是，则计算该小字元的下缘与该上层线及该基线的距离，并判断是否与该上层线的距离较近；c2-5-2-l-l.若是，则将该小字元归类为该第五分类； c2-5-2-l-2.若否，则将该小字元归类为该第四分类；以及 c2-5-2-2.若否，则将该小字元归类为该第六分类。
9. 根据权利要求8所述的文字辨识方法，其特征在于该非小字元分类的步骤包括c3-l.若该些印刷线的分类属于该第一状态时,判断该第一字元的上缘是否位于该顶线的上方；c3-l-l.若是，则判断该第一字元的下缘是否位于该底线的上方； c3-l-l-l.若是，则将该第一字元归类为该第一分类； c3-l-l-2.若否，则将该第一字元归类为一第二分类；c3-l-2.若否，则判断该第一字元的下缘是否位于该底线的上方； c3-l-2-l.若是，则将该第一字元归类为该第三分类；以及 c3-l-2-2.若否，则将该第一字元归类为该第四分类。
10. 根据权利要求9所述的文字辨识方法，其特征在于该非小字元分类的步骤更包括c3-2.若该些印刷线的分类属于该第二状态时，判断该第一字元的上缘是否位于该顶线的上方；c3-2-l.若是，则将该第一字元归类为该第二分类；以及 c3-2-2.若否，则将该第一字元归类为该第四分类。
11. 根据权利要求IO所述的文字辨识方法，其特征在于该非小字元分类的步骤更包括c3-3.若该些印刷线的分类属于该第三状态或该第四状态时，则将该第一字元归类为该第八分类。
12. 根据权利要求11所述的文字辨识方法，其特征在于上述该些字元类别包括该第一分类占了该上层区、该中间区及该下层区；该第二分类占了该上层区及该中间区；该第三分类占了该下层区；该第四分类占了该中间区；该第五分类为该小字元，且位于该中心线附近；该第六分类占了该中心线与该上层线之间；该第七分类占了该中心线与该基线之间；以及该第八分类为剩余无法按m该些印刷线分类者。
13. 根据权利要求1所述的文字辨识方法，其特征在于该步骤d.包括 dl.计算各该些第一字元的一第一特征值；以及d2.针对各该些第一字元，将该第一特征值与该资料库中属于该字元类别的各该些第二字元的一第二特征值比较，找出特征值最相近的该第二字元做为该第一字元的辨识字元。
14. 根据权利要求13所述的文字辨识方法，其特征在于该步骤d2.更包括使用各该些第一字元对应的一预测模型，以辨识该第一字元。
全文摘要
一种文字辨识方法，此方法是在进行文字辨识前先针对所有要辨识的字元，按照其与印刷线之间的相对位置做分类，而在实际进行文字辨识时，仅取用文字资料库中对应其字元类别的字元来进行比对，因此可减少文字比对的范围及数目，而能够提高文字辨识的正确率及速度。
文档编号G06K9/20GK101311946SQ20071010730
公开日2008年11月26日申请日期2007年5月25日优先权日2007年5月25日
发明者范圣恩, 蔡文瀚申请人:仁宝电脑工业股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡文瀚;范圣恩
技术所有人：仁宝电脑工业股份有限公司
我是此专利的发明人

上一篇：计算机电源的制作方法
上一篇：具有硬件辅助的多处理器和多线程安全消息队列的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。