文字辨识方法

文档序号:6609441阅读:277来源:国知局
专利名称:文字辨识方法
技术领域
本发明是有关于一种文字辨识方法,且特别是有关于一种利用印刷线将 文字分群辨识的方法。
背景技术
在资讯爆炸的时代, 一般人时常会需要阅读大量的书籍或报章杂志,若 看到值得保存的文章段落或是重点时,通常是采用影印或剪辑的方式存档 或是直接用笔标记。而对于文字工作者来说,在阅读完一篇文章后,若需
要使用里面的资料,就必需借由重新键入(Key-in)的方式输入到电脑中,才 能够对此资料进行编辑或存档的动作,不仅费力且耗时。
为了解决这个问题,目前有业者研发了光学辨识技术,使用者只需借 由一般的扫描器设备,将所欲保存的文件扫描成图档,再利用文字辨识的 软件,将此图档中的文字部份撷取出来,并转换成对应的数字字元,借以 提供使用者迅速取得文件的电子档,方便地编辑或处理文件。目前的光学 辨识技术所运用的领域十分广泛,举凡图书馆文献资料存档、企业内部文 件管理,甚至证照、票据的辨识,都可利用此光学辨识技术轻易达成,不 仅能精准地辨识资料,更能够省下大量资料比对与查核的人力与时间。
光学文字辨识通常简称为OCR (Optical Character Recognition),其主 要用途是针对既有的书面文件进行文字识别的动作。首先文件需先通过平 台型或掌上型扫描器,将^&夂辨识的文件先行扫描成图档。由于在扫描文件 时可能会因为文件本身不千净、字元模糊,或是扫描器解析度的问题,使 得输入的影像可能存在着一些杂讯,这些杂讯都会影响到后续文字辨识的准 确率。因此,光学文字辨识软件会先针对扫描的文件图档进行倾斜校正、杂 讯移除、影像边缘锐利化等处理。接着,光学文字辨识软件会对处理后的 图档进行图文分离的动作,将文件中所有的文字、图形和表格分离,并且 针对部份文字笔划不连接的情形,正确地切割或合并文字。然后,光学文
字辨识软件将进行文件辨识的动作,利用将文字图像拿来与文字资料库比 对,并同时通过中文校正的功能,进行词库、前后文相关字词的确认后,最 后输出精准的辨识结果。而辨识出来的文字可直接存成Word、 PDF、纯文 字等格式的档案,如此不但可减轻资料输入的负担,同时也可增加资料输 入的速度及正确性。
然而,在上述辨识文字的过程中,必须逐一将文件中的每个字元与文字资料库中的所有字元进行比对,此举将会耗费大量的运算资源,且增加文 字辨识的处理时间。此外,上述这种无差别式的比对方式,极有可能因为 杂讯的千扰而造成文字的误判,并无法针对各个文字之间或文字与印刷线 之间的相对位置,有效地改善文字的辨识率及辨识速度。

发明内容
本发明提供一种文字辨识方法,借由印刷文字与印刷线之间的相对位 置将印刷文字分类,而仅取文字资料库中对应字元类别的字元与此印刷文 字进行比对,因此能够提高文字辨识的正确率及速度。
本发明提出一种文字辨识方法,包括下列步骤:a.扫描一行印刷文字,其 中此行印刷文宇包括多个第一字元;b.利用这些第一字元,产生多条印刷 线;c.依据各个第一字元在这些印刷线中的一相对位置,判断各个第一字元 所属的字元类别;以及d.将各个第一字元与一资料库中属于此字元类别的 多个第二字元比对,找出各个第一字元所对应的第二字元,而辨识出第一 字元,其中此资料库包括记录多种字元类别及各种字元类别所属的第二字 元。
在本发明的一实施例中,上述的印刷线包括顶线(top line)、上层线 (upper line )、基线(base line )及底线(bottom line ),而顶线与上层线之间 为上层区(upper zone )、上层线与基线之间为中间区(central zone )、基线 及底线之间为下层区(downer zone )。
在本发明的一实施例中,上述的步骤c.包括cl.判断各个第一字元是 否属于小字元;c2.若属于小字元,则进行小字元分类;c3.若不属于小字元,则 进行非小字元分类。
在本发明的一实施例中,上述的步骤cl.包括cl-l.分别计算各个第一 字元的字元高度;cl-2.将各个第一字元的字元高度与一预设高度值比较,而 将字元高度小于此预设高度值的第一字元归类为小字元。
在本发明的一实施例中,其中在步骤cl-2.之后更包括cl-3.分别撷取 剩余的各个第一字元中心的中心参考点;cl-4.利用最小平方法,求取这些 中心参考点所趋近的一条中心线;cl-5.判断各个第一字元的下缘是否位于 此中心线的上方,而将下缘位于中心线的上方的第一字元归类为小字元;以 及cl-6.判断各个第一字元的上缘是否位于中心线的下方,而将上缘位于中 心线的下方的第一字元归类为小字元。
在本发明的一实施例中,上述的步骤c.更包括依据所产生的印刷线的 数目及种类,将这些印刷线归类为多个状态其中之一,而这些状态包括第 一状态、第二状态、第三状态及第四状态。其中,第一状态代表这些印刷 线包括上述的顶线、上层线、基线及底线。第二状态代表这些印刷线包括上述的基线、底线,以及由顶线与上层线合并的印刷线。第三状态代表这 些印刷线包括上述的顶线、上层线,以及由基线与底线合并的印刷线。而 第四状态则代表这些印刷线包括由顶线及上层线合并的印刷线,以及由基 线与底线合并的印刷线。
在本发明的一实施例中,上述的步骤d.包括dl.计算各个第一字元的 第一特征值;以及d2.针对各个第一字元,将其第一特征值与前述资料库中 属于其字元类别的各个第二字元的第二特征值比较,找出特征值最相近的 第二字元做为此第一字元的辨识字元。此外,更包括使用各个第一字元所 对应的预测模型,来辨识第一字元。
本发明因采用将印刷文字分群比对的结构,利用印刷文字位于印刷线 上的相对位置资讯,将印刷文字分类,同时也在进行文字辨识时,仅取文 字资料库中对应其字元类别的字元来进行比对,因此可减少文字比对的范 围及数目,而能够提高文字辨识的正确率及速度。
为让本发明的上述特征和优点能更明显易懂,下文特举较佳实施例,并 配合所附图式,作详细说明如下。


图1是依照本发明较佳实施例所绘示的印刷线示意图。 图2是依照本发明较佳实施例所绘示的文字辨识方法的流程图。 图3是依照本发明较佳实施例所绘示的字元分类图。 图4是依照本发明较佳实施例所绘示的特征值计算方法的流程图。 图5则是依照本发明较佳实施例所绘示的特征值计算方法的一范例。 图6是依照本发明较佳实施例所绘示的小字元判断方法流程图。 图7A及图7B是依照本发明较佳实施例所绘示的小字元分类方法的流 程图。
图8是依照本发明较佳实施例所绘示的非小字元分类方法的流程图。 S201 S204:本发明较佳实施例的文字辨识方法的各步骤 S401 S406:本发明较佳实施例的特征值计算方法的各步骤 S601 S607:本发明较佳实施例的小字元判断方法的各步骤 S701 S720:本发明较佳实施例的小字元分类方法的各步骤 S801 S811:本发明较佳实施例的非小字元分类方法的各步骤
具体实施例方式
通常在撰写英文语系的文字时,依照其字型的特性,都会依循着一定 的轨迹调整或排列书写文字的大小及位置,这些隐藏的"参考线"就类似 当初在学习书写这些文字时,写字本上所打印的四条直线,使用者只要依照这些直线书写文字,就能够写出整齐、清楚的文章。同样地,这些英文 语系的文字在打印时也会遵循着这些参考线,这些参考线也就是本文所谓 的印刷线。
图l是依照本发明较佳实施例所绘示的印刷线示意图。请参照图1,本
实施例是依照印刷文字"typeface analysis"中各个印刷字元的字型,定义出 四条印刷线,这些印刷线依其所在位置可区分为顶线(top line)、上层线 (upper line )、基线(base line )及底线(bottom line ),而这些印刷线之间的 区域则可分为上层区(upper zone )、中间区(central zone )及下层区(lower zone)。值得注意的是,图1中每个印刷字元都可视为是由多个互相连接的 区块(connect-component, CC )所构成,而这些连接在一起的区块则称为 CC群。
由上述可知,依照英文语系文字的特性,其印刷时的位置均会落在这 四条印刷线之间,且不同特性的字元(例如小写字母、大写字母、上标字 元、下标字元)也会占据这些印刷线之间的不同区域。本发明即利用此特 点,将文字资料库中的所有的字元分门别类,而在实际进行文字辨识时,先 找出所欲辨识文字的字元类别,再取文字资料库中对应的此字元类别的字 元来做比对,而能够得到较准确的比对结果。为了使本发明的内容更为明 了 ,以下特举实施例作为本发明确实能够据以实施的范例。
图2是依照本发明较佳实施例所绘示的文字辨识方法的流程图。请参 照图2,本实施例是用以辨识一行印刷文字,借由将此行印刷文字中的每个 印刷字元与资料库中某一字元类别的字元进行比对,而辨识出各个印刷字 元。
首先,扫描此行印刷文字,其中此行印刷文字中包括多个第一字元(步骤 S201 )。此处所指的印刷文字可以是自 一份文件中撷取的任何一行文字,本发 明并不限定其范围,以下仅就单一行印刷文字的辨识进行说明。
接着即可利用这些第一字元,产生多条印刷线(步骤S202),所产生的 印刷线的种类如图1所示,包括顶线、上层线、基线及底线,而这些印刷 线之间的区域则可分为上层区、中间区及下层区。然而,随着印刷字元种 类的不同,也有可能会产生二至四条不等的印刷线。
然后,依据各个第一字元在印刷线中的相对位置,判断各个第一字元所 属的字元类别(步骤S203 )。举例来说,图3是依照本发明较佳实施例所绘 示的字元分类图。请参照图3,本实施例是将资料库中的英文字元依其在印 刷线中所占的区域位置分为八类。其中,第一分类(FULL)占了上层区、中 间区及下层区。第二分类(HIGH)占了上层区及中间区。第三分类(DEEP) 占了下层区。第四分类(SHORT)占了中间区。第五分类(SUPER)为小 字元,且位于中心线附近。第六分类(SUBSCRIPT)占了中心线与上层线之间。第七分类(CENTER)占了中心线与基线之间。第八分类(UNKNOWN) 为剩余无法按照印刷线分类者。当然,在本发明的其它实施例中,也可以 将英文字元分类成其它不同种类,而不限制其范围。
在决定了各个第一字元的字元类别后,即可将这些第一字元分别与资 料库中字元类别相同的第二字元进行比对,找出各个第 一字元所对应的第 二字元,而辨识出这些第一字元(步骤S204)。举例来说,若欲辨识印刷字 元"N",则可将其归类为图3中的第二类。而实际在进行文字辨识时,也 是只取第二类所包含的字集,逐一与印刷字元"N"进行比对。据此,即可 大幅减少所需比对的字元数目,同时也因为在同一个字元类别中,每一个 字元在印刷线中的相对位置均相同或相似,因此也较不会有辨识错误的情 况发生,而能够提高辨识率。
值得一提的是,上述辨识第一字元的方式例如是先计算第一字元的第 一特征值,再将此第一特征值与资料库中同一个字元类别中的第二字元的 第二特征值比较,而找出特征值最相近的第二字元做为第一字元的辨识字 元。
举例来说,图4是依照本发明较佳实施例所绘示的特征值计算方法的 流程图,图5则是依照本发明较佳实施例所绘示的特征值计算方法的一范 例。请参照图4,本实施例是将一个字元(或者说是一个CC群)分成数个 等份,并计算各个部份所涵括的区块(CC)个数,而求得一个能够代表此 字元的特征值矩阵。
首先,找出一条通过此字元中心参考点的中央垂直线,并计算位于此 中央垂直线上1/3及2/3位置的参考点(如图5所示的A点及B点)的座 标(步骤S401 )。接着则取一个参考半径(步骤S402 ),此参考半径R例如
是此字元对角线长度的一半,即^ =在2+『2/2,其中L為字元長度、『 為字元寬度。
此时若以A点为圆心,R为半径画圆,并将360度划分为18个方向, 则这18个方向及此圓的圓周将会把字元切分为36个区域。因此,下一步 则是分别计算这36个区域所包括的区块(CC)个数,并记录于A矩阵中 (步骤S403 )。同理,若以B点为圆心,R为半径画圓,也会把字元切分为36 个区域。因此,可再分别计算此36个区域中所包括的区块(CC)个数,并记 录于B矩阵中(步骤S404)。
然后再将这两个矩阵分别予以正规化(步骤S405 ),此即分别将这两个 矩阵中各个元素除以该矩阵中所有元素的和,借此消除因字元的字型大小
不同所可能造成的影响。最后则将这两个矩阵合并为一个一维矩阵,而做 为此字元的特征值矩阵(步骤S406)。
以图5所绘示的字元"N"为例,其A点及B点的座标分别是(5,4)及(5,8),而其参考半径11=7.5。因此,若以(5,4)为圆心,7.5为半径画圆,并以l8 个方向切分区域以计算区块数目,则可获得矩阵A:
A[2] [ 18]=436432732541000132 000404000000000000
其中,矩阵A的第一列为圆内18个区域的区块数目;而第二列则为圓 外18个区域的区块数目。同理,若以(5,8)为圓心,7.5为半径画圆,并以 18个方向切分区域以计算区块数目,则可获得矩阵B:
B[2][18]=436100332436511362 000000000000202000
其中,矩阵B的第一列为圓内18个区域的区块数目;而第二列则为圆 外18个区域的区块数目。最后则可将这两个阵列进行正规化后,再合并为 一个一维矩阵,而获得所需的特征值矩阵。
除了上述特征值比对的方法外,本发明亦包括使用各个第一字元所对 应的预测模型,来辨识第一字元。然而,上述这些字元比对的方式仅为举 例说明,熟知本领域技术者当可视实际需要,采用其它种类的字元比对方 式。
由上述的内容可知,本发明的重点在于依据一个字元在印刷线中的相 对位置,来判断该字元所属的字元类别。其中,本发明是将资料库中的所 有字元分成小字元及非小字元两部份,而针对这两个种类的字元则个别制 定一套字元类别的判断方法,兹分述如下
首先必需判定一个字元是否属于小字元,请参照图6,本实施例是在扫 描完一行印刷文字后,会找出其中较小或位置较偏的印刷字元,而将其归 类为小字元。
首先,扫描影像中的每个印刷字元会先被标记一个外框,此外框包括 印刷字元的上、下、左、右等四个边缘,此时就可根据这些标记的外框,计 算出每个印刷字元的字元高度(步骤S601)。
这些印刷字元的字元高度则接着拿来和一个预设高度值比较,而判断 出各个印刷字元的字元高度是否小于此预设高度值(步骤S602 )。此预设高 度值例如是所有印刷字元的字元高度平均值的 一半,在此不限定其范围。
其中,若印刷字元的字元高度小于预设高度值,则可将此印刷字元归类 为小字元(步骤S607)。在剔除字元高度较小的印刷字元后,下一步则分别 撷取剩余的各个印刷字元的一个中心参考点(步骤S603 ),并利用最小平方 法(least square),求取这些中心参考点所趋近的一条中心线(步骤S604),而 使各个印刷字元的中心参考点距离此中心线的总和为最小。
在中心线定义出来后,即可用来判断剩余的印刷字元中是否还存在着 小字元。其中例如先判断印刷字元的下缘是否位于中心线的上方(步骤S605 ),若为真则将此印刷字元归类为小字元(步骤S607);否则就继续判 断印刷字元的上缘是否位于中心线的下方(步骤S606),若为真则将此印刷 字元归类为小字元(步骤S607)。简单来说,本实施例的目的就是要找出不 会通过中心线的印刷字元,这些印刷字元可能是杂讯或是标点符号,其外 型往往比实际的字母小,也通常不会印在中心线上。
借由上述方法即可判定出印刷文字中的小字元,接着就可进行小字元 的分类步骤。图7A及图7B是依照本发明较佳实施例所绘示的小字元分类 方法的流程图。请先参照图7A,本实施例是根据上述产生的印刷线的数目 及种类,归类出印刷线的状态(步骤S701),并依照此印刷线的状态,针对一 个小字元进行分类。其中,上述这些状态例如包括第一状态、第二状态、第 三状态及第四状态。其中,第一状态代表这些印刷线包括上述的顶线、上 层线、基线及底线。第二状态代表这些印刷线包括上述的基线、底线,以 及由顶线与上层线合并的印刷线。第三状态代表这些印刷线包括上述的顶 线、上层线,以及由基线与底'线合并的印刷线。而第四状态则代表这些印 刷线包括由顶线及上层线合并的印刷线,以及由基线与底线合并的印刷线。
首先,找出顶线与上层线之间的一条中心线,并分别计算小字元的中 心参考点至顶线、上层线、基线、中心线的第一距离、第二距离、第三距 离、第四距离及第五距离(步骤S702)。在一实施例中,上述中心线的y 截距例如是顶线与上层线的y截距的平均,而其斜率则等于上层线的斜率,然 而本发明并不限制其范围,使用者可依其需要,取用顶线与上层线之间的 任一条直线做为中心线。
接着,则可计算此小字元的高度与宽度的比值(步骤S703 ),此比值则 接着被拿来和一个第一临界值做比较,以判断其是否大于此第一临界值(步 骤S704)。其中此第一临界值例如为整数4,而不限制其范围。
在步骤S704中,若此小字元的比值大于第一临界值,则可继续判断印 刷线的分类是否属于第一状态或第二状态(步骤S705 )。若否,则可将小字 元归类为第八分类(步骤S706);若是,则可计算此小字元的下缘与顶线及 上层线的距离,而判断出其下缘是否与上层线的距离较近(步骤S707)。若 是,则将小字元归类为第四分类(步骤S708);反之则将其归类为第二分类 (步骤S709 )。
另一方面,请继续参照图7B,在步骤S704中,若小字元的比值不大 于第 一 临界值,则会继续判断是否第五距离小于第二临界值,或者是第五距 离小于第二距离及第三距离(步骤S710)。若符合上述条件其中之一者,则 继续判断是否第三距离小于第五距离及第二距离(步骤S711)。若是,则将 小字元归类为第六分类(步骤S712);反之则继续判断是否第二距离小于第 五距离及第三距离(步骤S713)。若是,则将小字元归类为第五分类(步骤S714);否则就归类为第七分类(步骤S715)。
再者,若在步骤S710中没有任何一个条件相符,则会判断是否小字元 的中心参考点落在中心线上(步骤S716)。若否,则将小字元归类为第六分 类(步骤S717);若是,则分别计算小字元的下缘与上层线及基线的距离,并 判断其下缘是否与上层线的距离较近(步骤S718)。若是,则将小字元归类 为第五分类(步骤S719);否则归类为第四分类(步骤S720)。
在以上小字元的分类方法中,所分类而得的第一至第八分类例如是图3 所列示的分类,然不限定其范围。而图3的分类亦延用至非小字元的分类 方法中,以下即介绍非小字元的分类方法的详细步骤
图8是依照本发明较佳实施例所绘示的非小字元分类方法的流程图。请 参照图8,如同前个实施例的做法,本实施例一开始亦根据印刷线的数目及 种类,判断印刷线的状态(步骤S801),并依照此印刷线的状态,针对一个 非属于小字元的字元进行分类。其中,这些状态例如包括第一状态、第二 状态、第三状态及第四状态,而其定义均与前个实施例相同,故在此不再 赘述。
若印刷线的分类属于第一状态时,则会判断字元的上缘是否位于顶线 的上方(步骤S802)。若是,则继续判断此字元的下缘是否位于底线的上方 (步骤S803 )。若是,则可将此字元归类为第一分类(步骤S804);反之则 将此字元归类为第二分类(步骤S805 )。
其中,在步骤S802中,若判断字元的上缘不是位于顶线的上方时,则 会继续判断此字元的下缘是否位于底线的上方(步骤S806)。若是,则将此 字元归类为第三分类(步骤S807);反之则将此字元归类为第四分类(步骤 S808 )。
另一方面,若印刷线的分类属于第二状态时,则会判断此字元的上缘 是否位于顶线的上方(步骤S809),若是,则将此字元归类为第二分类(步 骤S810);反之则将其归类为第四分类(步骤S811)。
最后,若印刷线的分类属于第三状态或第四状态时,则是将第一字元 归类为第八分类(步骤S812),意即归类为无法按照印刷线分类的类别。
在以上非小字元的分类方法中,判断所得的第一至第八分类同样是采 用如图3所列示的分类,然不限定其范围。而结合上述小字元及非小字元 的分类方法即能够针对所有类型的字元,筛选合适的光学文字辨识(Optical Character Recognition, OCR)资料来做辨识,而能够有效提高辨识率。
综上所述,本发明的文字辨识方法至少具有下列优点
1. 在进行文字辨识前先针对所有要辨识的文字,按照可能在印刷线的位 置做分类,个别产生特征值等光学文字辨识资料。
2. 使用已知字元与印刷线之间的相对位置资讯来评估字元属于哪一个分类,并用此分类对应的OCR资料来进行辨识,因此能够提高辨识速度。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明,任 何所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当 可作些许的更动与润饰,因此本发明的保护范围当视所附的权利要求所界 定者为准。
权利要求
1. 一种文字辨识方法,其特征在于其包括下列步骤a. 扫描一行印刷文字,其中该行印刷文字包括多个第一字元;b. 利用该些第一字元,产生多条印刷线;c. 依据各该些第一字元在该些印刷线中的一相对位置,判断各该些第一 字元所属的一字元类别;以及d. 将各该些第一字元与一资料库中属于该字元类别的多个第二字元比 对,找出各该些第一字元所对应的该第二字元,而辨识出该些第一字元,其 中该资料库包括记录多种字元类别及各该些字元类别所属的该些第二字 元。
2. 根据权利要求1所述的文字辨识方法,其特征在于该些印刷线包括一 顶线、 一上层线、 一基线及一底线,而该顶线与该上层线之间为一上层 区、该上层线与该基线之间为一中间区、该基线及该底线之间为一下层区。
3. 根据权利要求2所述的文字辨识方法,其特征在于该步骤c.包括 cl.判断各该些第一字元是否属于一小字元; c2.若属于该小字元,则进行一小字元分类;以及 c3.若不属于该小字元,则进行一非小字元分类。
4. 根据权利要求3所述的文字辨识方法,其特征在于该步骤cl,包括 cl-l.分别计算各该些第一字元的一字元高度;以及 cl-2.将各该些第一字元的该字元高度与一预设高度值比较,而将该字元高度小于该预设高度值的该些第一字元归类为该些小字元。
5. 根据权利要求4所述的印刷线生成方法,其特征在于在步骤cl-2. 之后更包括c 1 -3 .分别撷取剩余的各该些第 一 字元中心的 一 中心参考点; cl-4.利用一最小平方法,求取该些中心参考点所趋近的一中心线; cl-5.判断各该些第一字元的一下缘是否位于该中心线的上方,而将该下缘位于该中心线的上方的该些第一字元归类为该些小字元;以及cl-6.判断各该些第一字元的一上缘是否位于该中心线的下方,而将该上缘位于该中心线的下方的该些第一字元归类为该些小字元。
6. 根据权利要求3所述的文字辨识方法,其特征在于该步骤c.更包括 依据所产生的该些印刷线的数目及种类,将该些印刷线归类为多个状态其中之一。
7. 根据权利要求6所述的文字辨识方法,其特征在于该些状态包括 一第一状态,该第一状态代表该些印刷线包括上述的该顶线、该上层线、该基线及该底线;一第二状态,该第二状态代表该些印刷线包括上述的该基线、该底线,以及由该顶线与该上层线合并的该印刷线;一第三状态,该第三状态代表该些印刷线包括上述的该顶线、该上层 线,以及由该基线与该底线合并的该印刷线;以及一第四状态,该第四状态代表该些印刷线包括由该顶线及该上层线合 并的该印刷线,以及由该基线与该底线合并的该印刷线。
8. 根据权利要求7所述的文字辨识方法,其特征在于每一该小字元的分 类步骤包括c2-l.找出该顶线与该上层线之间的一中心线,并计算该小字元的一中 心参考点至该顶线、该上层线、该基线、该中心线的一第一距离、 一第二 距离、 一第三距离、 一第四距离及一第五距离;c2-2 .计算该小字元的 一 高度与 一 宽度的 一 比值;c2-3 .判断该比值是否大于 一 第 一 临界值;c2-4.若是,则判断该些印刷线的分类是否属于该第一状态或该第二状态; c2-4-l.若是,则计算该小字元的下缘与该顶线及该上层线的距离,并 判断是否与该上层线的距离较近;c2-4-l-l.若是,则将该小字元归类为一第四分类; c2-4-1 -2.若否,则将该小字元归类为 一第二分类; c2-4-2.若否,则将该小字元归类为一第八分类; c2-5.若否,则判断是否该第五距离小于一第二临界值,或者是该第五距 离小于该第二距离及该第三距离;c2-5-l.若是,则判断是否该第三距离小于该第五距离及该第二距离;c2-5-l-l.若是,则将该小字元归类为一第六分类; c2-5-l-2.若否,则判断是否该第二距离小于该第五距离及该第三距离;c2-5-l-2-l.若是,则将该小字元归类为一第五分类; c2-5-l-2-2.若否,则将该小字元归类为一第七分类; c2-5-2.若否,则判断是否该中心参考点落在该中心线上;c2-5-2-l.若是,则计算该小字元的下缘与该上层线及该基线的 距离,并判断是否与该上层线的距离较近;c2-5-2-l-l.若是,则将该小字元归类为该第五分类; c2-5-2-l-2.若否,则将该小字元归类为该第四分类;以及 c2-5-2-2.若否,则将该小字元归类为该第六分类。
9. 根据权利要求8所述的文字辨识方法,其特征在于该非小字元分类的 步骤包括c3-l.若该些印刷线的分类属于该第一状态时,判断该第一字元的上缘是 否位于该顶线的上方;c3-l-l.若是,则判断该第一字元的下缘是否位于该底线的上方; c3-l-l-l.若是,则将该第一字元归类为该第一分类; c3-l-l-2.若否,则将该第一字元归类为一第二分类;c3-l-2.若否,则判断该第一字元的下缘是否位于该底线的上方; c3-l-2-l.若是,则将该第一字元归类为该第三分类;以及 c3-l-2-2.若否,则将该第一字元归类为该第四分类。
10. 根据权利要求9所述的文字辨识方法,其特征在于该非小字元分类 的步骤更包括c3-2.若该些印刷线的分类属于该第二状态时,判断该第一字元的上缘是 否位于该顶线的上方;c3-2-l.若是,则将该第一字元归类为该第二分类;以及 c3-2-2.若否,则将该第一字元归类为该第四分类。
11. 根据权利要求IO所述的文字辨识方法,其特征在于该非小字元分类 的步骤更包括c3-3.若该些印刷线的分类属于该第三状态或该第四状态时,则将该第一 字元归类为该第八分类。
12. 根据权利要求11所述的文字辨识方法,其特征在于上述该些字元类 别包括该第一分类占了该上层区、该中间区及该下层区; 该第二分类占了该上层区及该中间区; 该第三分类占了该下层区; 该第四分类占了该中间区; 该第五分类为该小字元,且位于该中心线附近; 该第六分类占了该中心线与该上层线之间; 该第七分类占了该中心线与该基线之间;以及 该第八分类为剩余无法按m该些印刷线分类者。
13. 根据权利要求1所述的文字辨识方法,其特征在于该步骤d.包括 dl.计算各该些第一字元的一第一特征值;以及d2.针对各该些第一字元,将该第一特征值与该资料库中属于该字元类 别的各该些第二字元的一第二特征值比较,找出特征值最相近的该第二字 元做为该第一字元的辨识字元。
14. 根据权利要求13所述的文字辨识方法,其特征在于该步骤d2.更包括使用各该些第一字元对应的一预测模型,以辨识该第一字元。
全文摘要
一种文字辨识方法,此方法是在进行文字辨识前先针对所有要辨识的字元,按照其与印刷线之间的相对位置做分类,而在实际进行文字辨识时,仅取用文字资料库中对应其字元类别的字元来进行比对,因此可减少文字比对的范围及数目,而能够提高文字辨识的正确率及速度。
文档编号G06K9/20GK101311946SQ20071010730
公开日2008年11月26日 申请日期2007年5月25日 优先权日2007年5月25日
发明者范圣恩, 蔡文瀚 申请人:仁宝电脑工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1