光照输入手写印刷体汉字识别系统的制作方法

文档序号:6405482阅读:416来源:国知局
专利名称:光照输入手写印刷体汉字识别系统的制作方法
一.手写印刷体汉字识别,简单地说就是使计算机能认识较为规整的手写汉字。手写印刷体汉字识别在学科上属于模式识别和人工智能的范畴,是文字识别技术的难点和热点,它的研究也是智能计算机视觉的一个重要组成部分。
二.手写印刷体汉字识别一直是模式识别领域中的一个难题,虽然单体和多体印刷汉字已有识别系统出现,但手写汉字识别的研究还处于基础阶段,到目前为止尚没有一种全面成熟公认较佳的方法,也没有实用的系统问世。
国内外提出的识别手写汉字的主要方法有1.统计特征类方法Ⅰ)正交函数展开法K-L展开式法是一种利用Karhunen-loeve正交函数进行分类的方法,曾被东芝用于识别手写印刷汉字的实验。在识别印刷体时只需用三个正交轴就可吸收字形的微小变化,但是手写印刷体识别时需要十个以上的轴,他们实验的识别率是94.3%,但是所用的实验字数很少。这种方法计算量大,对变形较大的手写印刷体汉字较难适应。(K.Maeda,Y.Kurosawa,H.Asada,K.Sakai,andS.Watanabe.“HandprintedKanji recognitionbypatternmatchingmethod”inProc.6thInt.joint.Conf.PatternRecognitionOct.1982.PP789-792.)Ⅱ)笔划分布笔划分布是指对整个笔划未作抽取,而在两维平面内抽取局部笔划特征分布,或将局部笔划特征分布投影到一维直线上。所用特征有线条方向特征、笔划长度和笔划交叉数特征等。这类特征的抽取往往是不稳定的,因此识别率不容易提高。(T.Saito,H.Yamada,andK.Yamamoto,“AnanalysisofhandprintedChinesecharacters”J.IECE.Japan.Vol.J65-D.PP550-557,1982.)
Ⅲ)背景分析背景分析是指对0值或1值背景的结构、形状进行分析从而抽取出特征。这方面的代表是Oka的单元网格特征抽取法,它的基本思想是用单元来表示笔划及其方向,在0值背景上,笔划围成若干几何图形,这时将平面划成7×7的网格,每个网格有4×4个单元,每个单元代表它所处位置周围的形状、方向。这种方法作为预分类效果较好,但对于手写印刷体汉字是否适用,还有待进一步证实。(R.Oka,“用网格单元特征识别手写体汉字和日文字母”,《图象识别与自动化》,84.3.)2.结构特征类方法Ⅰ)抽取笔划法利用汉字是由笔划所构成的特点,清华大学计算机系最早提出按笔划顺序提取汉字笔划来识别汉字的思想,这种方法利用了一定的结构信息,在汉字在线识别中很有用处,但是对于手写印刷体汉字,由于汉字笔划本身很难准确无误地抽取出来,因此使用该法进行识别的结果不是很理想的。(张炘中、夏莹、孙承鉴,“用抽取笔划法识别限制手写汉字的探讨”,《计算机学报》,82.11.)Ⅱ)松弛匹配法松弛匹配法是目前已知的一种基于全局特征的匹配方法,它对1值背景作多角形近似,抽取出边界线段,将这些边界线段组成邻近线段表,然后用松弛匹配操作,完成边与边的匹配。这种方法利用弹性吸收汉字的变形,一个字只用一个样本。但是松弛匹配操作速度较慢,计算量大,而且样本是由平均值产生,因此匹配时仍是同笔划位置有关。松弛匹配虽然同结构匹配迈进了一大步,但是没有根本解决手写印刷体汉字的匹配问题。(山本,和彦,“用松弛匹配法识别手写体教育汉字”,《图象识别与自动化》.84.4)在85和86年,日本还提出了一些识别方法,如在电子通信学会论文杂志85年第4期上发表的“JIS第1水准手书汉字デ-タベ-スETL9とその解析”,在第9期上发表的“ストロ-ク生成规则
用ぃ
手书き汉字バタ-ンのストロ-ク抽出方式と实验的检讨”,在86年第2期上发表的“ストロ-クレ
基づく辞书の变形を用ぃ
手书き文字の变动吸收”,在第6期上发表的“手书き汉字の部分パタ-ン抽出の一手法”。上述方法都没有从根本上解决手写汉字的识别问题。
三.本发明根据手写印刷体汉字的结构特点,在粗分类时,用稳定的结构形状特征来进行分类,细分时,将汉字的局部模糊特性与整体结构的稳定性结合起来,充分利用汉字样本的知识作为启发信息,完成非精确的匹配,我们称这种识别方法为相似结构识别法。由此我们独立提出了光照输入手写印刷体汉字识别系统。
本发明的目的是构成一个手写汉字识别系统,将人已经写在纸上的汉字高速输入计算机,随着计算机技术的迅猛发展,社会的不断进步,信息处理量激增,考虑到我国汉字信息的原稿多用手写这一习惯,社会对高速自动输入汉字有强烈的需求,它在办公室自动化、排版印刷等方面大有用武之地,它的研究成功将彻底解决汉字信息处理系统手动输入速度低这个影响整个系统效率的“瓶颈”问题,促进国民经济的发展和社会生产力水平的提高。
四.

发明内容
该系统由扫描器和微型计算机组成,微机中装有具有上述特点的光照输入手写印刷体汉字识别卡,其识别系统示意图见

图1,用扫描器将人写在纸上的汉字图形转换成电流信号,模数转换后,其灰度值经二值化,平滑等预处理后,进行识别。其特点是采用四边框特征粗分类,和相关属性关系图启发式匹配。系统识别流程如图2所示。
下面按识别系统流程来说明本系统的内容。
1.粗分类特征的选择和提取为了对种类繁多的手写印刷体汉字进行识别,采用多级分类的策略是非常必要的。第一级的分类一般称为粗分类,粗分类的正确率直接影响以后各级分类的结果,因此,粗分类特征的选择和抽取在整个识别方案中占据了非常重要的地位。
通过对一千个汉字的分析研究,我们选择了九种形状作为基本特征元,如图3所示。在获得汉字图象的近似多角形之后,利用扫描线算法得到多角形向顶部的投影线,由此得到构成顶部形状的线段,对这些线段由左至右分析它们的性质,以及它与邻近线段所构成的几何形状,可以从中得到顶部形状的特征有序串,具体步骤如下1.将顶部线段从左至右排序。
2.取出一线段,判段它们的属性(横、竖、撇、捺等)。
3.根据属性,取出邻近边分析两端点与邻近边所构成的形状从而得到特征码。
4.若线段取完则结束,否则转2。
例如对于“的”字的顶部特征,抽取的特征码是33,见图4所示。
2.粗分类的实现在完成了粗分类的提取之后,为了获取粗分类的侯选集,必须建立粗分类的特征库以及在此基础上的搜索策略,这里对上、下、左、右等四种特征建立四个特征库,用搜索策略获取四个侯选集,然后通过进一步的集合操作获取粗分类的结果。
对于某一特定的汉字,由于书写者的习惯不同,因此顶部形状有时也是不同的,但是由于汉字本身固定的结构以及书写的限制条件,这种不同是很有限的,这就为我们建立该汉字的顶部特征样本码提供了依据,例如对“的”字来说,由于写法的不同,抽取到的顶部特征也有所不同,下面给出不同的“的”字的特征码示例写法特征码6\63\33\3\5…。
由于“的”字的顶部形状的变化是有限的,因此我们用下面的字符串来作为顶部特征码样本串36\05\36\05,其中由“\”号隔在中间的数字可以任选一个。符号“0”表示该项可以不选,因此字符串36\05\36\05就表示了下面的特征串33,36,63,66,353,356,653,656,335,365,635,665,3535,3565,6535,6565。
下面给出边框形状特征串示例。
顶top底bottom左left右right的36\05\36\058\5\08\58\58\5\3一1122了508\56\038\98\5是0268\54\138\5\012\34\7\2\8\5不104\27\32\3\0147\02我13\7\145\147\78\053\7\7\968\7\047\04我们将特征库按样本特征顺序存放,在得到一个汉字的四边形状特征串后,在特征库中进行搜索,可以获取四边框特征的四个侯选集,下面的例子是某次实验获得的“的”字四个侯选集的63Tt=盾反么的乡的855Tb=死哥艺句群唱翻副密老者答窗哪配呼看创请谢明的可司时奇着的85Tl=固嗯国吹晚碗暗园味回团目围图即既睛哎圆中自听唯哈红早眼因田啊喊略的时民呢叫明四吧口白日区响咱医唱困吸叶巨印巴瞧映喝的853Tr=帝常透迫香移多自烧白九危筑鬼党物功构帝向肉响约力助劲历的为当消咱拍其中Tt、Tl、Tr、Tb是根据顶部、左部、右部和底部的特征所查找到的集合,根据大量统计实验结果,我们引入一个集合操作,令T代表粗分类的最后侯选集,则T=(Tt∪Tb)∩(Tr∪Tl)多次实验的结果表明,粗分类的类平均大小为6左右,也就是说对一个汉字图象,粗分类后得到的侯选集中有6个侯选字,最大类的大小一般在30个字左右,粗分类正确率为95%。
3.细分特征抽取-笔划段快速合并法笔划段快速合并法利用汉字多角形的特点,对包围汉字图象的轮廓线进行合并处理,能够很快且较好地得到汉字笔划段的几何图形。
从获取的汉字近似多角形实验结果中,通过分析我们发现近似多角形有以下特点1.近似多角形包围汉字图象,在参数适当、平滑效果较好时,一个笔划段两边总是被两条边缘线段所包围。
2.包围该笔划段的两边缘线段之间的距离同笔划的点阵宽度接近,它总是小于某一特定的常数。
3.当我们给构成近似多角形的轮廓线规定一个方向后,(这里我们规定外轮廓线方向是顺时针方向,内轮廓线方向是逆时针方向),我们发现包围一个笔划段的方向从其法线方向看总是相反的。
由于近似多角形具有上述的特性,因此合并包围一笔划点阵的两边缘线段,有可能得到该笔划点阵的近似直线,下面我们给出合并算法,这个算法分为三大步骤,第一步扫描合并,第二步扫描删除,第三步交点合并,如图5所示。
在扫描合并时,先横向扫描,合并图5-2所示的边,然后再纵向扫描,合并图5-3所示的边,然后采用类似算法删除所有没有配对的边,这样就得到图5-4所示的结果。
横向扫描合并算法步骤如下1.对于多角形的每一边(x1,y1,x2,y2)判是否│x2-x1│>│y2-y1│,是则参加横向扫描,进入ORDERX队列。
2.给参加的扫描边按Y值由大到下排序。
3.对ORDERX中的每一条边i做以下工作3.1对其它未合并的有效边j,判断i,j可合并否,条件如下A.i,j这二个边缘线段在X方向有重叠。
B.i,j的距离小于某一常数。
C.i,j的方向相反。
D.i,j当中没有其它边。
3.2若满足上述所有条件,则取i,j中长边保留。
4.若ORDERX为空则结束,否则转2。
纵向合并扫描算法与上述算法类似,这里不再详述。在扫描删除时,仍是采用横向扫描,纵向扫描,进行删除。
得到图5-4的结果后,在近似多角形的交点,合并后的线段仍是断开的,在图5-4中线段L1、L2仍是断开的,这时分析断点性质,若L1、L2的端点P1、P2应合并,则它们满足下列条件A.L1,L2方向近似。
B.P1,P2距离下于某一特定常数。
C.P1到直线(P0,P4),P2到直线(P0,P4)的距离小于某一特定常数。
因此根据上述条件,我们可以进行顶点的合并,结果如图6所示。
4.相关属性关系图启发式匹配我们在手写印刷体汉字识别的研究中,对结构相似图形的知识描述与匹配识别进行了深入探讨,提出了用相关属性关系图形来描述结构,并在这种描述的引导下进行启发式匹配的一种新的匹配方法-相关属性关系图启发式匹配,有效地解决了关系结构图的匹配问题。
这里先介绍相关属性关系图启发式匹配的工作原理及数学描述,最后给出一个实例-手写印刷体汉字图匹配的实现。
4.1CARG的数学描述及启发式匹配算法为了解决一般ARG匹配方法的不足,针对这类属性模糊不定的关系结构图,我们用相关属性关系图来给出样本的描述,在匹配时并不直接求待识对象的ARG表示,而是在样本CARG的启发指导下,建立极大结点匹配图,然后根据结构相似的原则,找出最有可能匹配的结点,从而完成匹配过程,下面给出一些定义定义相关属性关系图CARG是图GG=(V,E,A,R,Fv,Fe);其中V={v│v是CARG中的结点},E={(v1,v2)│(v1,v2)表示从v1指向v2的有向边},A={a│a是V中结点的属性},R={r│r是E中有向边的值,即关系}Fv={fa(x)│对任一a∈A,有fa,对待识基元X,满足当X满足属性a的定义,则fa(x)=TRUE,否则fa(x)=FALSE},Fe={fr(x,y)│对任一r∈R,有fr,对待识基元x,y满足,当x,y关系满足r的定义,则fr(x,y)=TRUE,否则fr(x,y)=FALSE}。
CARG是一种带有启发信息的关系结构描述,它由节点集V,有向边集E,属性集A,关系集R,属性判断函数集Fv以及关系判断函数集Fe等六部分组成,其中V中的节点代表关系结构图中的基元,它的值是一种确定的属性,E是有向边的集合,节点的值定义了一种确定的结构关系,A是所有属性的集合,R是所有关系的集合,Fv是与A中属性对应的布尔函数的集合,Fe是与R中关系对应的布尔函数的集合,它们的判断对象是待识对象的基元,对于CARG中的每一种不同的属性和关系,都有一个函数与其对应,例如对于a∈A,有fa∈Fv,其它函数类似。
这种CARG表示同一般的ARG有以下的不同其一,是A中各属性可以是相关非独立的,因此在决定待识对象中基元的属性时,仅仅用Fv来判断还是不够的,必须考虑到关系结构的因素。其二,是G中的判断函数是面向待识对象的布尔函数,这样更有利于启发式匹配的实现,而一般ARG中只定义了V→A,E→R的映射。
对于待识对象,通过特征抽取得到一个基元集合V2,所谓匹配就是找出这个基元集合同样本之间的对应关系。在我们这里,由于属性的相关性,基元集合中某个基元可能有多个属性,因此,这个基元的可能匹配对象是CARG中的多个结点,下面我们构造极大结点匹配图来说明这种情况。
定义极大结点匹配图所谓极大结点匹配图是指G1=(V1,E1),V1={(J,j)│J∈V,j∈V2,且若J的属性是a,则fa(j)为真}。
E1={((I,i),(J,j))│对任(I,J)∈E,设值为r,对任i,j∈V2,有fr(i,j)为真}。
其中V1是样本CARG中结点集,V中结点J同待识对象基元集V2中基元j构成的两元组的集合,且j满足J的属性定义。E1是G1上有向边的集合,E1中结点(J,j)的度数越大,说明J,j匹配时,满足样本CARG结构关系越多。这里的度数是指入出度数之和。
在极大结点匹配图中,样本CARG的结点J可能与待识对象中多个基元匹配,而待识对象的基元j也可能同样本中多个结点匹配,如图7所示。匹配的目的是在待识字的图形上找出一个与CARG结构最相似的子图,根据结构相似的原则,E1中结点的度数越多,因此可以选择E1中度数最大的结点作为可能的匹配结果,从而得到下面的匹配算法1.构造极大结点匹配图G1。
1.1对每个J∈V1设它的属性为a,若对任一j∈V2,fa(j)为真,则(J,j)进入结点集V1,从而构造V1。
1.2对任(I,i),(J,j)∈V1,若(i,J)∈E,设其值为r,若fr(i,j)为真,则((I,i),(J,j))进入有向边集E1。
2.在极大结点匹配图G1中找出连通匹配子图。
2.1找出G1中度数最大的结点,进有序链S(顺序按从大到小)。
2.2若链S空则转2.3,否则在链中顺次取出一个结点(J,j)进入子图M,同时修改G1,删除所有点对(J,k)或(K,j),修改与此有关的度数,并将与(J,j)有关系的所有结点存入链S。
3.在记录下的若干子图M中找到结点最多的子图作为匹配结果。
由上述匹配算法可以看出这种匹配是一种非精确匹配,它求出的是待识对象与样本的最大结构相似度,因此它并不要求特征的完全正确抽取,只要抽取的特征保持关系结构的基本特点,能够与其它结构图区分开来就行了。
4.2手写印刷体汉字的图匹配的实现手写印刷体汉字的图匹配是相关属性关系图启发式匹配的一个很好的应用。我们首先以笔划段的中点位置和笔划角度给出笔划段的相关属性定义,然后,给出笔划段相对位置关系的定义,根据这些定义,对一个汉字可以建立对应的相关属性关系图。在识别卡中建立一个以相关属性关系图描述的汉字结构知识库。在识别时,当我们由粗分类获得待识字的若干侯选之后,取出侯选字的相关属性关系图与待识字的细分特征进行匹配。求得结构相似度,最后确定待识字的候选。
4.2.1汉字CARG的属性描述对于一个手写印刷体汉字,虽然不同的人,不同的时刻,书写的汉字图形的形状千变万化,但是对其中的某一笔划段来说,它的中点位置和角度的变化有一定的范围,根据这种范围的限制可以确定该笔划段的属性,下面先给出笔划段的定义。
定义笔划段是指构成汉字笔划的直线段,它有位置、角度、长度等特征,这里我们仅选笔划段的位置与角度来描述。
4.2.1.1.位置属性定义笔划段的位置所谓笔划段的位置是指笔划段的中点在该汉字中的相对位置,也就是在对汉字规格化后的位置,根据上面的定义,我们给出15种位置属性的描述,如图8所示,中点位置落在第N个阴影区的笔划段称其具有位置属性N。
记位置属性集为POS,则POS={1,2,3,4,5,6,7,8,9,A,B,C,D,E,F},从上面的位置属性描述可以看出,位置属性描述是由细到粗,以适应各种不同笔划在书写时的位置特性,属性D包含整个区域,这表明该笔划的位置不受任何限制,这使我们可以在建立CARG的描述时,对于位置属性不明显或位置变化较大的笔划段赋以属性D。对于位置在左上角的笔划,它可能是属性1,也可能是属性57、C、D等,这体现了位置属性的相关特性。
4.2.1.2角度属性定义笔划段的角度笔划段在如图9所示的座标系中,与X轴相交形成的正的夹角,范围在
之间。
根据上述定义,我们给出角度属性的描述如图10所示,当笔划段和角度在第N个阴影区时,我们称该笔划段具有角度属性N。
记角度属性集为ANG,则ANG={1,2,3,4,5,6,7,8,9},为了方便以后位置关系的定义,对每一种角度属性,我们定义了它的角度方向,如图7-4箭头所示,从上面的描述中我们发现,角度属性也是由细到粗,具有模糊特性,能适应汉字笔划的形变。
4.2.1.3汉字属性的定义和例子在定义了位置属性和角度属性之后,我们可以给出笔划段属性的定义。
定义汉字笔划段的属性是由该笔划段的角度属性和位置构成的二元组,设该笔划的角度属性是a,位置属性是b,则其属性是(a,b)。
我们可以看一个具体汉字的属性描述,如图11所示,对于边1来说,手写时它的中点位置一般总是落在左上角,它的角度一般总是在二、四象限,因此边1的属性是(5,1),而对于边10来说,它的中点位置一般在右下角,它的角度可以不定,因此我们用属性(9,4)来表示,对“的”字中的所有笔划都可以用这种属性描述出来,这种描述方式正体现了相关属性的模糊性原则。
4.2.2汉字笔划段之间的位置关系描述在给出了汉字笔划段的属性描述之后,通过分析汉字笔划段之间的相对位置关系,我们可以给出它们的关系描述,在详细叙述之前,先给出几个定义定义1左手规则左手手心向上伸直,四指指向笔划段的角度方向,这时大拇指指向的方向称为全上,其反方向称为全下。
定义2笔划段n1与笔划段n2有关系r,记为R(n1,n2)=r,是指笔划段n2在笔划段n1附近由r指出的区域中,由此定义可知,这里定义的位置关系是一种有向非对称关系,其r由图12定义。其中4、5两种关系定义如下右n2在n1右是指n2上至少有一点在n1上所有点的右侧。
下n2在n1下是指n2上至少有一点在n1上所有点的下方。
记关系属性集为REL,则REL={1,2,3,4,5,6,7,8,9,A,B}。
4.2.3汉字CARG的定义一个汉字的CARG定义为G=(V,A,E,R,Fv,Fe),其中V是汉字中笔划段的集合,V中每一笔划有且仅有A中的一个属性,E是笔划段关系的集合,若(v1,v2)∈E,当且仅当(v1,v2)具有R中定义的一种关系,A={(a,b)│a∈ANG,b∈POS},其中a为角度属性,b为位置属性,R=REL,Fv,Fe为根据属性定义产生的判断基元属性的布尔函数集。下面结出“的”字的CARG实例,见图13所示。
属性如下所示,其中n(a,p)表示编号为N的笔划段具有角度属性a,位置属性p。
1(51),2(27),3(83),4(2B)5(85),6(97),7(32),8(85)9(28),10(94),11(48)关系定义如下,其中(n1,n2,r)表示编号为n1的笔划段和编号为n2的笔划段有关系r。
(12A),(13A),(15B),(23A)(24B),(259),(346),(358)(368),(456),(468),(479)(56B),(576),(78B),(79A)(899),(810B),(811B)(9107),(9118),(11105)4.2.4匹配实例根据汉字CAHG的定义以及匹配算法,我们用一个实例来说明匹配的全过程,以样本“的”字的CARG与待识字“唱”的匹配为例,见图14所示。
A.先生成极大结点匹配图G中的结点集,这时利用判别函数Fv以及“的”字的结点属性得到V1={(1,3),(1,4),…,(10,14)}。(1,3)∈V1,表明“唱”字中笔划段3具有属性(5,1),满足中点位置在左上角,角度在二、四象限的条件。
B.生成极大结点匹配图中的有向边集,如图15所示。其中结点(3,7)有指向(4,4)的有向边表明在“的”字的CARG中,3,4有关系6,且在“唱”字中,笔划段7,4之间的关系也满足关系6定义的条件。
C.这时找出度数最大的结点(3,7)进入链,然后进行匹配算法的步骤D得到图16,图中的结点(6,7)已删,而结点(1,3),(2,3),(4,1),(4,4),(5,8),(6,3),(6,4),(6,8)等进链。
D.如此不断进行操作,最后得到图17,由图中可以看出,结点(2,3),(4,4),(5,8),(3,7)组成的是最大连通子图,样本中有7个结点没有匹配上,待识字中有10条边没匹配上,因此匹配的误差是17,它们匹配的结果如图18所示。
手写印刷体汉字识别的细分是识别的一个关键问题,本章利用CARG启发式匹配法为细分提供了一种新的解决方法,它不仅给出了手写印刷体汉字的一种崭新的抽象描述方式,而且从样本入手,在这种抽象描述的指导下,对待识字进行关系结构的相似匹配,这和人直观认字的过程相吻合。这种方法有以下特点1.因为手写汉字笔划的模糊性以及字形的多变,因此属性是相关的,关系也是知识性的。
2.由于属性的相关,造成待识字的属性和关系不是抽取的,而是靠字典知识的启发来确定的。
3.根据结构相似的原则产生极大结点匹配。
五.本发明与已有手写汉字识别系统相比,有以下特点1.本系统适应手写汉字位移变形,对于正常书写的汉字只要附加不丢失笔划和添加笔划,笔划写直等限制即可以识别,对文字大小,位置变化,笔划绝对位置,长短,方向,粗细等的变化有强抗干扰能力。
2.用四边框形状特征作为粗分类特征,取得了良好的分类效果,在此同时,对四个侯选集进行集合操作,确定最后侯选集,保证了粗分类的正确性和能力。
3.采用笔划段快速合并法获取汉字的笔划,由于只是在轮廓线的近似多角形上直接进行合并处理,没有通过细化这一步,因此,不仅避免了细化算法的不足,而且抽取速度比细化要快得多。
4.采用相关属性关系图来描述汉字,不仅给出了手写印刷体汉字的一种崭新的抽象描述方式,而且从样本入手,在这种抽象描述的指导下,对待识字进行关系结构的相似匹配,提高了细分的正确率。
识别系统技术指标为1.书写字的限制和要求(1)限制a.不丢失、不添加笔划。
b.笔划写直,字的四边框笔划要写清楚。
c.笔划成型,转折处尽量尖锐。
(2)要求用黑色墨水,优质钢笔,写在稿纸上。
2.识别字数2000常用汉字3.识别率90%4.识别速度1字/秒六.附图图1系统组成示意2系统流程3四边框形状特征码图4“的”字的顶部特征码示例图5合并算法示例图6交点合并结果图7极大结点匹配图示例图8笔划段位置属性描述图9定义笔划段角度属性的座标系图10笔划段角度属性描述图11汉字笔划段属性示例图12笔划段相对位置关系描述图13样本“的”字的笔划段名图14待识对象“唱”字的笔划段15“的”字样本与“唱”字匹配的极大结点匹配16已取出一个匹配结点的极大结点匹配17最后的极大结点匹配18“的”、“唱”匹配结果
权利要求
1.一种由扫描器、微机、显示器、打印机、磁盘组成的光照输入手写印刷体汉字识别系统,其特征在于该系统中采用光照输入手写印刷体汉字识别方法a.采用以抽取汉字四边形状特征进行集合操作的粗分类方法,该方法在获得汉字图象的近似多角形之后,利用扫描线算法得到多角形向顶部的投形线,由此得到构成顶部形状的线段,对这些线段从左至右分析它们的性质,以及它与邻近线段所构成的几何形状,从中得到顶部形状的特征序串。具体步骤是第一步将顶部线从左至右排序,第二步取出一段线段判断它们的属性是属横、竖、撇、捺,那么第三步根据属性,取出邻近边分析两端点与邻近所构成的形状之后取得特征码。第四步若线段取完则结束,否则转到第二步。b.采用细分特征抽取-笔划段快速合并方法,该方法利用汉字多角形的特点,对包围汉字图象的轮廓线进行合并处理,很快得到汉字笔划段的几何图形。c.采用了相关属性关系图启发式匹配方法的最后识别。相关属性关系图是一种带有启发信息的关系结构描述,它由节点集、属性集、关系集、属性判断函数集及关系判断函数集六部分组成,用非精确匹配法求出待识对象和样本的最大结构相似度,以最相似的字为识别结果。d.建立了用相关属性关系图描述的汉字结构知识库约2000字左右。
全文摘要
光照输入手写印刷体汉字识别系统属于模式识别和人工智能技术领域。该系统是将人已经写在纸上的汉字用自动识别方法高速输入到计算机。系统由扫描器和微型计算机组成,其特征在于微型计算机中装有采用汉字四边形状特征进行粗分类、用快速合并法抽取笔段、用相关属性关系图启发式匹配法进行细分的手写汉字识别卡。正确识别率可达90%。
文档编号G06K9/48GK1045885SQ8910146
公开日1990年10月3日 申请日期1989年3月23日 优先权日1989年3月23日
发明者夏莹, 吴智彪, 孙承鉴, 王世琴, 胡静芬 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1