一种汉字图片的部件识别方法

文档序号：6381192阅读：275来源：国知局

专利名称：一种汉字图片的部件识别方法
技术领域：
本发明属于计算机虚拟现实技术领域，特别是汉字图片的骨架提取、笔段生成的图像处理领域以及基于语义知识的部件识别的模式识别领域。
背景技术：
作为表意文字的典型代表，中文书写和语音文字书写有较大的差别。象形文集结构研究表示，组成汉字的有着明确含义的各个部分被定义为部件，而汉字可以看成是由各个部件通过不同的组合方式组合而成。利用，像“桃”和“李”两个字，他们之中都有一个“木”的部件，实际上代表着有树的意思。因此，如何将一个汉字拆分成各个具有具体语义信息的部件的组合成为汉字学习中一个比较重要的部分。目前，汉字图片的识别大致可以分为两类，基于统计方法和基于结构方法两种。基于统计的方法倾向于利用图片的图像特征，如像素布局等，将汉字的识别转换成目标图片与标准库图片的相似度计算。而结构识别方法倾向于描述汉字的结构关系和汉字的笔画特征，如利用笔画间的夹角、相对位置关系来描述结构，最后通过总体结构的相似度计算完成识别。利用统计方法解决汉字识别问题，当前已经有了许多的研究工作。例如，k近邻分类器、k均值聚类、高斯分布、非线性形状模型以及上下文向量法。基于统计特征的方法是速度较快，且对噪声的抵抗能力较强，但对于像“王”和“玉”这样结构相近的两个字容易造成识别上的错误。而结构方法倾向于将汉字分解为各个部分，通过对拆分出的部分的分析，进而得到识别的结果。可以用来表征汉字结构的常用的特征有轮廓、笔画等。事实上，对于结构识别而言，其实质实际上就是一个笔画匹配的过程。结构方法的特点就是可以区分细小的差另IJ，从而识别出结构相似的不同汉字，但识别速度会有所限制。

发明内容
本发明的技术解决问题克服现有技术的不足，提供一种汉字图片的部件识别方法，能够有效的提闻识别率。本发明技术解决方案一种汉字图片的部件识别方法，实现步骤如下步骤(I)、汉字部件的笔画与结构关系描述对已经有的标准的汉字514个部件图片进行骨架提取处理，并检测特征点，这里描述的特征点为笔画的端点和笔画之间的交叉点，这样可以通过这些特征点之间的连线来检测初始笔段；从一个特征点通过骨架上的其他点找到另外一个特征点的路径，将这个路径记录称之为初始笔段，所述特征点定义为交叉点或者是端点；然后通过人为的交互将所述初始笔段进行合并，得到标记好的汉字部件的笔画；对得到的部件笔画进行Gabor特征的提取，描述汉字部件笔画的方向特征，将每一个笔画描述为一个4维向量和一个4*4协方差矩阵的高斯分布,完成笔画的统计建模；通过最大熵原理，邻居笔画的选取可以让近似结构关系，即将部件中一个笔画与其他所有笔画的结构关系近似为相对于自己邻居的结构关系，这里的结构关系可以用条件概率描述，即在某个笔画邻居被匹配后，该笔画匹配时需要采用条件概率计算，所述邻居笔画是指除了本身以外，汉字部件中其他笔画中对该笔画影响值最大的一个笔画，这个影响值通过两个协方差矩阵的差的模取对数描述；然后提取互为邻居的两个笔画局部特征，所述局部特征为两个互为邻居的笔画的中心相对位置、长度比例和角度差，将这些计算好的局部特征的信息进行存储，这里所做的部件笔画标注和特征提取可以用来帮助识别输入汉字中的部件；步骤(2)、部件候选笔画生成对输入的汉字图片进行图像细化和骨架提取之后，检测细化和骨架提取之后的图片中的端点和交叉点作为特征点，通过寻找特征点间通过骨架的连线来寻找初始笔段，检测出初始笔段后，针对待匹配的部件的某个笔画，概率组合这些初始笔段，形成可能匹配对应部件这个笔画的一组笔画，称之为候选笔画(由初始笔段针对待匹配部件的对应笔画组合而成)，之后便可以利用这些候选笔画去和目标部件的合并好的笔画进行匹配；步骤(3)、基于目标部件生成可能解重复的利用步骤2的方法，对步骤I中初始笔段合并为笔画做匹配，对于库中每一个部件，都得到一个可能的部件匹配的解，即针对各个部件生成可能解，这个匹配过程描述为一个矩阵，每一列表示目标部件中的各个笔画，某一列的每一行都存储着依据步骤(2)中方法得到的目标部件笔画的候选笔画，整个匹配过程就是寻找一个从第一列找到最后一列，每一列都找到一个可行节点的解中相似度最大的值，从而将得到输入汉字图片，对于库中所有部件生成的最可能匹配的结果；所述相似度描述为每一个笔画匹配时的由高斯函数计算出的概率值的累积。利用上述的方法，对于输入汉字的提取出的所有初始笔段，可以寻找到针对部件库中每一个部件的最可能的匹配解，为后续的步骤4的算法提供数据；步骤(4)、基于部件最优组合原理得到识别结果在得到步骤3生成的针对各个部件的可能解之后，利用最优选取的策略，将部件识别的问题转化为一个背包问题，即认为如果可以找到一组由步骤3中得到的各个部件的可能解，且互相之间没有在初始笔段的占用上存在冲突，且最大程度的占用了初始笔段，这样的一组部件解即为识别的最优解，输入汉字的初始笔段相当于是一个背包，背包的大小为检测出的初始笔段数目，而在步骤3中寻找部件匹配的可能的解时，标记该部件识别的可能解占用了哪些输入汉字的初始笔段，这样就可以完成整个识别的过程。进一步的，所述步骤(I)中对汉字部件的笔画与结构关系描述的具体内容如下步骤(Al)、将部件图片进行图像细化和骨架提取，检测特征点，如笔画之间的交叉点和笔画端点，通过寻找特征点之间的路径提取出初始笔段。通过适当的人为交互，合并一些初始笔段，形成比较标准的笔画。步骤(A2 )、对已经合并好的笔画，对其进行Gabor滤波，得到每个点4个方向(0°，45°，90° ,135° )的响应值，这样将每个笔画描述为一个具有4维向量和4*4协方差矩阵的高斯函数。随后利用最大熵的原理，计算每个笔画的邻居，这里的邻居定义为除了自身其他笔画对该笔画影响最大的笔画，影响值由两个协方差矩阵的差的模取对数描述，随后提取局部特征，将互为邻居的笔画的相对长度比例、中心相对位置等计算并存储。进一步的，所述步骤(2)部件候选笔画生成的步骤具体如下
步骤(BI)、将部件图片进行图像细化和骨架提取，检测特征点，如笔画之间的交叉点和笔画端点，通过寻找特征点之间的路径提取出初始笔段。步骤(B2)、对某个目标部件进行识别时，目的是要将对应的部件的各个笔画得到，进而需要寻找的就是针对部件的每一个笔画，都会自动生成一组可能的解，这些解有可能是初始笔段，也有可能是一些初始笔段的组合结果。所以定义组合规则为两个笔段首尾相连且方向差不超过15°，或者其中一个笔段足够短小，这样就可以将两个笔段合成作为可能的笔画匹配解加入到候选笔画队列中。进一步的，所述步骤(3)中基于目标部件生成可能解的步骤如下
步骤(Cl)、构建搜索图，这张图的描述如下，每一列表示待匹配的部件的各个标注好的笔画，而某一列中的每一行都表示着对于这个部件的笔画的由输入汉字的初始笔段生成的候选笔画，这样就将匹配问题转化成了一个图的搜索过程，目标变为要找一个每一列都找到一个点，从第一列找到最后一列的所有可行解中相似度最大的解。步骤(C2)、图的搜索过程规则如下第一，在匹配某一个笔画时，如果待匹配的候选笔画在对输入汉字的初始笔段占用上与前面已经选取的候选笔画相冲突，那么该候选笔画不能被选取。第二，在匹配某一个笔画时，如果作为这个笔画的邻居的笔画已经在前面的路径中被选取了，那么要采用条件概率计算，并引入之前存储的局部特征信息，计算这个待匹配的候选笔画和前面已经匹配的候选笔画的中心相对位置关系、笔画长度比例等。进一步的，所述步骤(4)中基于部件最优组合原理得到识别结果的步骤如下步骤(D1)、利用步骤(3)中得到的对于各个部件生成的可能解，寻找最优的组合作为输入汉字的部件识别结果。这里将问题描述为寻找一组最优的组合，使得组合中这些部件可能解在对输入汉字的初始笔段的占用上不冲突，且最大程度上的消耗掉输入汉字的初始笔段。定义这样的组合为输入汉字的最优的部件识别的结果。利用动态规划思想，将上述问题转化为一个背包问题，背包的容量为输入汉字的初始笔段数目，每一个可能的部件识别解都有一个标记数组来标记这个可能解对输入汉字的初始笔段的占用情况，这样相当于选取不冲突的几件物品放入背包中，使得背包尽可能的放满。本发明与现有技术相比的优点在于(I)本发明考虑到在输出汉字中识别部件是一个更趋向于局部识别的过程，加入条件概率的基础上，加入局部特征描述，例如互为邻居的两个笔画之间的中心相对位置、长度比例和角度差等，实验证明，本发明中局部特征的加入可以有效的提高识别率。(2)本发明通过最优组合的策略选择结果，是为了避免在识别过程中不同的部件阈值不好统一的问题，可以得到一个最优的部件识别结果，提高的识别的准确率。

图I为本发明的一种汉字图片的部件识别方法的整体过程示意图；图2为本发明的部件候选笔画生成的结果图；图3为本发明的基于部件最优组合原理得到识别结果的示意图；图4为本发明的部分汉字部件识别的结果图。
具体实施方式
下面结合附图与实例对本发明作进一步详细描述本发明实施过程包括四个主要步骤汉字部件的笔画与结构关系描述，部件候选笔画生成，基于目标部件生成可能解，基于部件最优组合原理得到识别结果。如图I所示，本发明具体实现如下步骤一汉字部件的笔画与结构关系描述利用统计结构建模方法，将部件和输入汉字都表示成一组笔画的集合。对于部件库中的部件，将由图像细化和笔画提取后得到的细碎笔段进行人为的符合语义的合并，这样做的目的一方面是为了符合汉字学笔画的规范要求，另一方面在后续的匹配过程中会大幅度的减少搜索次数，提高识别的效率。这里认为组成部件和汉字的笔画都服从一个4维的高斯分布，即X Ν( μ，Σ )。这个4维向量是由笔画上的每一个点的4维向量值加权得至IJ，本发明采用Gabor滤波检测每个点在4个方向上(0°，45° ,90°和135° )的响应值。在如此定义之后，可以看到对于一副输入的汉字图片S和一个待匹配的部件C，他们之间的相似度可以用公式(I)中表示的联合概率进行计算，这里A和Si分别代表部件中的笔画和输入汉字中的笔画。Pr (S = C)= Pr (S1 = T1, S2 = r2, . . . , sn = rn)(I)进而，公式(I)中的联合概率分布可以通过条件概率计算，如公式(2)所示
权利要求
1.一种汉字图片的部件识别方法，其特征在于该方法步骤如下步骤(I)、对汉字部件中的笔画和结构关系描述，标注构造统计结构模型所需要的信息；步骤(2)、根据步骤(I)的汉字部件的标注结果，对输入的汉字图片中检测出的笔段进行有选择性的概率合并，生成可能匹配部件中标注笔画的可能笔画，称为候选笔画生成；步骤(3)、根据步骤(2)中得到的可能匹配部件中标注好的笔画的候选笔画，寻找一组最优的候选笔画，基于目标部件生成可能的解；步骤(4)、根据步骤(3)中得到的针对各个目标部件的可能解，利用动态规划思想，寻找可能部件的最优组合结果，作为汉字部件识别的结果。
2.根据权利要求I所述一种汉字图片的部件识别方法，其特征在于所述步骤(I)中对汉字部件中的笔画和结构关系描述的具体内容如下步骤(Al)、对已经有的标准部件库中的514个汉字部件图片进行骨架提取处理，并检测特征点，所述特征点为笔画的端点和笔画之间的交叉点；通过这些特征点之间的连线得到初始笔段，从一个特征点通过骨架上的其他点找到另外一个特征点的路径，将这个路径记录称之为初始笔段；步骤(A2)、通过人为的交互将所述初始笔段进行合并，得到标记好的汉字部件的笔画；对得到的汉字部件笔画进行Gabor特征的提取，描述汉字部件笔画的方向特征，将每一个笔画描述为一个4维向量和一个4*4协方差矩阵的高斯分布，完成汉字部件笔画的统计建模；步骤(A3)、通过最大熵原理，利用近似结构关系进行邻居笔画的选取，近似结构关系即将汉字部件中一个笔画与其他所有笔画的结构关系近似为相对于自己邻居的结构关系，结构关系采用条件概率描述，即在某个笔画邻居被匹配后，该笔画匹配时需要采用条件概率计算，所述邻居笔画是指除了本身以外，汉字部件中其他笔画中对该笔画影响值最大的一个笔画，这个影响值通过两个协方差矩阵的差的模取对数描述；步骤(A4)、计算互为邻居的两个邻居笔画局部特征，局部特征包括中心相对位置、长度比例和角度差，将这些计算好的局部特征的信息进行存储，以用来帮助识别输入的汉字部件。
3.根据权利要求I所述一种汉字图片的部件识别方法，其特征在于所述步骤(2)部件候选笔画生成的步骤具体如下步骤(BI)、将输入汉字图片进行图像细化和骨架提取，检测特征点，如笔画之间的交叉点和笔画端点，通过寻找特征点之间的路径提取出初始笔段；步骤(B2)、对某个目标部件进行识别时，将对应的部件的各个笔画得到，要计算的就是针对部件的每一个笔画，都会生成一组可能的解，这些解有可能是初始笔段，也有可能是一些初始笔段的组合结果，定义组合规则为两个笔段首尾相连且方向差不超过15°，或者其中一个笔段足够短小，这样就将两个笔段合成作为可能的笔画匹配解加入到候选笔画队列中。
4.根据权利要求I所述一种汉字图片的部件识别方法，其特征在于所述步骤(3)中基于目标部件生成可能解的步骤如下步骤(Cl)、构建搜索图，这张图的描述如下，每一列表示待匹配的部件的各个标注好的笔画，而某一列中的每一行都表示着对于这个部件的笔画的由输入汉字的初始笔段生成的候选笔画，这样将匹配问题转化成了一个图的搜索过程，要找一个每一列都找到一个点，从第一列找到最后一列的所有可行解中相似度最大的解。
步骤(C2)、图的搜索过程规则如下第一，在匹配某一个笔画时，如果待匹配的候选笔画在对输入汉字的初始笔段占用上与前面已经选取的候选笔画相冲突，那么该候选笔画不能被选取；第二，在匹配某一个笔画时，如果作为这个笔画的邻居的笔画已经在前面的路径中被选取了，则要采用条件概率计算，并引入之前存储的局部特征信息，计算这个待匹配的候选笔画和前面已经匹配的候选笔画的中心相对位置关系、笔画长度比例，并和存储的局部特征信息相比较，描述局部特征的相似度。
5.根据权利要求I所述一种汉字图片的部件识别方法，其特征在于所述步骤(4)中基于部件最优组合原理得到识别结果的步骤如下步骤(D1)、利用步骤(3)中得到的对于各个汉字部件生成的可能解，寻找最优的组合作为输入汉字部件识别结果；这样将部件识别问题描述为寻找一组最优的组合，使得组合中这些部件可能解在对输入汉字的初始笔段的占用上不冲突，且最大程度上的消耗掉输入汉字的初始笔段；定义这样的组合为输入汉字的最优的部件识别的结果；利用动态规划思想，将上述问题转化为一个背包问题，背包的容量为输入汉字的初始笔段数目，每一个可能的部件识别解都有一个标记数组来标记这个可能解对输入汉字的初始笔段的占用情况，这样相当于选取不冲突的几件物品放入背包中，使得背包尽可能的放满。
全文摘要
一种汉字图片的部件识别方法，属于图像处理与模式识别的领域，首先对特定字体的汉字部件图片进行预处理，对其进行骨架提取之后，依据检测出的端点和交叉点形成初始的笔段，人为交互的将某些笔段合并；其次，对标记好的笔段进行统计建模，利用4维向量描述笔段方向信息；然后根据最大生成树原则构建笔段邻居关系，完成部件建模过程。对于输入汉字，首先，将其分解为各个笔段；随后，对照库中每个部件生成一组相似性最大的笔段集合；最后通过最优选取策略，即解决变种的背包问题得到最优解，得到输入汉字的部件识别结果。本发明引入局部特征，并采取最优组合策略，形成一套完整的针对汉字图片的部件识别方法，能够有效的提高识别率。
文档编号G06K9/62GK102968619SQ20121045493
公开日2013年3月13日申请日期2012年11月13日优先权日2012年11月13日
发明者梁晓辉, 于博文, 孙林嘉申请人:北京航空航天大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：梁晓辉;于博文;孙林嘉
技术所有人：北京航空航天大学
我是此专利的发明人

上一篇：在社交媒体网络上自动筛选有影响力用户的方法
上一篇：自适应区域光标的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。