一种基于部件识别的汉字部件分割与结构判定方法

文档序号：9274906阅读：522来源：国知局

一种基于部件识别的汉字部件分割与结构判定方法
【技术领域】
[0001] 本发明属于虚拟现实技术和计算机视觉领域，特别是汉字图像的部件识别的图像处理领域和部件分割和判定的模式识别领域。
【背景技术】
[0002] 汉字与语音文字相比在结构上有较大的差别。汉字作为象形文字，是由表征不同含义的各个部件通过不同的组合方式组合而成的。例如，"林"和"杉"两个字，都有一个部件"木"，实际中都代表着有树的意思。因此，如何将汉字拆分成具有具体语义信息的部件是学习汉语的重要组成部分。同时，正确的对汉字部件进行分割和结构判定也有助于推动汉字国际化，也有助于传播中华文化。
[0003] 目前，汉字图片的部件识别大致可分为基于统计的方法和基于结构的方法两种。基于统计方法是以同类模式具有相同属性为基础的识别方法，将汉字图像作为一个整体来处理，提取反映图像整体信息的特征向量，基于特征向量进行识别。当前常用的统计方法可分为距离法、判决函数法、贝叶斯判决法和模型法四类。基于统计的方法提取特征容易，并且能容忍噪声以及汉字的形变，具有较好的鲁棒性和抗干扰能力，但该方法区分形似字的能力较差，比如"千"和"干"这样的形似字就很容易造成识别上错误。基于结构方法将汉字图像理解为一个更小部分（称为基元）的组合体，基元的个数、类型及其相互关系形成汉字的结构，基于对汉字结构的表示进行识别。当前基于结构的识别方法首先需要对于汉字笔画的提取，对笔画的提取主要有自顶向下和自底向上两种策略。基于结构的识别方法能较好反应事物的结构特征，与基于统计的方法相比更能区分形似字，但是基于结构的方法不够鲁棒，容易受噪声影响，此外，从图像中稳定有效的提取结构基元非常困难。
[0004] 依据部件识别结果对汉字部件进行分割首先需要对部件的边缘和轮廓进行检测，依据已经得到的目标部件的骨架，完成边缘点与骨架对应。现有方法直接采用Canny算法进行边缘检测，得到结果包含很多由噪声或其他原因造成的假边缘，产生的图像边缘可能不闭合。依据汉字部件分割结果，两个部件之间相对位置关系为上下关系或左右关系等，可简单判定为上下结构或左右结构，但对于复杂的包围结构的关系，采用简单的包围盒方法并不能很好的对这些类汉字区分，无法直接判定部件的结构。

【发明内容】

[0005] 本发明要解决技术问题为：克服现有技术的不足，提供一种基于部件识别的汉字部件分割与结构判定方法，能够有效的对汉字的部件进行分割和结构判定。
[0006] 本发明解决上述技术问题所采用的技术方案是：一种基于部件识别的汉字部件分割与结构判定方法，实现步骤如下：
[0007] 步骤（1)、部件统计结构建模，描述汉字部件中的笔画和结构关系，生成匹配部件中标注笔画的候选笔画；
[0008] 步骤（2)、根据步骤（1)中得到的候选笔画，利用动态规划思想和最优组合策略生成部件的最优组合结果，作为汉字部件识别的结果；
[0009] 步骤（3)、根据步骤（2)中得到的汉字部件识别结果，基于轮廓与骨架对应关系，对汉字部件进行分割；
[0010] 步骤（4)、根据步骤（3)中得到的汉字部件分割结果，根据黄金格构型理论准确分析出部件的布局和汉字结构，对汉字进行结构判定。
[0011] 具体的步骤如下：
[0012] 步骤（1)、部件统计结构建模，生成候选笔画：对现存的标准汉字部件库中的687 个汉字部件图片进行提取骨架预处理，检测笔画的端点和笔画之间的交叉点作为特征点，通过特征点之间的连线得到初始笔段；通过交互操作合并得到的初始笔段，得到标记好的汉字部件的笔画；根据汉字部件笔画的方向特征，对汉字部件笔画进行Gabor特征提取，完成汉字部件笔画的统计建模；使用最大熵原理，通过利用近似结构关系对邻居笔画进行选取；识别某个目标部件时，首先得到对应部件的各个笔画，针对每一个笔画生成一组可能的解，这些解有可能是初始笔段，也可能是初始笔段的组合，定义初始笔段组合的规则为两个笔段首尾相连且方向差不超过15°，或者是其中一个笔段足够小，这样两个笔段组合成为可能的笔画匹配解加入到候选笔画队列中；
[0013] 步骤（2)、基于最优组合原理得到识别部件：构建搜索图，将汉字部件匹配问题转化为图的搜索过程，在图的搜索过程中，若带匹配候选笔画在对输入汉字的初始笔段占用上与前面已经候选的笔画冲突，则该笔段不能选取。对搜索图中，从第一列到最后一列搜索出的所有可行解，使用最优组合策略，寻找最优组合作为输入汉字部件的识别结果，通过将该问题描述为一个背包问题来解决；
[0014] 步骤（3)、基于轮廓与骨架对应关系，对汉字部件进行分割：对步骤（2)中得到的最优部件识别结果，使用Canny边缘检测算法得到部件的轮廓；直接得到的轮廓实际上并不存在前驱和后继边缘点的连接信息，故利用边缘跟踪算法寻找对应轮廓的轮廓点链状组织形式，得到的链状的目标轮廓信息存储后可以用于后续部件的分割；寻找轮廓点与骨架的对应关系，将对应于部件骨架的轮廓点提取出来并在断开的位置连接，形成部件分割的结果。
[0015] 步骤（4)、根据黄金格构型理论，对汉字结构进行判定：根据部件之间的相对位置关系，常见的汉字结构可以分为十三种，利用汉字构成的宫格原理，来描述汉字的结构特征，采用基于九宫格理论基础上改进的黄金格理论，对汉字结构进行分析；构建结构判定准贝1J，将结构判定规则转化为计算机上可行的算法，通过索引值法快速判定汉字部件间关系。
[0016] 进一步的，所述步骤（1)中部件统计结构建模，生成候选笔画的具体内容为：
[0017] 步骤（A1)、对标准部件库中的部件图片进行图像细化和骨架提取，检测笔画的端点和笔画之间的交叉点作为特征点，通过特征点之间的连线得到初始笔段；通过交互操作合并得到的初始笔段，形成比较标准的汉字部件的笔画；
[0018] 步骤（A2)、根据汉字部件笔画的方向特征，对汉字部件笔画进行Gabor特征提取，得到每个点在0、Jr/4、Jr/2、3JT/4的响应值，完成汉字部件笔画的统计建模；使用最大熵原理，通过利用近似结构关系对邻居笔画进行选取，近似结构关系是汉字部件中一个笔画与其他所有笔画的结构关系近似为相对于自己邻居的结构关系，通过条件概率描述结构关系；
[0019] 步骤（A3)、通过计算互为邻居的两个邻居笔画的局部特征来帮助识别输入的汉字部件，局部特征包括中心相对位置、角度差和长度比例等；
[0020] 步骤（A4)、识别某个目标部件时，首先得到对应部件的各个笔画，针对每一个笔画生成一组可能的解，这些解可能是初始笔段，也可能是初始笔段的组合结果，定义初始笔段组合的规则为两个笔段首尾相连且方向差不超过15°，或者是其中一个笔段足够小，这样两个笔段组合成为可能的笔画匹配解加入到候选笔画队列中。
[0021] 进一步的，所述步骤（2)中基于最优组合原理生成识别部件的步骤如下：
[0022] 步骤（B1)、构建搜索图，对该搜索图描述为：在该图中每列表示待匹配的部件的各个标注好的笔画，而每列中的每一行表示为对于这个部件的笔画由输入汉字的初始笔段所生成的候选笔画，这样匹配问题转化为图的搜索过程，要找一个每一列都找到一个点，从第一列找到最后一列的所有的可行解中求解相似度最大的解；
[0023] 步骤（B2)、在构造的搜索图中搜索过程规则如下：第一，匹配某一笔画时，若作为这个笔画的邻居的笔画已经被选取，则要通过条件概率计算，并考虑之前存储的局部特征信息，计算此待匹配的候选笔画和前面已经匹配的候选笔画的中心相对位置关系、笔画长度比例等，并与存储的局部特征信息比较来描述相似度；第二，匹配某一笔画时，若待匹配候选笔画在对输入汉字的初始笔段占用上与前面已经选取的候选笔画冲突，则该候选笔段不能被选取；
[0024] 步骤（B3)、对搜索图中得到的各个汉字部件所对应的所有的可能解，寻找最优组合作为输入汉字部件的识别结果；使用动态规划思想解决该问题

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：齐越;包永堂;于博文;胡山峰;沈方阳;丁志鹏;
技术所有人：北京航空航天大学;
我是此专利的发明人

上一篇：一种智能颜色电子识别器及其使用方法
上一篇：一种重型卡车夜间前方车辆检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。