一种手写汉字规范性评价方法及系统的制作方法_2

文档序号:9911713阅读:来源:国知局
这种策略能使粒子更快的找到最优位置,并 且提升粒子跳出局部最优解的能力。
[0054] 其中经典粒子群算法是指采用d维空间的一个点表示问题的筛选解,粒子具有位 置和速度两个特征,粒子位置&和速度W可以表示成:
[0055] Xi= {xii,xi2, . . . ,Χ?}
[0056] Vi= {vii,Vi2, . . . ,vn}
[0057] 粒子在运动过程中不断追逐个体最优值pbest和全局最优值gbest,实现自身位置 的不断更新,粒子i的位置 Xl和速度Vl更新公式表示如下:
[0058] Vij(t+1) =w*Vij(t)+ci*ri(pbestxij(t) )+C2*r2(gbestxij(t))
[0059] Xij(t+1) =Xij(t)+Vij(t+l)
[0060] 其中,ci和C2为学习因子,通常取值为2,w为惯性权重,ri和r2为(0,1)之间的随机 数,下标"i"为第i个微粒,下标"j"为微粒i的第j维分量。
[0061 ]在一个实施例中,多种群并行优化算法中相关参数设置如表1所示。
[0062] 表1:
[0063]
[0064] 这里提到的Hausdorff跑离的计算万法如卜:
[0065] 设A为汉字特征模板中相应汉字笔画的坐标集合,B为用户手写笔画的坐标集合,t = (k,a,b)为伸缩,平移参数,则基于Hausdorff距离的曲线匹配可以表示如下:
[0066] min H(t(B),A)
[0067] 其中t(B)为B经过t变换后与集合A之间的Hausdorff距离,即:
[0068]
[0069] 在判断每一笔手写汉字笔画依次与模板汉字笔画是否匹配时,将Η与预设阈值ε进 行比较,比如所述预设阈值ε = 30,若Η〈30,则认定此笔画笔形及笔势正确,否则,认定此笔 画不规范。
[0070] 可选的,所述笔画规范性包括笔画间关系评价,所述笔画间关系评价的步骤包括:
[0071] S421、判断预评价汉字的笔画数是否小于等于1,若是,则退出笔画间关系评价;否 贝1J,执行步骤S422;
[0072] S422、提取汉字特征模板中相应汉字笔画间的关系特征并进行编码;
[0073] S423、提取手写汉字笔画间的关系特征并进行编码;
[0074] S424、将步骤S423中的编码和步骤S422中的编码进行比较,得到笔画间关系评价 的结论。
[0075] 在进行笔画规范性评价时还可以包括笔画间关系评价,首先判断笔画数是否小于 等于1,若是,则不需要进行笔画规范性评价;否则,提取出笔画间的关系特征。在一个实施 例中,一个汉字的笔画间的关系特征包括:
[0076] 特征1:笔画与先前紧跟着的笔画的关系;
[0077] 特征2:笔画起点与先前紧跟着的笔画起点的关系;
[0078] 特征3:笔画终点与先前紧跟着的笔画终点的关系;
[0079] 特征4:笔画起点与先前紧跟着的第二笔画的起点的关系;
[0080] 特征5:笔画终点与先前紧跟着的第二笔画终点的关系。
[0081] 其中,特征1主要用于反映笔画间的相对位置关系。在一个实施例中将笔画间相对 位置的关系分为相离关系,相接关系和相交关系,并对这三种关系分别进行编码。比如取得 手写汉字第二笔画上的所有点到第一笔画的最小距离(F^Fs,...,F n),这里的距离用欧式 距离来计算,将其中最小值Fmin作为两者的最小距离。若Fmin>0,说明两者为相离关系,设此 特征值为1;若F min = 0,计算其中一笔的起点和终点到另一笔画的距离,取其中的最小距离, 若此距离为0,说明两者为相接关系,将此特征值设为0;若此距离大于0,说明两者为相交关 系,故此特征值为2。另外,对于一个汉字来说,通常第一笔是不设特征值。通过这样的方法, 得到一个反映汉字笔画间的相对位置关系的特征向量,将其与汉字特征模板中相应汉字的 特征向量进行比较,若第i个特征值不同,则判断出第i笔和第i+ι笔笔画间相对位置不规 范。如图2-a所示,"土"字的第二笔起点终点与第一笔距离大于0,因此为相交关系,故第二 笔特征值为2。第三笔与第二笔相接,故第三笔特征值为0。
[0082]特征2~5主要用于反映笔画间的相对长度关系,而笔画间相对长度关系主要是为 了区分一些相似汉字,例如"未"和"末","土"和"士"等。在为特征2~3的相应特征赋值时, 通常第一笔是不设特征值的,然后对每种特征的所有情况进行编码,比如特征2,设笔画起 点坐标( Xl,yi),先前紧跟着的笔画起点的坐标为则根据坐标得到的所有可能位 置关系进行赋值,分别得到反映汉字笔画间的相对长度关系的手写汉字的特征向量和汉字 特征模板中相应汉字的特征向量。然后,将两个特征向量进行比较,若所有的特征值均相 同,则判断出笔画间相对长度规范,若第i个特征值不同,若i为奇数,则判断出第i笔和第i+ 1笔笔画间相对长度不规范;若i为偶数,则判断出第i/2笔和第(i/2+l)笔相对长度不规范。 如图2-b和2-c所示,以"未"和"末"字为例。第一种情况:假设模板汉字是"未",而用户写成 了"末",那么模板特征向量是(1,2…),而用户特征向量是(2, l···),那么系统会判断第一笔 和第二笔相对长度是错误的。第二种情况:假设用户书写的"未"字,第一笔左边相对于第二 笔的左边的相对长度是正确的,但是第一笔的右边比第二笔的右边长,那么第一笔的终点 就会落在第二笔终点的右上方,那么它的特征向量是(1,1···)那么系统得出第二个特征值 是错误的,所以会判断出第(2/2 = 1)笔和第(2/2+1 = 2)笔相对长度是错误的。
[0083]优选的,所述步骤S400中的部件规范性评价在进行评价之前还包括判断预评价的 汉字的部件数是否为1。若为独体字,则不进行部件规范性评价,否则进行部件规范性评价。 [0084]可选的,所述步骤S400中部件规范性评价包括部件间相对距离的规范性评价,所 述部件间相对距离的规范性评价的步骤包括:
[0085] 3431、设置判断部件间距离适中的距离范围[£1,£2],其中 £1<£2;
[0086] S432、按照步骤S4321~S4322计算手写汉字第i个和第i + Ι个部件间的相对距离 DWi、汉字特征模板中相应汉字第i个和第i+Ι个部件间的相对距离DTi:
[0087] S4321、获取包围手写汉字的正方形框的边长d;
[0088] S4322、若当前部件不为该汉字的最后一个部件,计算当前部件与后一部件重心之 间的距离d 12,d23,...,将d1(1+1)/d作为第i个和第i+Ι个部件间的相对距离。
[0089] 本公开中的部件顺序为书写时应该遵循的先后顺序。
[0090] S433、根据下述规则得出部件间相对距离的规范性评价结论:
[0091]
[0092]当满足规则R1-1时,则第i个部件相对第i+Ι个部件的距离过远;当满足规则R1-2 时,则第i个部件相对第i+Ι个部件的距离过近;当满足规则R1-3时,则第i个部件相对第i+1 个部件的距离适中。
[0093]可选的,所述步骤S400中部件规范性评价包括部件间相对大小的规范性评价,所 述部件间相对大小的规范性评价的步骤包括:
[0094] S441、设置判断部件大小适中的面积范围[ε3,ε4],其中ε3<ε 4;
[0095] S442、按照步骤S4421~S4422计算手写汉字第i个和第i + 1个部件间的相对大小 SWi,汉字特征模板中相应汉字第i个和第i+Ι个部件间的相对大小STi:
[0096] S4421、获取手写汉字中包围每个部件的正方形框面积&,&,...;
[0097] S4422、若当前部件不为该汉字的最后一个部件,将SWi = Si/Si+1作为第i个和第i+1 个部件间的相对大小。
[0098] S443、根据下述规则得出部件间相对大小的规范性评价结论:
[0099]
[0100] 当满足规则R2-1时,则第i个部件相对第i+Ι个部件过大;当满足规则R2-2时,则第 i个部件相对第i+Ι个部件过小;当满足规则R2-3时,则第i个部件相对第i+Ι个部件大小适 中。在一个实施例中,[ε 3,ε4]根据观察和统计,被设置为[0.8,1.2]。
[0101 ]可选的,所述步骤S400中部件规范性评价包括部件间相对位置的规范性评价,所 述部件间相对位置的规范性评价的步骤包括:
[0102] S451、计算手写汉字各部件的重心坐标;
[0103] S452、计算第i个部件重心坐标落在第i+Ι个部件的位置,得到第i个部件和第i+1 个部件间的相对位置特征值Ρ??,进而得到手写汉字的相对位置特征向量Pw={pwi, PW2, . . . };使用同样方法获得汉字特征模板中相应汉字的相对位置特征向量Ρτ= {ρτι, ρΤ2,...},pTl表示汉字特征模板中相应汉字的第i个和第i+1个部件间的相对位置特征值;
[0104] S453、比较两个特征向量的对应特征分量,判断手写汉字的部件间相对位置规范 与否。
[0105] 在这里,设第i个部件的重心坐标为(XGi,Ki),该部件中每个点的坐标为(Xik,y ik), 让=1,2,'",11,则有:
[0106] XGi= (xil+Xi2+. . .+Xin)/n
[0107] yci= (yii+yi2+. . .+yin)/n
[0108] 其中,n为该部件中所有经过预处理后的点数。如图3所示,"程"字的第一个部件 "禾"的重心坐标落在第二个部件"口"的重点坐标的位置为3,所以其特征值为3.而"口"的 重心坐标和部件"王"的重心坐标落在同一直线上,所以将其特征值设为0.
[0109] 可选的,所述步骤S400中结构规范性评价的步骤包括:
[0110] S461、按照下述方法计算手写汉字的结构分布向量Qw和汉字特征模板中相应汉字 的结构分布向量Qt :
[0111]将包围汉字的长方形框分为9等分,得出结构分布向量Q= {qi,q2, . . . }/n,其中qi 表示汉字分布在第i区块的采样点数,η表示构成整个汉字的所有采样点总数;
[0112] S462、计筧用干判断结构是否规范的参数F:
[0113]
[0114] S463、根据下述规则判断手写汉字结构的规范程度:
[0115]
[0116] 当满足规则R3-1时,手写汉字的整体结构规范;当满足规则R3-2时,手写汉字的整 体结构基本规范;当满足规则R3-3时,手写汉字的整体结构不规范。通过计算F的大小,就可 以判断书写汉字结构的规范程度;F越小,说明手写汉字的规范等级越高。在一个实施例中, 判断手写汉字结构的规范程度的规则为:当F〈0.15时,认为整体结构规范;
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1