一种手写汉字规范性评价方法及系统的制作方法

文档序号:9911713阅读:392来源:国知局
一种手写汉字规范性评价方法及系统的制作方法
【技术领域】
[0001] 本公开涉及计算机数据处理技术领域,特别是一种手写汉字规范性评价方法及系 统。
【背景技术】
[0002] 在汉字文化越来越受到瞩目的今天,不仅小学生学习汉字书写,国外学习汉语的 热潮也在蓬勃兴起。随着互联网的不断发展,利用触摸屏代替纸张书写文字已是大势所趋, 汉字书写教学软件已经成为汉字初学者的必要学习工具,其中,汉字书写及规范性评价是 其中一项重要功能。目前对汉字评价所采用的方法主要是由人来评价,这种方法一方面带 有很大的主观性,同样的书写汉字,不同的人可能给出差别较大的评判;另一方面,这一枯 燥重复性的工作容易使人疲劳,同样的汉字由同样的人在不同的时间段进行评判,都有可 能给出不同的评判结果。

【发明内容】

[0003] 针对上述部分问题,本公开提供了一种手写汉字规范性评价方法及系统,所述方 法及系统有益于克服人工评价汉字的主观性以及疲劳性带来的不利影响,可以很好地指导 汉字初学者进行规范的汉字书写。
[0004] -种手写汉字规范性评价方法,所述方法包括下述步骤:
[0005] S100、构建汉字特征模板:书写满足某种字体要求的汉字,采集并记录所述汉字的 笔画数N、部件数M、每个部件所含笔画数Q及笔画轨迹U T= {山,U2, . . .,UN};其中,Ui= {(Xil, yn),(Xl2,yl2),...}为第i笔标准字笔画的坐标点集;
[0006] S200、采集手写汉字的笔画数f、部件数,、每个部件所含笔画数V及笔画轨迹 1] /丁={1]/1,1]/2,...,1^},并进行预处理;其中,1]/1=心 /11,7/11),(叉/12,7 /12),...}为手写 汉字的第i笔笔画的坐标点集;
[0007] S300、笔画数对比:将步骤S200中采集到的手写汉字的笔画数f与汉字特征模板 中对应的汉字的笔画数N进行对比;
[0008] 若两者的笔画数不相等,则判定该手写汉字不符合规范,执行步骤S500 ;否则,执 行步骤S400;
[0009] S400、进行手写汉字规范性评价:基于步骤S200中采集的数据和汉字特征模板中 相应的汉字存储的数据进行手写汉字规范性评价;所述规范性评价包括笔画规范性评价、 部件规范性评价以及结构规范性评价;
[0010] S500、得出规范性评价结论以指导实际中的汉字书写。
[0011] 基于所述方法,实现了一种手写汉字规范性评价系统,所述系统包括下述模块:
[0012] M100、获取用于评价手写汉字的标准字模块:所述模块M100能够获取标准字书的 笔画数N、部件数M、每个部件所含笔画数Q及笔画轨迹U T= {山,U2,. . .,UN};其中,Ui= {(Xil, yu),(Xl2,yl2),...}为第i笔标准字笔画的坐标点集;所述标准字为满足某种字体要求的汉 字;
[0013] M200、获取手写汉字模块:所述模块M200采集手写汉字的笔画数Y、部件数,、每 个部件所含笔画数V及笔画轨迹us= {IT hir 2,...,u%},并进行预处理;其中,IT 1 = { (x\l,/ il),(x、2,/ i2),. . . }为手写汉字的第i笔笔画的坐标点集;
[0014] M300、笔画数对比模块:将M200中采集到的手写汉字的笔画数Y与M100中获取的 对应汉字笔画数N进行对比;
[0015] 若两者的笔画数不相等,则判定该手写汉字不符合规范,进入模块M500 ;否则,进 入模块M400;
[0016] M400、进行手写汉字规范性评价:基于M200中采集的数据和M100中获取的相应汉 字的相关数据进行手写汉字规范性评价;所述M400包括笔画规范性评价子模块、部件规范 性评价子模块以及结构规范性评价子模块;
[0017] M500、得出规范性评价结论以指导实际中的汉字书写。
【附图说明】
[0018] 图1本公开的一个实施例中的一种手写汉字规范性评价方法流程图;
[0019] 图2-a本公开的一个实施例中的示例的被检测字"土";
[0020]图2-b本公开的一个实施例中的示例的被检测字"未";
[0021]图2-c本公开的一个实施例中的示例的被检测字"末";
[0022]图3本公开的一个实施例中的示例的被检测字"程";
[0023] 图4本公开的一个实施例中的示例的被检测字"程"的9等分示意图。
【具体实施方式】
[0024] 在一个基础的实施例中,提供了一种手写汉字规范性评价方法,如图1所示,所述 方法包括下述步骤:
[0025] S100、构建汉字特征模板:书写满足某种字体要求的汉字,采集并记录所述汉字的 笔画数N、部件数M、每个部件所含笔画数Q及笔画轨迹U T= {Ui,U2, . . .,UN};其中,Ui= {(Xil, yn),(Xl2,yl2),...}为第i笔标准字笔画的坐标点集;
[0026] S200、采集手写汉字的笔画数f、部件数,、每个部件所含笔画数V及笔画轨迹 1] /丁={1]/1,1]/2,...,1^},并进行预处理;其中,1]/1=心 /11,7/11)心/12,7 /12),...}为手写 汉字的第i笔笔画的坐标点集;
[0027] S300、笔画数对比:将步骤S200中采集到的手写汉字的笔画数f与汉字特征模板 中对应的汉字的笔画数N进行对比;
[0028] 若两者的笔画数不相等,则判定该手写汉字不符合规范,执行步骤S500 ;否则,执 行步骤S400;
[0029] S400、进行手写汉字规范性评价:基于步骤S200中采集的数据和汉字特征模板中 相应的汉字存储的数据进行手写汉字规范性评价;所述规范性评价包括笔画规范性评价、 部件规范性评价以及结构规范性评价;
[0030] S500、得出规范性评价结论以指导实际中的汉字书写。
[0031] 所述方法先将某种字体的汉字作为标准进行存储,同时记录该标准汉字的相关字 体信息,包括笔画数、部件数、笔画轨迹、笔画坐标点集等。为了后续规范性评价的方便,减 少计算量,若该字不是独体字,还需记录该字笔画的相对位置关系和相对长度关系、该字的 部件间相对距尚、部件间相对大小和相对位置、该字的结构分布向量。记录的方式,可以是 数据库、硬盘、光盘、闪存或其它存储介质。在进行规范性评价时,提取手写汉字的相关字体 信息。为了提高规范性评价的速度,首先进行汉字总体笔画数对比,若不相同,那么该手写 汉字必然不规范;否则根据相关字体信息,进行规范性评价,给出规范性评价的结论,其结 论可以是单独的文字提示,也可以是在原手写汉字中进行标识,还可以是文字提示加标识 的形式。
[0032] 由于在触摸屏上用户书写过程中有很大的随意性,导致采集到的信息并不理想, 例如手不小心触碰到触摸屏导致的坐标突变和单独点、用户书写过程中发现错误后,重复 书写以覆盖原来笔画和手写速度过快导致采集到的坐标过于稀疏等问题,由于在后期进行 评价的时候,对采样点的要求特别高,因此要先对采集点进行预处理。优选的,在步骤S200 中所述预处理包括:剔除单独点、删除重复笔画、重采样。
[0033] 进一步地,所述剔除单独点的步骤包括:
[0034] S2011、判断该笔笔画的坐标点集长度是否为1;若为1,则剔除。
[0035]更进一步地,所述删除重复笔画的步骤包括:
[0036] S2021、若当前笔画和前一笔画轨迹的相同点个数超过设定的阈值ε7,比如ε 7=10, 当相同点数超过10,则判定用户在前一笔画的基础上重复书写了此笔画;
[0037] S2022、删除前一笔画。
[0038] 在预处理中,所有的汉字都需要重采样,重采样的目的是检测系统采集到的坐标 点是否足够密集,若不密集,可能会存在一些关键点的坐标没有采集到,比如拐点,进而导 致评价结果不准确。因此,在重采样中遇到采集的坐标点不密集时,可选的,可对采集的点 集进行插值处理。
[0039] 可选的,重采样采用数值微分方法。在一个实施例中,采样点的步长为1。
[0040] 可选的,所述步骤S400中笔画规范性包括笔形笔势评价,所述笔形笔势评价的步 骤包括:
[0041] S411、将第i笔手写汉字笔画与汉字特征模板中相应的汉字的笔画进行匹配,i = 1,2,...;若匹配,则判定该笔画的笔形笔势正确;否则,执行步骤S412;
[0042] S412、取第i笔标准字笔画的第一个坐标点(Xil,yil)和最后一个坐标点( Xil,yil), 将笔画的方向记作θτ,根据下述公式计算汉字特征模板中相应汉字笔画的方向θτ:
[0043]
[0044] 取第i笔手写字笔画的第一个坐标点(Yu J'u)和最后一个坐标点将笔 画的方向记作θν,根据下述公式计算手写字相应汉字笔画的方向0W:
[0045]
[0046] S413、若θτ X 0W<〇,则判定手写汉字该笔的笔势错误,否则,判定手写汉字笔画的 笔形错误;
[0047] S414、重复执行步骤S411~S413直至手写汉字的所有笔画的笔形笔势都评价完。
[0048] 这里通过将每一笔手写汉字笔画依次与模板汉字笔画进行匹配,判断其笔形及笔 势是否正确,在不正确的情况下,再判断到底是笔形不规范还是笔势不规范。在一个实施例 中,优选使用下述方法来判断笔形笔势的正确性,即:所述步骤S411中匹配的判断方法包 括:
[0049] S4111、对手写笔画的坐标点集进行伸缩、平移变换;
[0050] S4112、将变换后的笔画与汉字特征模板中相应汉字的对应笔画进行匹配,计算匹 配的最小距离H;
[0051] S4113、若最小距离小于设定阈值,则认为手写的笔画与汉字特征模板中相应汉字 的对应笔画匹配。
[0052] 在一个实施例中,更进一步地提供了一种计算匹配的最小距离的计算方法,即:采 用多种群并行粒子群优化算法,将Hausdorff距离作为适应度值,缩放和平移系数(k,a,b) 作为粒子,通过迭代得到手写笔画和汉字特征模板中相应汉字的对应笔画之间的最小 Hausdorff距离H;其中:所述Hausdorff距离为手写笔画和汉字特征模板中相应汉字的对应 笔画的相似距离;k为手写笔画的缩放系数;a,b为手写笔画在X和y方向的平移系数。
[0053] 鉴于汉字包含很多笔画,一个笔画又包含很多坐标点,为了节省时间并且避免陷 入局部最优解,这里优选采用多种群并行粒子群优化算法将种群分成Η个子种群,每个子种 群含有数目相同的粒子,然后每个子种群均并行按照经典粒子群的步骤寻求该种群内部的 全局最优解。对Η个子种群的最优解进行比较,将其中最优的作为种群的全局最优解,按照 下述粒子更新速度和位置的公式,将子种群内部的全局最优解作为该种群中粒子的自身最 优解pbest,如此循环,直到达到迭代次数为止。
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1