基于手写笔迹的书写态度评价方法及系统与流程

文档序号:13220484阅读:194来源:国知局
技术领域本发明涉及图像处理、手写识别等领域,具体涉及一种基于手写笔迹的书写态度评价方法及系统。

背景技术:
在现今的教育中,各种类型的作业、考试仍占据着重要的地位,而作业、考试中学生书写态度是考核的一个重要指标,如高考中语文、英语、公务员考试,日常作业特别是中小学等低年级的作业评价。现有的学生书写态度评价多是由第三方(如教师)主观进行评价,具体地,由人工对纸质媒介上的笔迹内容进行视觉上的观察评判,进而对书写的态度给出人工评价结果。现有的人工评价方法存在以下缺点:1.人工评价人耗大、效率较低人工对纸质媒介上的笔迹内容进行评判时需要仔细观察对照书写者的笔迹内容,若待评测的内容较多时,尤其在一定规模的书写测试时、大型考试时,人工难以短时间内给出评测结果,从而降低了该方法的使用范围。2.人工评价过程中受主观因素影响由于人工评价时评价者容易受到自身的审美观影响,故对书写态度有着不同的评判标准,同时评价者易受到情绪等因素的影响,所以不同评价者给出同一份受测笔迹的评价结果就可能有较大的差别,故现有方案难以对书写者进行公平的评价。

技术实现要素:
本发明提供一种基于手写笔迹的书写态度评价方法及系统,以解决现有人工评价方法存在的人力消耗大、缺乏客观性和合理性的问题。为此,本发明提供如下技术方案:一种基于手写笔迹的书写态度评价方法,包括:预先训练用于态度评价的评分模型;获取手写图像;提取所述手写图像的笔迹特征;根据所述笔迹特征及所述评分模型,得到书写态度评价结果。优选地,所述训练用于态度评价的评分模型包括:收集训练数据;提取所述训练数据的笔迹特征;根据所述笔迹特征训练用于态度评价的评分模型。优选地,所述笔迹特征包括以下任意三种或三种以上:笔迹宽度特征、字符大小特征、字符的字形特征、字符倾斜角度特征、字符运笔速度和压力特征、书写格局特征。优选地,所述提取所述手写图像的笔迹特征包括:对所述手写图像进行切分,获得切分后的各字符;提取各字符的笔迹特征;根据各字符的笔迹特征确定所述手写图像的笔迹特征。优选地,所述对所述手写图像进行切分,获得切分后的各字符包括:对手写笔迹点进行连通域分析,得到由笔迹点组成的连通域;通过连通域聚类方式得到书写区域中各文本行;对各文本行笔迹进行手写字符识别,得到文本行中各字符。一种基于手写笔迹的书写态度评价系统,包括:模型训练模块,用于预先训练用于态度评价的评分模型;手写图像获取模块,用于获取手写图像;笔迹特征提取模块,用于提取所述手写图像的笔迹特征;评价模块,用于根据所述笔迹特征及所述评分模型,得到书写态度评价结果。优选地,所述模型训练模块包括:数据收集子模块,用于收集训练数据;特征提取子模块,用于提取所述训练数据的笔迹特征;训练子模块,用于根据所述笔迹特征训练用于态度评价的评分模型。优选地,所述笔迹特征包括以下任意三种或三种以上:笔迹宽度特征、字符大小特征、字符的字形特征、字符倾斜角度特征、字符运笔速度和压力特征、书写格局特征。优选地,所述笔迹特征提取模块包括:切分单元,用于对所述手写图像进行切分,获得切分后的各字符;字符笔迹特征提取单元,用于提取各字符的笔迹特征;图像笔迹特征确定单元,用于根据各字符的笔迹特征确定所述手写图像的笔迹特征。优选地,所述切分单元包括:连通域分析子单元,用于对手写笔迹点进行连通域分析,得到由笔迹点组成的连通域;聚类子单元,用于通过连通域聚类方式得到书写区域中各文本行;字符识别子单元,用于对各文本行笔迹进行手写字符识别,得到文本行中各字符。本发明实施例提供的基于手写笔迹的书写态度评价方法及系统,预先训练用于态度评价的评分模型,在获取到手写图像后,提取图像中的手写笔迹特征,再根据手写笔迹特征和预先训练的评分模型,得到书写态度评价结果,从而实现全自动学生书写态度评价,提高了评价的效率,并保证了评价结果的客观性和合理性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本发明实施例基于手写笔迹的书写态度评价方法的流程图;图2是本发明实施例中连通域示意图;图3是本发明实施例中单字凸包示意图;图4是本发明实施例基于手写笔迹的书写态度评价系统的结构示意图。具体实施方式为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。如图1所示,是本发明实施例基于手写笔迹的书写态度评价方法的流程图,包括以下步骤:步骤101,预先训练用于态度评价的评分模型。评分模型的训练过程如下:(1)收集训练数据。比如,可以从历史考试或练习中收集一定数量的学生书写数据,并通过专家对学生书写态度进行评分。训练数据也是一种手写图像。(2)提取训练数据的笔迹特征。在本发明实施例中,提取笔迹特征时可以先针对单个字符,即提取各训练数据中每个字符的笔迹特征,然后根据各字符的笔迹特征来确定整个训练数据的笔迹特征,比如,对于每种特征,取所有字符的对应特征值的平均值并对其进行归一化处理。另外,由于通篇字符形态的变化也会在一定程度上反映一个人的书写态度,因此,对于有些笔迹特征,还可进一步计算相应特征值的标准方差并对其进行归一化处理。由于训练数据也是一种手写图像,因此为了得到单个字符,可以通过对手写图像进行切分,获得切分后的各字符。然后提取各字符的笔迹特征,根据各字符的笔迹特征即可确定所述手写图像的笔迹特征。具体地,首先对手写笔迹点进行连通域分析,得到由笔迹点组成的连通域,再通过连通域聚类的方式将书写区域中各文本行聚出来;然后利用手写字符识别模型(如HMM模型)对各文本行笔迹进行识别,得到单个字符的边界,完成文本行到单字的切分,从而得到文本行中各字符。所述连通域一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域,在本发明实施例中,指相邻前景像素点组成的笔迹,如图2所示。连通域分析则是以连通域为基本单位实现的一些算法和操作。连通域聚类的方式可以采用现有技术,其基本思路为:对连通域进行聚类,定义良好的距离度量函数,使得一个文本行内的连通域距离近而非同一行的连通域距离远。在本发明实施例中,具体可以利用度量学习,度量学习模型使用CNN(卷积神经网络)模型,输入为连通域A与连通域B组成的规整图片,输出为A与B的距离,训练CNN模型可以使用MSE(最小二乘)的LOSS。在本发明实施例中,所述笔迹特征可以包括以下任意三种或三种以上的特征:笔迹宽度特征、字符大小特征、字符的字型特征、字符倾斜角度特征、字符运笔速度和压力特征、书写格局特征。下面分别对这些特征进行详细说明。1.笔迹宽度特征所述宽度特征是指字符平均笔迹宽度,该特征与运笔速度和压力相关度很高。书写慢或者重时,写出来的字笔迹往往较宽。宽度特征的提取可以通篇全局进行,也可以先针对每个字符进行,对此本发明实施例不做限定。具体地,可以采用前景游程统计方法得到,所述前景游程指的是沿着X轴或Y轴的连续前景像素个数的均值。在使用游程计算笔迹宽度时,可以以书写区域的最左下角为原点,画出X轴和Y轴,先沿X轴扫描得到所有的X方向的游程,再沿Y轴扫描得到所有Y方向的游程,去掉过大的游程(比如过滤掉大于20个像素的游程)后取平均值,得到笔迹的宽度。例如,对于手写图像,从X方向,分别有1个连续3个像素、2个连续6个像素、1个连续9个像素的笔迹,则该手写图像X方向的游程为6;同理,再统计出Y方向的游程,最后取平均值,作为该手写图像的笔迹宽度。对于单个字符笔迹宽度的提取也同样,只是在进行前景游程统计时针对的是单个字符的图像。2.字符大小特征在本发明实施例中,字符大小特征可以通过字符的宽度和高度的均值、以及标准方差来表征,其中标准方差反映了字符大小的变化情况。具体地,对单个字符的前景点进行统计,得到单个字符的宽度和高度,再取通篇字符的宽度和高度的均值和标准方差,并将宽度和高度的均值和标准方差,分别除以平均行高进行归一化,作为手写图像的字符大小特征。3.字符的字形特征具体地,对于单个字符,基于该字符笔迹点中的拐点,得到字符的外接凸包,如图3所示。由笔迹的前景像素点计算字体的重心,重心与各个凸包点的距离反映了字符的字型特征。因此,在本发明实施例中,可以取单个字符的重心到其各凸包点的距离的平均值,作为该字符的字形特征。对于所述手写图像,则取该手写图像中所有字符的字形特征的均值作为该手写图像的字符的字形特征。4.字符倾斜角度特征使用预先设计好的笔画类型(如长横、长竖、短横、短竖、撇、捺、点等)对单个字符进行笔画提取,在提取好的笔画上可以取长竖笔画相对于垂直方向的倾斜角度来表征字符倾斜角度特征。需要说明的是,如果一个字符有多个长竖笔画,可以取这些长竖笔画相对于垂直方向的倾斜角度的平均值作为该字符的倾斜角度特征。对于所述手写图像,可以取该手写图像中所有字符倾斜角度特征的均值作为该手写图像的字符倾斜角度特征。字符的大小、字形、倾斜角度在一定程度上反映了汉字的体态,汉字属于方块字,从字形上看,每个字都方正且匀称,外形左右对称,中心与重心贴近。而在书写随意时,字往往“站不稳”,也就不具备上述特性。5.字符运笔速度和压力特征在本发明实施例中,可以利用HOG(HistogramofOrientedGradient,方向梯度直方图)特征来确定单个字符的运笔速度和压力特征。HOG特征是用于目标检测的特征描述子,该特征的提取可采用现有技术,在此不再详细描述。具体地,可以对每一种笔画类型训练一个获取运笔速度和压力的回归模型,回归模型的输入是该笔画的HOG特征,输出是笔画的速度和压力。在训练时,可以由相应的电子设备分别采集书写时每个笔迹点的速度和压力,对于每个笔画的速度和压力为该笔画包含的所有笔迹点的速度和压力均值。在对手写图像中的字符提取其运笔速度和压力特征时,对于该字符中各笔画,利用对应该笔画类型的回归模型及该笔画的HOG特征,得到该笔画的运笔速度和压力,然后将该字符的所有笔画的运笔速度和压力分别取平均值,即可得到该字符的运笔速度和压力特征。同样,对于所述手写图像,分别计算该手写图像中所有字符的运笔速度和压力特征的均值,将其作为该手写图像的字符运笔速度和压力特征。字符运笔速度和压力特征通常与书写者的态度、心情十分相关。6.书写格局特征书写格局特征反映的是整体书写版面以及书写内容上是否规整,与书写态度相关度也较高。书写格局特征具体可以包括:在行切分和单字切分的过程中得到的行间距、字间距等信息。需要说明的是,对于上述6种特征,在进行特征提取时,可以先提取笔迹宽度特征,然后提取书写格局、字符大小特征;然后再提取字符倾斜角度、字形、运笔速度和压力特征。当然,在实际应用中,根据应用场景的不同,可以有不同的评价精度要求,相应地,可以选取上述6种特征中的三种或三种以上来训练用于态度评价的评分模型,比如,字符的字形特征、字符运笔速度和压力特征、书写格局特征等,具体选择哪些特征可以根据需要来确定,对此本发明实施例不做限定。(3)根据所述笔迹特征训练用于态度评价的评分模型。所述评分模型可以采用基于回归的模型,如:logistic回归,最小二乘估计、岭回归等,其输入是一组笔迹特征向量,输出是态度评价分值。步骤102,获取手写图像。所述手写图像可以是学生作业、试卷等。步骤103,提取所述手写图像的笔迹特征。首先,对手写图像进行切分,获得切分后的各字符,然后提取各字符的笔迹特征。提取的笔迹特征与评分模型训练时提取的笔迹特征类型相同,提取方法也相同,在此不再详细描述。在得到各字符的笔迹特征后,即可根据各字符的笔迹特征确定所述手写图像的笔迹特征。步骤104,根据所述笔迹特征及所述评分模型,得到书写态度评价结果。将提取的手写图像的笔迹特征输入所述评价模型,评价模型的输出即为对应该手写图像的评价得分。根据模型输出的分数进行学生态度的评价,可以进行分级评价,如可以有以下几种等级:分数在[0,0.3),对应的书写态度评价等级:差;分数在[0.3,0.6),对应的书写态度评价等级:一般;分数在[0.6,0.8),对应的书写态度评价等级:较好;分数在[0.8,1],对应的书写态度评价等级:很好。本发明实施例提供的基于手写笔迹的书写态度评价方法,预先训练用于态度评价的评分模型,在获取到手写图像后,提取图像中的手写笔迹特征,再根据手写笔迹特征和预先训练的评分模型,得到书写态度评价结果,从而实现全自动学生书写态度评价,提高了评价的效率,并保证了评价结果的客观性和合理性。相应地,本发明实施例还提供一种基于手写笔迹的书写态度评价系统,如图4所示,是该系统的一种结构示意图。在该实施例中,所述系统包括:模型训练模块401,用于预先训练用于态度评价的评分模型;手写图像获取模块402,用于获取手写图像;笔迹特征提取模块403,用于提取所述手写图像的笔迹特征;评价模块404,用于根据所述笔迹特征及所述评分模型,得到书写态度评价结果。其中,模型训练模块401可以包括以下各子模块:数据收集子模块,用于收集训练数据;特征提取子模块,用于提取所述训练数据的笔迹特征;训练子模块,用于根据所述笔迹特征训练用于态度评价的评分模型。上述笔迹特征提取模块403可以包括以下各单元:切分单元,用于对所述手写图像进行切分,获得切分后的各字符;字符笔迹特征提取单元,用于提取各字符的笔迹特征;图像笔迹特征确定单元,用于根据各字符的笔迹特征确定所述手写图像的笔迹特征。其中,所述切分单元具体可以通过连通域分析、聚类的方式得到书写区域中各文本行,并通过手写字符识别得到文本行中各字符。所述切分单元具体可以包括以下各子单元:连通域分析子单元,用于对手写笔迹点进行连通域分析,得到由笔迹点组成的连通域;聚类子单元,用于通过连通域聚类方式得到书写区域中各文本行;字符识别子单元,用于对各文本行笔迹进行手写字符识别,得到文本行中各字符。在本发明实施例中,所述笔迹特征可以包括以下任意三种或三种以上的特征:笔迹宽度特征、字符大小特征、字符的字型特征、字符倾斜角度特征、字符运笔速度和压力特征、书写格局特征,这些特征的具体提取过程在前面已有详细说明,在此不再赘述。需要说明的是,在实际应用中,特征提取子模块可以采用与笔迹特征提取模块403相同的结构,而且也可以是同一个物理模块,对此本发明实施例不做限定。本发明实施例提供的基于手写笔迹的书写态度评价系统,预先训练用于态度评价的评分模型,在获取到手写图像后,提取图像中的手写笔迹特征,再根据手写笔迹特征和预先训练的评分模型,得到书写态度评价结果,从而实现全自动学生书写态度评价,提高了评价的效率,并保证了评价结果的客观性和合理性。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及系统;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1