一种手写作文的批阅方法及系统与流程

文档序号:19006200发布日期:2019-10-29 23:42阅读:405来源:国知局
一种手写作文的批阅方法及系统与流程

本发明涉及教育技术领域,更具体地,涉及一种手写作文的批阅方法及系统。



背景技术:

在各类考试评分中,作文往往是最耗费工作量,也最具争议的一项。在中小学中学生的作文通常都是手写的,过去难以通过人工智能的手段来加以识别和大规模量化处理。教师通常只能关注和记忆少数重点学生的作文质量,不利于学生得到普遍关注和个性化推荐。

因此,提供一种手写作文的批阅方法及系统,实现对手写作文的大规模量化处理,减少教师工作负担,提升批阅效率,并且有针对性的进行范句推荐来进行教学辅导,是本领域亟待解决的技术问题。



技术实现要素:

有鉴于此,本发明提供了一种手写作文的批阅方法及系统,解决了上述技术问题。

第一方面,本发明提供一种手写作文的批阅方法,包括:

获取待批阅手写作文图片,基于深度学习的手写文字识别技术,识别所述待批阅手写作文图片生成待批阅作文文本;

对所述待批阅作文文本的每一个段落分别进行聚类分析确定问题段落,所述问题段落包括第一类问题段落和第二类问题段落,包括:

选取段落的第一句为中心句,计算段落中剩余句子与所述中心句之间的第一编辑距离;

将所述第一编辑距离大于第一阈值范围的最大值的句子所在的段落判定为所述第一类问题段落;

将所述第一编辑距离小于第一阈值范围的最小值的句子所在的段落判定为所述第二类问题段落;

选取所述问题段落的第一句为基准句,在范句数据库中寻找与所述基准句相似的相似句,所述范句数据库包括第一优先级范句库、第二优先级范句库和第三优先级范句库,所述第一优先级范句库包括各种课本和教学辅导书中范句,所述第二优先级范句库包括人工评分挑选出的范句,所述第三优先级范句库包括基于语法模型分析出来的范句,包括:

计算所述第一优先级范句库、所述第二优先级范句库和所述第三优先级范句库中的句子与所述基准句之间的第二编辑距离;

选择所述第二编辑距离小于第二阈值的m个句子作为所述相似句,m为正整数,且m≥1;

生成批阅结果,包括:将所述相似句推荐给所述待批阅作文文本对应的学生。

可选的,还包括:以所述待批阅作文文本为基准文,在范文数据库中寻找与所述基准文相似的相似文,所述范文数据库包括第一优先级范文库、第二优先级范文库和第三优先级范文库,所述第一优先级范文库包括各种课本和教学辅导书中范文,所述第二优先级范文库包括人工评分挑选出的范文,所述第三优先级范文库包括基于语法模型分析出来的范文,包括:

计算所述第一优先级范文库、所述第二优先级范文库和所述第三优先级范文库中的文章与所述基准文之间的第三编辑距离;

选择所述第三编辑距离小于第三阈值的n个文章作为所述相似文,n为正整数,且n≥1;

生成批阅结果,还包括:将所述相似文推荐给所述待批阅作文文本对应的学生。

可选的,以所述待批阅作文文本为基准文,在范文数据库中寻找与所述基准文相似的相似文,包括:

计算优先级从高到低排列依次为:所述第一优先级范文库、所述第二优先级范文库和所述第三优先级范文库;

当上一级优先级的范文库中所述第三编辑距离小于第三阈值的文章个数大于等于n时,则选择所述第三编辑距离最近的n个文章作为所述相似文;

当上一级优先级的范文库中所述第三编辑距离小于第三阈值的文章个数小于n时,则继续计算下一级优先级的范文库中文章与所述基准文之间的所述第三编辑距离。

可选的,选取所述问题段落的第一句为基准句,在范句数据库中寻找与所述基准句相似的相似句,进一步包括:

计算优先级从高到低排列依次为:所述第一优先级范句库、所述第二优先级范句库和所述第三优先级范句库;

当上一级优先级的范句库中所述第二编辑距离小于第二阈值的句子个数大于等于m时,则选择所述第二编辑距离最近的m个句子作为所述相似句;

当上一级优先级的范句库中所述第二编辑距离小于第二阈值的句子个数小于m时,则继续计算下一级优先级的范句库中句子与所述基准句之间的所述第二编辑距离。

可选的,还包括:获取所述待批阅作文文本对应的学生信息,所述待批阅作文文本和所述学生信息一一对应,所述学生信息至少包括:学生姓名、学生年级、学生班级;

基于预置词典判断所述待批阅作文文本是否有拼写错误;

生成批阅结果,还包括:根据所述学生信息将一个班级或者一个年级的拼写错误进行统计生成第一统计表。

可选的,还包括:获取所述待批阅作文文本对应的学生信息,所述待批阅作文文本和所述学生信息一一对应,所述学生信息至少包括:学生姓名、学生年级、学生班级;

基于语法模型判断所述待批阅作文文本是否有语法错误;

生成批阅结果,还包括:根据所述学生信息将一个班级或者一个年级的语法错误进行统计生成第二统计表。

可选的,还包括:所述第一编辑距离为所述中心句与段落中一个剩余句子之间相互转化的最少的操作次数;

所述第二编辑距离为基准句与范句库中的句子之间相互转化的最少的操作次数。

第二方面,本发明还提供一种手写作文的批阅系统,包括:文本识别模块、聚类分析模块、相似句选取模块、批阅结果生成模块;其中,

所述文本识别模块,用于获取待批阅手写作文图片,基于深度学习的手写文字识别技术,识别所述待批阅手写作文图片生成待批阅作文文本;

所述聚类分析模块,与所述文本识别模块相连接,用于对所述待批阅作文文本的每一个段落分别进行聚类分析确定问题段落,所述问题段落包括第一类问题段落和第二类问题段落,所述聚类分析模块包括第一编辑距离计算子模块和问题段落划分子模块;其中,

所述第一编辑距离计算子模块,用于选取段落的第一句为中心句,计算段落中剩余句子与所述中心句之间的第一编辑距离;

所述问题段落划分子模块,用于将所述第一编辑距离大于第一阈值范围的最大值的句子所在的段落判定为所述第一类问题段落;还用于将所述第一编辑距离小于第一阈值范围的最小值的句子所在的段落判定为所述第二类问题段落;

所述相似句选取模块,与所述聚类分析模块相连接,用于选取所述问题段落的第一句为基准句,在范句数据库中寻找与所述基准句相似的相似句,所述范句数据库包括第一优先级范句库、第二优先级范句库和第三优先级范句库,所述第一优先级范句库包括各种课本和教学辅导书中范句,所述第二优先级范句库包括人工评分挑选出的范句,所述第三优先级范句库包括基于语法模型分析出来的范句,所述相似句选取模块包括第二编辑距离计算子模块和相似句生成子模块;其中,

所述第二编辑距离计算子模块,用于计算所述第一优先级范句库、所述第二优先级范句库和所述第三优先级范句库中的句子与所述基准句之间的第二编辑距离;

所述相似句生成子模块,用于选择所述第二编辑距离小于第二阈值的m个句子作为所述相似句,m为正整数,且m≥1;

所述批阅结果生成模块,与所述相似句选取模块相连接,用于生成批阅结果,包括:将所述相似句推荐给所述待批阅作文文本对应的学生。

可选的,还包括:相似文选取模块,与所述文本识别模块相连接,用于以所述待批阅作文文本为基准文,在范文数据库中寻找与所述基准文相似的相似文,所述范文数据库包括第一优先级范文库、第二优先级范文库和第三优先级范文库,所述第一优先级范文库包括各种课本和教学辅导书中范文,所述第二优先级范文库包括人工评分挑选出的范文,所述第三优先级范文库包括基于语法模型分析出来的范文,所述相似文选取模块包括第三编辑距离计算子模块和相似文生成子模块;其中,

所述第三编辑距离计算子模块,用于计算所述第一优先级范文库、所述第二优先级范文库和所述第三优先级范文库中的文章与所述基准文之间的第三编辑距离;

所述相似文生成子模块,用于选择所述第三编辑距离小于第三阈值的n个文章作为所述相似文,n为正整数,且n≥1;

所述批阅结果生成模块,还用于生成批阅结果,将所述相似文推荐给所述待批阅作文文本对应的学生。

可选的,还包括:学生信息获取模块和拼写错误查找模块;

所述学生信息获取模块,用于获取所述待批阅作文文本对应的学生信息,所述待批阅作文文本和所述学生信息一一对应,所述学生信息至少包括:学生姓名、学生年级、学生班级;

所述拼写错误查找模块,与所述文本识别模块相连接,用于基于预置词典判断所述待批阅作文文本是否有拼写错误;

所述批阅结果生成模块,还用于生成批阅结果,根据所述学生信息将一个班级或者一个年级的拼写错误进行统计生成第一统计表。

与现有技术相比,本发明提供的新增试题的知识点标注方法及系统,至少实现了如下的有益效果:

(1)本发明首先通过对待批阅作文文本的每一个段落分别进行聚类分析确定问题段落,然后针对根据问题段落寻找与问题段落中的基准句相似的相似句,最后在批阅结果中将相似句推荐给作文文本对应的学生。能够实现对手写作文的大规模量化处理,减少教师工作负担,提升批阅效率。

(2)对于存在第一类问题段落的待批阅作文文本,对学生推荐相似句后,能够帮助学生学习如何把握撰写的主题,避免跑题;对于存在第二类问题段落的待批阅作文文本,对学生推荐相似句后,能够帮助学生学习在撰写时能够使用多样性的句法和遣词造句,提升作文水平,实现针对性的进行范句推荐来进行教学辅导。

(3)本发明还能够实现针对性的将范文推荐给学生,学生能够对范文进行学习借鉴,能够有利于提升学生的知识储备。

(4)本发明能够根据学生信息将一个班级或者一个年级的拼写错误进行统计生成第一统计表,或者根据学生信息将一个班级或者一个年级的语法错误进行统计生成第二统计表;通过第一统计表或者第二统计表,教师可以针对性的进行辅导,从而提升学生的作文水平。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1为本发明实施例提供的手写作文的批阅方法流程图一;

图2为本发明实施例提供的手写作文的批阅方法流程图二;

图3为本发明实施例提供的手写作文的批阅方法流程图三;

图4为本发明实施例提供的手写作文的批阅方法流程图四;

图5为本发明实施例提供的手写作文的批阅系统框图一;

图6为本发明实施例提供的手写作文的批阅系统框图二;

图7为本发明实施例提供的手写作文的批阅系统框图三。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本发明实施例提供一种手写作文的批阅方法,可以适用于英文手写作文也可以适用于中文手写作文。图1为本发明实施例提供的手写作文的批阅方法流程图一,如图1所示包括:

步骤s101:获取待批阅手写作文图片,基于深度学习的手写文字识别技术,识别待批阅手写作文图片生成待批阅作文文本。当适用于英文手写作文时,获取待批阅手写作文图片后,基于深度学习的英文手写文字识别技术,识别待批阅手写作文图片生成待批阅英文作文文本;当适用于中文手写作文时,获取待批阅手写作文图片后,基于深度学习的中文手写文字识别技术,识别待批阅手写作文图片生成待批阅中文作文文本。

步骤s102:对待批阅作文文本的每一个段落分别进行聚类分析确定问题段落,问题段落包括第一类问题段落和第二类问题段落,一篇作文通常包括多个段落,本发明中对每一个段落均进行一次聚类分析,从而确定作文文本中的问题段落。包括:

选取段落的第一句为中心句,计算段落中剩余句子与中心句之间的第一编辑距离;可选的,第一编辑距离为中心句与段落中一个剩余句子之间相互转化的最少的操作次数;操作可以为字符的插入、删除、替换;其中,在计算操作次数时:插入一个字符、删除一个字符、替换一个字符均记为一次操作。

将第一编辑距离大于第一阈值范围的最大值的句子所在的段落判定为第一类问题段落,第一类问题段落为第一类需要修改和提升的问题段落;将第一编辑距离小于第一阈值范围的最小值的句子所在的段落判定为第二类问题段落,第二类问题段落为第二类需要修改和提升的问题段落。

第一编辑距离体现了两个句子之间的相近程度,即段落中其他的句子与该段落的第一句之间的相近程度。第一编辑距离越大,则两个句子之间的相近程度越远;第一编辑距离越小,则两个句子之间越相近。其中,第一阈值范围为第一编辑距离不是特别大,也不是特别小的一个范围,本发明对于具体的第一阈值范围不做限定,实际中可以根据具体需求来确定。

如果第一编辑距离过大,则说明两个句子之间相近程度非常远,该文章段落中可能存在跑题的问题,本发明将第一编辑距离大于第一阈值范围的最大值的句子所在的段落判定为第一类问题段落,在后续中可以通过计算针对该类段落推荐范句来帮助提升学生的作文水平。

如果第一编辑距离过小,则说明两个句子之间非常相近,表明句子和段落的中心句重合或者几乎重复,说明该段落中句法多样性差,遣词造句的表现差,本发明将一编辑距离小于第一阈值范围的最小值的句子所在的段落判定为第二类问题段落,在后续中可以通过计算针对该类段落推荐范句来帮助提升学生的作文水平。

步骤s103:选取问题段落的第一句为基准句,在范句数据库中寻找与基准句相似的相似句,范句数据库包括第一优先级范句库、第二优先级范句库和第三优先级范句库,第一优先级范句库包括各种课本和教学辅导书中范句,第二优先级范句库包括人工评分挑选出的范句,第三优先级范句库包括基于语法模型分析出来的范句,包括:

计算第一优先级范句库、第二优先级范句库和第三优先级范句库中的句子与基准句之间的第二编辑距离。可选的,第二编辑距离为基准句与范句库中的句子之间相互转化的最少的操作次数。操作可以为字符的插入、删除、替换;其中,在计算操作次数时:插入一个字符、删除一个字符、替换一个字符均记为一次操作。第二编辑距离也体现了两个句子之间的相近程度,第二编辑距离越小,则两个句子之间的相似程度越高。

选择第二编辑距离小于第二阈值的m个句子作为相似句,m为正整数,且m≥1;本发明中对于第二阈值的大小不做具体的限定,实际中可根据具体需求进行选择。该步骤中范句数据库为预先建立的数据库,在此步骤中直接调用即可。

对于第一类问题段落,能够在范句数据库中寻找与第一类问题段落的第一句相似的相似句,即能够找到与基准句主题相关的句子。

对于第二类问题段落,能够在范句数据库中寻找与第二类问题段落的第一句相似的相似句,即能够找到与基准句相关句法更加多样性的句子。

步骤s104:生成批阅结果,包括:将相似句推荐给待批阅作文文本对应的学生。对于存在第一类问题段落的作文文本,对学生推荐相似句后,能够帮助学生学习如何把握撰写的主题,避免跑题;对于存在第二类问题段落的作文文本,对学生推荐相似句后,能够帮助学生学习在撰写时能够使用多样性的句法和遣词造句,提升作文水平。

在一种实施方式中,步骤s103中,计算优先级从高到低排列依次为:第一优先级范句库、第二优先级范句库和第三优先级范句库;

当上一级优先级的范句库中第二编辑距离小于第二阈值的句子个数大于等于m时,则选择第二编辑距离最近的m个句子作为相似句;

当上一级优先级的范句库中第二编辑距离小于第二阈值的句子个数小于m时,则继续计算下一级优先级的范句库中句子与基准句之间的第二编辑距离。

该实施方式中,第一优先级范句库为最高优先级,也即各种课本和教学辅导书中范句为推荐的首选,其次是人工评分挑选出的范句,最后是基于语法模型分析出来的范句。采用该实施方式能够实现优先向学生推荐高质量的范句。

在一种实施例中,以m=5为例。在计算时,首先计算第一优先级范句库中句子与基准句之间的第二编辑距离,当计算完第一优先级范句库中所有的句子后,统计正好有5个句子对应的第二编辑距离小于第二阈值,则选择该5个句子作为相似句,不再选择第二优先级范句库和第三优先级范句库内的句子进行第二编辑距离的计算;当计算完第一优先级范句库中所有的句子后,统计8个(大于5个)句子对应的第二编辑距离小于第二阈值,则在这8个句子中按计算得到的第二编辑距离由小到大进行排序,选取排序中的前5个句子作为相似句,不再选择第二优先级范句库和第三优先级范句库内的句子进行第二编辑距离的计算;当计算完第一优先级范句库中所有的句子后,统计有2个(小于5个)句子对应的第二编辑距离小于第二阈值,则选择该2个句子作为相似句,然后在第二优先级范句库中选择相似句,如果在计算后得到3个相似句的话则不再对第三优先级范句库内的句子进行第二编辑距离的计算,如果在计算后得到的相似句小于3个的话,则需要对第三优先级范句库内的句子进行第二编辑距离的计算。

在一种实施例中,图2为本发明实施例提供的手写作文的批阅方法流程图二,如图2所示,还包括:

步骤s105:以待批阅作文文本为基准文,在范文数据库中寻找与基准文相似的相似文,范文数据库包括第一优先级范文库、第二优先级范文库和第三优先级范文库,第一优先级范文库包括各种课本和教学辅导书中范文,第二优先级范文库包括人工评分挑选出的范文,第三优先级范文库包括基于语法模型分析出来的范文,包括:

计算第一优先级范文库、第二优先级范文库和第三优先级范文库中的文章与基准文之间的第三编辑距离;可选的,第三编辑距离为基准文与范文库中的文章之间相互转化的最少的操作次数。操作可以为字符的插入、删除、替换;其中,在计算操作次数时:插入一个字符、删除一个字符、替换一个字符均记为一次操作。第三编辑距离也体现了两个文章之间的相近程度,第三编辑距离越小,则两个文章之间的相似程度越高。

选择第三编辑距离小于第三阈值的n个文章作为相似文,n为正整数,且n≥1;本发明中对于第三阈值的大小不做具体的限定,实际中可根据具体需求进行选择。该步骤中范文数据库为预先建立的数据库,在此步骤中直接调用即可。

步骤s104:生成批阅结果,还包括:将相似文推荐给待批阅作文文本对应的学生。

该实施方式能够实现针对性的将范文推荐给学生,学生能够对范文进行学习借鉴,并且能够有利于提升学生的知识储备。

可选的,步骤s105中具体包括:计算优先级从高到低排列依次为:第一优先级范文库、第二优先级范文库和第三优先级范文库;

当上一级优先级的范文库中第三编辑距离小于第三阈值的文章个数大于等于n时,则选择第三编辑距离最近的n个文章作为相似文;

当上一级优先级的范文库中第三编辑距离小于第三阈值的文章个数小于n时,则继续计算下一级优先级的范文库中文章与基准文之间的第三编辑距离。

该实施方式中,第一优先级范文库为最高优先级,也即各种课本和教学辅导书中范文为推荐的首选,其次是人工评分挑选出的范文,最后是基于语法模型分析出来的范文。采用该实施方式能够实现优先向学生推荐高质量的范文。

在一种实施例中,以n=5为例。在计算时,首先计算第一优先级范文库中文章与基准文之间的第三编辑距离,当计算完第一优先级范文库中所有的文章后,统计正好有5个文章对应的第三编辑距离小于第三阈值,则选择该5个文章作为相似文,不再选择第二优先级范文库和第三优先级范文库内的文章进行第三编辑距离的计算;当计算完第一优先级范文库中所有的文章后,统计8个(大于5个)文章对应的第三编辑距离小于第三阈值,则在这8个文章中按计算得到的第三编辑距离由小到大进行排序,选取排序中的前5个文章作为相似句,不再选择第二优先级范文库和第三优先级范文库内的文章进行第三编辑距离的计算;当计算完第一优先级范文库中所有的文章后,统计有2个(小于5个)文章对应的第三编辑距离小于第三阈值,则选择该2个文章作为相似句,然后在第二优先级范文库中选择相似文,如果在计算后得到3个相似文的话则不再对第三优先级范文库内的文章进行第三编辑距离的计算,如果在计算后得到的相似文小于3个的话,则需要对第三优先级范文库内的文章进行第三编辑距离的计算。

在一种实施例中,图3为本发明实施例提供的手写作文的批阅方法流程图三,如图3所示,还包括:

步骤s106:获取待批阅作文文本对应的学生信息,待批阅作文文本和学生信息一一对应,学生信息至少包括:学生姓名、学生年级、学生班级;

步骤s107:基于预置词典判断待批阅作文文本是否有拼写错误;当应用于中文手写作文时,预置中文词典;当当应用于英文手写作文时,预置英文词典。可选的,可以应用编辑距离的方式来查找拼写错误,基于编辑距离判断相似度为1时,则判断基本没有拼写错误。

步骤s104:生成批阅结果,还包括:根据学生信息将一个班级或者一个年级的拼写错误进行统计生成第一统计表。可选的,第一统计表中可以统计出出现错误最多的拼写错误以及这些拼写错误对应的学生,根据第一统计表,教师可以针对性的进行辅导,从而提升学生的作文水平。

在一种实施例中,图4为本发明实施例提供的手写作文的批阅方法流程图四,如图4所示,还包括:

步骤s106:获取待批阅作文文本对应的学生信息,待批阅作文文本和学生信息一一对应,学生信息至少包括:学生姓名、学生年级、学生班级;

步骤s108:基于语法模型判断待批阅作文文本是否有语法错误;其中,语法模型可以采用现有技术中的语法模型来实现,比如可以选用简单的主、谓、宾语法模型,来判断句子中是否有主、谓、宾语的缺失,从而判断是否有语法错误。

步骤s104:生成批阅结果,还包括:根据学生信息将一个班级或者一个年级的语法错误进行统计生成第二统计表。可选的,第二统计表中可以统计出出现最多的语法错误以及这些语法错误对应的学生,根据第二统计表,教师可以针对性的进行辅导,从而提升学生的作文水平。

基于同一发明构思,本发明还提供一种手写作文的批阅系统,可以适用于英文手写作文也可以适用于中文手写作文。图5为本发明实施例提供的手写作文的批阅系统框图一,如图5所示,包括:文本识别模块10、聚类分析模块20、相似句选取模块30、批阅结果生成模块40;其中,

文本识别模块10,用于获取待批阅手写作文图片,基于深度学习的手写文字识别技术,识别待批阅手写作文图片生成待批阅作文文本;

聚类分析模块20,与文本识别模块10相连接,用于对待批阅作文文本的每一个段落分别进行聚类分析确定问题段落,问题段落包括第一类问题段落和第二类问题段落,聚类分析模块20包括第一编辑距离计算子模块21和问题段落划分子模块22;其中,

第一编辑距离计算子模块21,用于选取段落的第一句为中心句,计算段落中剩余句子与中心句之间的第一编辑距离;可选的,第一编辑距离为中心句与段落中一个剩余句子之间相互转化的最少的操作次数;操作可以为字符的插入、删除、替换;其中,在计算操作次数时:插入一个字符、删除一个字符、替换一个字符均记为一次操作。

问题段落划分子模块22,用于将第一编辑距离大于第一阈值范围的最大值的句子所在的段落判定为第一类问题段落,第一类问题段落为第一类需要修改和提升的问题段落;还用于将第一编辑距离小于第一阈值范围的最小值的句子所在的段落判定为第二类问题段落,第二类问题段落为第二类需要修改和提升的问题段落;

第一编辑距离体现了两个句子之间的相近程度,即段落中其他的句子与该段落的第一句之间的相近程度。第一编辑距离越大,则两个句子之间的相近程度越远;第一编辑距离越小,则两个句子之间越相近。其中,第一阈值范围为第一编辑距离不是特别大,也不是特别小的一个范围,本发明对于具体的第一阈值范围不做限定,实际中可以根据具体需求来确定。

如果第一编辑距离过大,则说明两个句子之间相近程度非常远,该文章段落中可能存在跑题的问题,本发明将第一编辑距离大于第一阈值范围的最大值的句子所在的段落判定为第一类问题段落,在后续中可以通过计算针对该类段落推荐范句来帮助提升学生的作文水平。

如果第一编辑距离过小,则说明两个句子之间非常相近,表明句子和段落的中心句重合或者几乎重复,说明该段落中句法多样性差,遣词造句的表现差,本发明将一编辑距离小于第一阈值范围的最小值的句子所在的段落判定为第二类问题段落,在后续中可以通过计算针对该类段落推荐范句来帮助提升学生的作文水平。

相似句选取模块30,与聚类分析模块20相连接,用于选取问题段落的第一句为基准句,在范句数据库中寻找与基准句相似的相似句,范句数据库包括第一优先级范句库、第二优先级范句库和第三优先级范句库,第一优先级范句库包括各种课本和教学辅导书中范句,第二优先级范句库包括人工评分挑选出的范句,第三优先级范句库包括基于语法模型分析出来的范句,相似句选取模块30包括第二编辑距离计算子模块31和相似句生成子模块32;其中,

第二编辑距离计算子模块31,用于计算第一优先级范句库、第二优先级范句库和第三优先级范句库中的句子与基准句之间的第二编辑距离;可选的,第二编辑距离为基准句与范句库中的句子之间相互转化的最少的操作次数。操作可以为字符的插入、删除、替换;其中,在计算操作次数时:插入一个字符、删除一个字符、替换一个字符均记为一次操作。第二编辑距离也体现了两个句子之间的相近程度,第二编辑距离越小,则两个句子之间的相似程度越高。

相似句生成子模块32,用于选择第二编辑距离小于第二阈值的m个句子作为相似句,m为正整数,且m≥1;本发明中对于第二阈值的大小不做具体的限定,实际中可根据具体需求进行选择。对于第一类问题段落,能够在范句数据库中寻找与第一类问题段落的第一句相似的相似句,即能够找到与基准句主题相关的句子。对于第二类问题段落,能够在范句数据库中寻找与第二类问题段落的第一句相似的相似句,即能够找到与基准句相关句法更加多样性的句子。

批阅结果生成模块40,与相似句选取模块30相连接,用于生成批阅结果,包括:将相似句推荐给待批阅作文文本对应的学生。对于存在第一类问题段落的作文文本,对学生推荐相似句后,能够帮助学生学习如何把握撰写的主题,避免跑题;对于存在第二类问题段落的作文文本,对学生推荐相似句后,能够帮助学生学习在撰写时能够使用多样性的句法和遣词造句,提升作文水平。

在一种实施例中,图6为本发明实施例提供的手写作文的批阅系统框图二,如图6所示,还包括:

相似文选取模块50,与文本识别模块10相连接,用于以待批阅作文文本为基准文,在范文数据库中寻找与基准文相似的相似文,范文数据库包括第一优先级范文库、第二优先级范文库和第三优先级范文库,第一优先级范文库包括各种课本和教学辅导书中范文,第二优先级范文库包括人工评分挑选出的范文,第三优先级范文库包括基于语法模型分析出来的范文,相似文选取模块50包括第三编辑距离计算子模块51和相似文生成子模块52;其中,

第三编辑距离计算子模块51,用于计算第一优先级范文库、第二优先级范文库和第三优先级范文库中的文章与基准文之间的第三编辑距离;可选的,第三编辑距离为基准文与范文库中的文章之间相互转化的最少的操作次数。操作可以为字符的插入、删除、替换;其中,在计算操作次数时:插入一个字符、删除一个字符、替换一个字符均记为一次操作。第三编辑距离也体现了两个文章之间的相近程度,第三编辑距离越小,则两个文章之间的相似程度越高。

相似文生成子模块52,用于选择第三编辑距离小于第三阈值的n个文章作为相似文,n为正整数,且n≥1;本发明中对于第三阈值的大小不做具体的限定,实际中可根据具体需求进行选择。

批阅结果生成模块40,还用于生成批阅结果,将相似文推荐给待批阅作文文本对应的学生。

在一种实施例中,图7为本发明实施例提供的手写作文的批阅系统框图三,如图7所示,还包括:学生信息获取模块60和拼写错误查找模块70;学生信息获取模块60,用于获取待批阅作文文本对应的学生信息,待批阅作文文本和学生信息一一对应,学生信息至少包括:学生姓名、学生年级、学生班级;拼写错误查找模块70,与文本识别模块10相连接,用于基于预置词典判断待批阅作文文本是否有拼写错误;批阅结果生成模块40,还用于生成批阅结果,根据学生信息将一个班级或者一个年级的拼写错误进行统计生成第一统计表。

在一种实施例中,本发明实施例提供的手写作文的批阅系统还包括:学生信息获取模块和语法判断模块;学生信息获取模块,用于获取待批阅作文文本对应的学生信息,待批阅作文文本和学生信息一一对应,学生信息至少包括:学生姓名、学生年级、学生班级;语法判断模块,用于基于语法模型判断所述待批阅作文文本是否有语法错误;批阅结果生成模块,还用于生成批阅结果,根据所述学生信息将一个班级或者一个年级的语法错误进行统计生成第二统计表。

通过上述实施例可知,本发明提供的手写作文的批阅方法及系统,至少实现了如下的有益效果:

(1)本发明首先通过对待批阅作文文本的每一个段落分别进行聚类分析确定问题段落,然后针对根据问题段落寻找与问题段落中的基准句相似的相似句,最后在批阅结果中将相似句推荐给作文文本对应的学生。能够实现对手写作文的大规模量化处理,减少教师工作负担,提升批阅效率。

(2)对于存在第一类问题段落的待批阅作文文本,对学生推荐相似句后,能够帮助学生学习如何把握撰写的主题,避免跑题;对于存在第二类问题段落的待批阅作文文本,对学生推荐相似句后,能够帮助学生学习在撰写时能够使用多样性的句法和遣词造句,提升作文水平,实现针对性的进行范句推荐来进行教学辅导。

(3)本发明还能够实现针对性的将范文推荐给学生,学生能够对范文进行学习借鉴,能够有利于提升学生的知识储备。

(4)本发明能够根据学生信息将一个班级或者一个年级的拼写错误进行统计生成第一统计表,或者根据学生信息将一个班级或者一个年级的语法错误进行统计生成第二统计表;通过第一统计表或者第二统计表,教师可以针对性的进行辅导,从而提升学生的作文水平。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1