一种非选择题的智能批阅方法与流程

文档序号：11287322阅读：367来源：国知局

本发明应用于计算机辅助阅卷领域。

背景技术：

在计算机辅助阅卷领域，目前常见的技术是先采集试卷的图像信息，之后采用光学识别技术由计算机系统自动批阅选择题，而对于绝大多数非选择题则仍需要阅卷人进行人工批阅。

此外，有一些解决方案，例如(zl201410472818.3)，采用预先训练的通用字符分类器和字符分割算法以及语义分析系统代替人工批阅，但是，由于试卷答案内容的多样性，当答案中含有特殊符号或图形，以及多个字符之间难以分割时的批阅准确率仍然比较低，需要大量的人工干预，所以阅卷的整体效率仍然不高。

技术实现要素：

本发明的目的在于克服当前计算机辅助阅卷技术存在的不足，提出了一种高效率的针对非选择题的批阅方法，可以在没有提前训练分类器的前提下对大多数类型的非选择题实施机器学习算法辅助下的批阅，并且提高了对任意字符和具有特殊形式的答案的答卷的适应性，减少了人工干预的工作量。从而提高了整个阅卷系统的效率。

为了实现以上目的，本发明提出了以下技术方案：

1.获取由答题卡，试卷或作业经过扫描或拍摄生成的图像

2.根据每个题目的标记信息，获取选择题和非选择题分别对应的试题答案图片样本集合

3.对应于某个特定的非选择题，提取的来自不同答题者的试题答案图片样本集合，并将其分为若干批次

4.初始化一个对应这个样本集合的分类器，这个分类器可以由系统参数库存储的参数进行初始化

5.将每个批次的样本依次经过分类器产生粗分类结果

6.将当前批次的粗分类结果由阅卷人审阅，如果有错误，阅卷人在此结果上做出必要的修正

7.当前批次修正完成后，将经过人工修正的最终结果作为参考数据，结合当前批次的样本数据，对分类器进行训练和更新

8.如果还有剩余批次的样本，回到步骤5继续处理

9.样本全部处理完后，将分类器的参数存储到参数库中供以后使用

本发明的积极效果是：

1.由于本发明中的分类器参数可以采用样本自身的数据进行实时训练，可以适应处理带有特殊字符和图形的样本，对含有多个字符的样本无需进行分割，并且避免了预先收集，标定样本的工作量

2.人工修正的结果不仅为最终用户提供输出，同时还可以训练和改进分类器的参数，更高效的利用了阅卷人提供的信息

3.由于随着训练样本数目的增加，分类器的准确性也逐渐提高，因此对阅卷人来说，越到后面的批次，需要的人工干预越少。对于样本数目比较多的场景，此方法可以显著减少阅卷人的工作量

4.经过训练的分类器参数，可以为以后同类型的题目阅卷使用，进一步提高了综合的阅卷效率

以下提供本发明一种非选择题的智能批阅方法的具体实施方式，并提供2个实施例，但本发明不限于所提供的实施例。

实施例1：

此系统通过阅卷客户端进行操作。

教师或操作员编辑生成试卷或答题卡模板，同时通过阅卷客户端将各个试题答案的类型和位置信息存入数据库中。

阅卷人或操作员通过扫描仪将试卷或答题卡图像批量扫描生成试卷图片样本集合。

通过阅卷客户端读取扫描生成的试卷图片样本集合，从试卷图片样本集合中获取试卷编号，学生编号及其他相关信息。并根据数据库中存储的题目类型和位置信息分离出选择题和非选择题的试题答案图片样本集合。

将选择题对应的试题答案图片样本集合由选择题识别模块处理，将结果存储在数据库中。

客户端将每一个非选择题对应的试题答案图片样本集合分为若干批次。

客户端初始化一个基于机器学习技术的分类器，其结构按照试题答案图片的大小和输出结果的种类来确定。如果数据库中已经存在同一个试题的分类器训练结果，则用数据库中存储的参数进行初始化。

客户端将每个批次的样本数据逐次经过上述分类器进行分类，其结果输出在客户端的窗口，由阅卷人进行修正。

将阅卷人修正后的结果存入数据库中。

经过人工修正后的阅卷结果和样本数据作为分类器的参考和训练数据，更新分类器的模型参数。

当前试题的全部样本处理结束后，将此试题对应的分类器模型参数存入数据库，再处理下一个非选择题对应的试题答案图片样本集合。

当试卷图片样本集合上的全部或部分试题处理完毕后，统计试卷分数和其他试卷数据，将结果存储在数据库中，并按用户需求输出报告。

实施例2：

此系统部署在阅卷服务器上，由操作人通过浏览器进行操作。

教师或操作员编辑生成试卷或答题卡模板，将试卷或答题卡模板上传到服务器上，通过浏览器将各个试题答案的类型和位置信息标定并记录在服务器端的数据库上。

阅卷人或操作员通过扫描仪将试卷或答题卡图像批量扫描生成试卷图片样本集合并上传到服务器端。

服务器端的程序读取扫描生成的试卷图片样本集合，从试卷图片样本集合中获取试卷编号，学生编号及其他相关信息。并根据数据库中存储的题目类型和位置信息分离出选择题和非选择题的试题答案图片样本集合。

将选择题对应的试题答案图片样本集合由选择题识别模块处理，将结果存储在数据库中。

服务器端的程序将每一个非选择题对应的试题答案图片样本集合分为若干批次。

服务器端初始化一个基于机器学习技术的分类器，其结构按照试题答案图片的大小和输出结果的种类来确定。如果数据库中已经存在同一个试题的分类器训练结果，则用数据库中存储的参数进行初始化。

服务器端的程序将每个批次的样本数据逐次经过上述分类器进行分类，其结果输出到浏览器，由阅卷人进行修正。

将阅卷人修正后的结果存入数据库中。

经过人工修正后的阅卷结果和样本数据作为分类器的参考和训练数据，更新分类器的模型参数。

当前试题的全部样本处理结束后，将此试题对应的分类器模型参数存入数据库，再处理下一个非选择题对应的试题答案图片样本集合。

当试卷图片样本集合上的全部或部分试题处理完毕后，统计试卷分数和其他试卷数据，将结果存储在数据库中，并按用户需求输出报告。

技术特征：

技术总结
一种非选择题的智能批阅方法，此发明应用于计算机辅助阅卷领域，可以为各类学校和考试机构提高阅卷的效率。目前在计算机辅助阅卷领域，对于绝大多数非选择题的批阅，仍然需要大量的人工干预，所以阅卷的整体效率不高。本发明将来自不同答题者的试题答案图片样本集合分为若干批次，依次经过分类器产生粗分类结果，然后由阅卷者审阅和修正，修正后的结果用来对分类器进行训练和更新，从而产生更有效的分类器供其他批次的样本使用。本发明能够在没有提前训练分类器的前提下对大多数类型的非选择题实施机器学习算法辅助下的批阅，减少了阅卷人的工作量，提高了整个阅卷系统的效率。

技术研发人员：朱宁
受保护的技术使用者：联阅科技（北京）有限公司
技术研发日：2017.05.14
技术公布日：2017.09.22

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱宁
技术所有人：联阅科技（北京）有限公司
我是此专利的发明人

上一篇：用于地下地层操作的薄层光谱电化学池的制造方法与工艺
上一篇：用于维持传感器准确度的设备、系统和方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。