一种试卷图像信息提取方法

文档序号:34105274发布日期:2023-05-10 19:41阅读:330来源:国知局
一种试卷图像信息提取方法

本发明涉及图像处理,尤其涉及一种试卷图像信息提取方法。


背景技术:

1、随着科技的不断发展,教学方式的不断更新,智能教育理念逐渐进入教学平台,对于学生的测试也有了不同的模式,各种线上教育平台、在线考试系统也逐渐开始应用在教学活动中,而这些考试系统也从教师人工阅卷逐渐向系统自动阅卷变化,这意味着平时的课堂测验甚至可以由学生自查自检,节省教师大量时间和精力。

2、现有系统主要采用两种模式,一种是无纸化,考生直接在线上进行测试;另一种是纸质试卷,将试卷图像上传系统进行批阅。前者实时性高,但需要考生拥有一定的硬件设备,且系统建设、维护成本高。对于后者,普通的扫描仪采集的图像质量较高,但不够便捷;拍照方式方便,但影响因素较多,采集的图像质量较低,所以需要图像处理技术增强试卷图像质量。因此针对第二种模式,在系统对试卷图像的处理阶段需要加以改善。

3、而对于试卷中版面、内容千变万化的情况,需要一种更智能的方式进行处理。目前主要采用模板匹配的方法提取试卷上的信息,但是试卷分为不同科目,不同科目的试卷版式结构不同,所要提取的信息不同,导致试卷的版式和结构存在较大差异,并且试卷在图像采集过程中存在尺度的多样性和采集条件的差异性,导致现有的试卷信息提取方法无法适用于所有的试卷结构和采集条件,使得试卷信息提取的效率较低。


技术实现思路

1、本发明所要解决的技术问题是克服现有技术中存在的不足,提供一种通用的自动化试卷图像信息提取方法,提高试卷信息提取的准确度,从而进一步提高试卷批阅的效率和实用性。

2、本发明是通过以下技术方案予以实现:

3、一种试卷图像信息提取方法,包括如下步骤:

4、s1.获取试卷图像,对所述试卷图像进行预处理;

5、s2.对所述试卷图像中的试卷元素进行检测识别,获得试卷元素的坐标信息和文本信息;

6、s3.基于所述试卷元素构建图网络模型,并训练所述图网络模型;

7、s4.根据图网络模型进行试卷信息提取。

8、根据上述技术方案,优选地,步骤s1中,通过电子设备拍摄,或通过扫描仪扫描,获得试卷图像。

9、根据上述技术方案,优选地,步骤s1包括:将获取的拍摄图像或扫描图像上传到系统,成为试卷原始图像;以空白试卷作为模版图像,对所述试卷原始图像通过关键点与特征描述符进行图像配准;按照图像配准后的所述试卷原始图像和模版图像的匹配点,计算出所述试卷原始图像和模版图像的对应关系,进行图像矫正变换。

10、根据上述技术方案,优选地,步骤s1还包括:对图像矫正变换后的试卷图像进行二值化处理,增强图像信息。

11、根据上述技术方案,优选地,步骤s1中“图像配准”包括:将所述试卷原始图像与模版图像分别放入神经网络中,分别检测出特征点和特征描述符;分别对检测出的所述特征点和特征描述符进行整合,得到特征点的匹配描述符,通过计算找到图像间的最佳匹配,实现图像配准。

12、根据上述技术方案,优选地,步骤s2包括:对所述试卷图像进行检测,得到各所述试卷元素的检测框并获得坐标信息;根据所述检测框的坐标信息,将各试卷元素的图像从整张试卷中截取出来,分别输入到文字识别模型中;通过所述文字识别模型,对试卷元素的图像进行识别,得到相应的文本信息。

13、根据上述技术方案,优选地,步骤s3包括:基于所述试卷元素的视觉和语义关系构造图网络模型;对所述试卷图像中的各试卷元素进行标注,并对各试卷元素进行特征提取,获得图网络模型训练数据;训练所述图网络模型。

14、根据上述技术方案,优选地,步骤s4包括:利用经过训练的图网络模型,实现各试卷元素中多模态信息的特征融合,使试卷元素间生成语义上相关联的深层信息;对各试卷元素的类型标记进行分类预测;根据分类预测得出的类型标记,可分析提取出试卷信息。

15、本发明的有益效果是:

16、本发明实现了一个通用的自动化试卷图像信息提取方法,通过对任意电子设备获取的试卷图像进行预处理,然后自动提取出答题人信息、答题区域等试卷信息,为后续手写答题识别与自动评分任务做准备;有效提高试卷信息提取的准确度,同时优化现有系统的一些缺陷,提高对试卷的处理效率,适用于教育活动中课堂测验、作业批改等场景,具有较高的应用推广价值。



技术特征:

1.一种试卷图像信息提取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述一种试卷图像信息提取方法,其特征在于,步骤s1中,通过电子设备拍摄,或通过扫描仪扫描,获得试卷图像。

3.根据权利要求1所述一种试卷图像信息提取方法,其特征在于,步骤s1包括:

4.根据权利要求3所述一种试卷图像信息提取方法,其特征在于,步骤s1还包括:

5.根据权利要求3或4所述一种试卷图像信息提取方法,其特征在于,步骤s1中“图像配准”包括:

6.根据权利要求1所述一种试卷图像信息提取方法,其特征在于,步骤s2包括:

7.根据权利要求1、2、4、6中任意一项的所述一种试卷图像信息提取方法,其特征在于,步骤s3包括:

8.根据权利要求7所述一种试卷图像信息提取方法,其特征在于,步骤s4包括:


技术总结
本发明涉及一种试卷图像信息提取方法,包括如下步骤:获取试卷图像,对试卷图像进行预处理;对试卷图像中的试卷元素进行检测识别,获得试卷元素的坐标信息和文本信息;基于试卷元素构建图网络模型并训练;根据图网络模型进行试卷信息提取。本发明实现了一个通用的自动化试卷图像信息提取方法,通过对任意电子设备获取的试卷图像进行预处理,然后自动提取出答题人信息、答题区域等试卷信息,为后续手写答题识别与自动评分任务做准备;有效提高试卷信息提取的准确度,同时优化现有系统的一些缺陷,提高对试卷的处理效率,适用于教育活动中课堂测验、作业批改等场景,具有较高的应用推广价值。

技术研发人员:朱远平,周迎,李胜楠
受保护的技术使用者:天津师范大学
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1