一种试卷信息处理方法、系统、计算机及存储介质

文档序号:36791522发布日期:2024-01-23 12:10阅读:21来源:国知局
一种试卷信息处理方法、系统、计算机及存储介质

本技术涉及数据处理,特别是涉及一种试卷信息处理方法、系统、计算机及存储介质。


背景技术:

1、随着信息化、大数据的不断发展,线下教育与线上教育的融合已愈发密切,利用大数据驱动可提供更为精准的教育服务。

2、大数据驱动的先决条件是需要获取到足够的底层数据,而学生在线下完成的大量的纸质试卷,通过对其进行信息收集,再对收集的信息进行提取、分析后,即可作为底层数据的供应源,进而完成个性化教育的大数据驱动,如薄弱知识点推荐、错题汇总等。

3、纸质试卷的信息处理虽属于文本信息处理的一种,但其与常规的文本信息处理不同之处在于,其存在较多图表、插图等非文字内容及字符大小不一的情况,在框选并提取纸质试卷上的文本信息时,容易导致文本框框选的内容不够精确,造成信息处理错漏的情况。


技术实现思路

1、本技术实施例提供了一种试卷信息处理方法、系统、计算机及存储介质,以解决现有技术中对纸质试卷进行信息处理时,因存在较多图表、插图等非文字内容及字符大小不一的情况,在框选并提取纸质试卷上的文本信息时,易导致文本框框选的内容不够精确,造成信息处理错漏的技术问题。

2、第一方面,本技术实施例提供了一种试卷信息处理方法,包括以下步骤:

3、获取试卷图像,对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框;

4、判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组,并将若干个所述重叠矩形框组组合为若干个聚合矩形框;

5、基于所述试卷图像的宽度及高度,计算若干个所述独立矩形框与所述试卷图像之间的独立宽度比及独立高度比,并计算若干个所述聚合矩形框与所述试卷图像之间的待验宽度比及待验高度比;

6、通过所述独立宽度比及所述独立高度比确定标准宽度比及标准高度比,将所述待验宽度比与所述标准宽度比进行比对,并将所述待验高度比与所述标准高度比进行比对,以从若干个所述聚合矩形框中筛选出无效框,剔除所述无效框;

7、将剔除所述无效框后的若干个所述聚合矩形框及若干个所述独立矩形框均选定为候选矩形框,对若干个所述候选矩形框进行字符判别,以从若干个所述候选矩形框中确定若干个字符框;

8、对若干个所述字符框进行合并处理,以获取文本框,基于所述文本框对所述试卷图像进行信息处理。

9、进一步地,所述对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框的步骤包括:

10、对所述试卷图像进行灰度处理及边缘检测,以获取二值化图像;

11、于所述二值化图像中选取标定像素值的像素点为起始点,将与所述起始点相邻的像素点判定为相邻点;

12、判断所述相邻点的像素值是否为所述标定像素值,以从若干个所述相邻点中选定连接点;

13、将所述起始点与所述连接点组合为与字符对应的字符区域;

14、于所述二值化图像内确定若干个所述字符区域,基于所述字符区域获取初始矩形框。

15、进一步地,所述初始矩形框的获取公式为:

16、,

17、其中,表示初始矩形框的第一角点,表示字符区域中起始点及连接点于像素坐标内x轴的最小值,表示字符区域中起始点及连接点于像素坐标内y轴的最小值;

18、,

19、其中,表示初始矩形框的第二角点,表示字符区域中起始点及连接点于像素坐标内x轴的最大值,表示字符区域中起始点及连接点于像素坐标内y轴的最大值;

20、,

21、其中,表示初始矩形框的宽,表示初始矩形框的第二角点的横坐标,表示初始矩形框的第一角点的横坐标;

22、,

23、其中,表示初始矩形框的高,表示初始矩形框的第二角点的纵坐标,表示初始矩形框的第一角点的纵坐标。

24、进一步地,所述判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组的步骤包括:

25、将其一所述初始矩形框选定为待判断框,并将所述待判断框与其他的所述初始矩形框之间分别进行重叠计算,以获取若干个交叠比;

26、将若干个所述交叠比分别与第一重叠阈值进行比对;

27、若所述交叠比大于所述第一重叠阈值,则将与大于所述第一重叠阈值的交叠比对应的所述初始矩形框判定为相交框,并将所述待判断框与所述相交框组合为重叠矩形框组;

28、若全部的所述交叠比均小于所述第一重叠阈值,则将所述待判断框判定为独立矩形框。

29、进一步地,所述交叠比的计算公式为:

30、,

31、其中,表示交叠比,表示第i个待判断框,表示第j个初始矩形框。

32、进一步地,所述对若干个所述字符框进行合并处理的步骤具体为:

33、计算两所述字符框之间的最小重力距离及垂直重叠;

34、将所述最小重力距离与距离阈值进行比对,并将所述垂直重叠与第二重叠阈值进行比对;

35、若所述最小重力阈值小于所述距离阈值,且所述垂直重叠小于所述第二重叠阈值,则合并两所述字符框。

36、第二方面,本技术实施例提供了一种试卷信息处理系统,应用于如上述技术方案中的试卷信息处理方法,所述系统包括:

37、预处理模块,用于获取试卷图像,对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框;

38、判断模块,用于判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组,并将若干个所述重叠矩形框组组合为若干个聚合矩形框;

39、校验模块,用于基于所述试卷图像的宽度及高度,计算若干个所述独立矩形框与所述试卷图像之间的独立宽度比及独立高度比,并计算若干个所述聚合矩形框与所述试卷图像之间的待验宽度比及待验高度比;

40、筛选模块,用于通过所述独立宽度比及所述独立高度比确定标准宽度比及标准高度比,将所述待验宽度比与所述标准宽度比进行比对,并将所述待验高度比与所述标准高度比进行比对,以从若干个所述聚合矩形框中筛选出无效框,剔除所述无效框;

41、识别模块,用于将剔除所述无效框后的若干个所述聚合矩形框及若干个所述独立矩形框均选定为候选矩形框,对若干个所述候选矩形框进行字符判别,以从若干个所述候选矩形框中确定若干个字符框;

42、执行模块,用于对若干个所述字符框进行合并处理,以获取文本框,基于所述文本框对所述试卷图像进行信息处理。

43、第三方面,本技术实施例提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的试卷信息处理方法。

44、第四方面,本技术实施例提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面所述的试卷信息处理方法。

45、相比于现有技术,本发明的有益效果在于:在完成对所述试卷图像的全部字符的框选后,通过判断所述初始矩形框之间是否存在交叠情况,进而对所述交叠矩形框组进行合并后,可完成对不同大小的字符的全部框选,进而通过对聚合矩形框进行过滤处理,可排除所述试卷图像中较大的矩形区域,即排除所述试卷图像中图表、插图等对文字信息提取的干扰,有效的提高了对文字信息获取的精度,通过对所述候选矩形框进行字符判别,进一步过滤干扰信息,进而通过对相近字符框的合并形成的所述文本框,完成对文字信息的准确捕获,避免信息处理错漏的情况。

46、本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1