一种试卷分数自动统计方法、装置、电子设备及存储介质与流程

文档序号：15387761发布日期：2018-09-08 00:46阅读：277来源：国知局

本发明涉及图像处理技术领域，具体为一种试卷分数自动统计方法、装置、电子设备及存储介质。

背景技术：

考试阅卷环节中，教师通过在纸质试卷上进行手工批阅，填写每道题目的所得分数，批阅完成后，教师人工计算出每位考生的总分数，并对所有考生的分数进行统计汇总，分数统计包括得分统计、各试题的得分情况、难易程度以及试卷的区分度以及试卷的信度等，该人工统计试卷分数的过程使得教师需要耗费较多的时间和精力，增加了教师的工作量。

现有技术中，也存在使用到答题卡，通过机器识别答题卡计算出答题卡中题目的分数，并进行统计汇总，然后答题卡的适用范围有限，仅限于试卷中的选择题，而无法统计其他类型的试题的分数，而且答题卡较于现有传统试卷，成本也提高了不少。

技术实现要素：

为了克服现有技术的不足，本发明的目的之一在于提供一种试卷分数自动统计方法，其通过对试卷进行图像采集，进而自动识别各题分数，以实现对试卷分数的统计分析。

本发明的目的之二在于提供一种试卷分数自动统计装置，其通过对试卷进行图像采集，进而自动识别各题分数，以实现对试卷分数的统计分析。

本发明的目的之三在于提供一种实现上述试卷分数自动统计方法的电子设备。

本发明的目的之四在于提供一种存储上述试卷分数自动统计方法的计算`可读存储介质。

为实现上述目的之一，本发明提供如下技术方案：

一种试卷分数自动统计方法，包括以下步骤：

对目标试卷进行图像采集，获取初始图像；

对所述初始图像进行拟合，以获取初始图像中的目标数字区域图像，所述目标数字区域图像为包括多个手写数字的拟合图像；

通过积分质心法对所述拟合图像进行分割，得到分割图像，所述分割图像的个数为预设类别的数量；

应用mnist数据集作为训练样本，对单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett；

依据单个手写数字识别算法模型lenet-5和双位手写数字识别算法模型lenett对每个分割图像进行识别，得到目标分数；

将所述目标分数按照预设类别的顺序进行存储，并对所述目标分数进行统计分析。

优选地，所述对所述初始图像进行拟合，以获取初始图像中的目标数字区域图像，包括：

将初始图像的颜色空间转换为rgb色彩空间；

对所述rgb色彩空间的初始图像的r，g，b三个通道的图像按照公式(1)所示进行拟合，得到拟合图像：

f＝{k1*r+k2*g+k3*b|k∈[-2-1012]}(1)

其中，f为拟合图像；k为拟合系数，k＝k1，k2，k3；k1、k2、k3分别为r，g，b三个通道的图像的拟合系数，r、g、b分别为初始图像在rgb色彩空间下的各通道的图像；

选取拟合图像中手写分数和背景之间分离的一张，作为目标数字区域图像。

优选地，所述得到拟合图像之后还包括：

消除拟合系数冗余项的拟合图像，所述消除的拟合系数冗余项的拟合图像为：

f＝{k1*r+k2*g+k3*b|k1＝k2＝k3}。

优选地，所述通过积分质心法对所述拟合图像进行分割，得到分割图像，包括：

将所述目标数字区域图像进行二值化处理；

应用积分质心法计算目标数字区域图像的质心；

根据质心位置将目标数字区域图像沿质心位置的y轴方向进行分割，对分割后的目标数字区域图像应用积分质心法进行再次求质心操作，得到分割后的目标数字区域图像的两个质心，记为分割质心；

按照分割质心的连线计算整个目标数字区域图像的旋转角度，对所述目标数字区域图像进行旋转，获取矫正后的目标数字区域图像；

确定矫正后的目标数字区域图像的x轴上的两条边界线和y轴上的两条边界线，这些边界线组成目标数字区域图像的矩形区域；

依据二值化处理后的目标数字区域图像确定所述矩形区域对应的相应数值区域，给出非零像素点的分布规律；

在像素点为零的位置做切割线，将所述矩形区域分割成预设类别数量的子区域，每个子区域内的图像构成分割图像。

优选地，所述应用mnist数据集作为训练样本，对单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett，包括：

将mnist数据集中的任意两个数字进行组合，组合后的双位数字构成目标训练样本，输入单个手写数字识别算法模型lenet-5进行训练，生成双位手写数字识别算法模型lenett。

优选地，依据单个手写数字识别算法模型lenet-5和双位手写数字识别算法模型lenett对每个分割图像进行识别，得到目标分数，包括：

步骤51、将目标分割图像输入单个手写数字识别算法模型lenet-5中进行识别，如果识别结果的精确度不小于预设阈值，则单个手写数字识别算法模型lenet-5识别获取的图像数字即为所述目标分割图像对应的目标分数，如果所述识别结果的精确度小于预设阈值，则执行步骤52的操作；所述目标分割图像为待识别的分割图像；

步骤52、将目标分割图像输入双位手写数字识别算法模型lenett中进行识别，所述双位手写数字识别算法模型lenett识别获取的图像数字即为所述目标分割图像对应的目标分数。

优选地，所述对所述目标分数进行统计分析包括以下的一种或多种：

对所述目标试卷内的各个目标分数进行求和，获取所述目标试卷的成绩；

对多个同类型的目标试卷相应类别的目标分数依据正态分布的形式进行拟合，并给出该多个同类型的目标试卷每个类别的平均值和方差，所述类别为题号。

本发明的目的之二采用如下技术方案实现：

一种试卷分数自动统计装置，其包括：

图像采集模块，用于对目标试卷进行图像采集，获取初始图像；

拟合模块，用于对所述初始图像进行拟合，以获取初始图像中的目标数字区域图像，所述目标数字区域图像为包括多个手写数字的拟合图像；

分割模块，用于通过积分质心法对所述拟合图像进行分割，得到分割图像，所述分割图像的个数为预设类别的数量；

训练模块，用于应用mnist数据集作为训练样本，对单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett；

识别模块，用于依据单个手写数字识别算法模型lenet-5和双位手写数字识别算法模型lenett对每个分割图像进行识别，得到目标分数；

分析模块，用于将所述目标分数按照预设类别的顺序进行存储，并对所述目标分数进行统计分析。

本发明的目的之三采用如下技术方案实现：

一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明目的之一的试卷分数自动统计方法。

本发明的目的之四采用如下技术方案实现：

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明目的之一的。

与现有技术相比，本发明试卷分数自动统计方法、装置、电子设备及存储介质，其有益效果在于：

1、本发明通过对试卷进行图像采集，利用图像处理算法实现对试卷分数的自动统计，最终对各个试题得分的统计分析，同时对试题的难度、区分度以及试卷的信度进行计算和分析，为快速准确地统计学生考试信息，准确的评估试卷，评估教学效果提供有效参考，同时为后续教学提供良好的技术指导，适应现代化的管理，提高教师工作效率和教学质量。

2、通过拟合算法选取目标数字区域图像，可以获取更为准确的手写分数图像，保证后续识别过程的准确性。

3、通过积分质心法实现各个试题分数图像的分割，实现各个试题分数的单独识别。

4、构建双位手写数字识别算法模型lenett，可以实现双位试题分数的识别，同时采用单个手写数字识别算法模型lenet-5相结合的方式，相较于直接采用向量机方式，速度更快，结果更准确。

附图说明

图1为本发明实施例一的试卷分数自动统计方法的流程图；

图2为采集到的初始图像的示意图；

图3为初始图像经过拟合获取的目标数字区域图像的示意图；

图4为目标数字区域图像二值化后的示意图；

图5为广义积分计算的原理图；

图6为目标数字区域图像旋转和精准定位的结果示意图；

图7为矩形区域的结构示意图；

图8为非零像素点的分布规律及分割图像的示意图；

图9为本发明实施例二的试卷分数自动统计装置的结构原理图；

图10为本发明实施例三的电子设备的结构原理图。

具体实施方式

下面，结合附图以及具体实施方式，对本发明做进一步描述，需要说明的是，在不相冲突的前提下，以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

实施例一

请参照图1所示，一种试卷分数自动统计方法，其包括以下步骤：

步骤1、对目标试卷进行图像采集，获取初始图像。

目标试卷即为要进行统计分数的试卷，可以是一张试卷，也可以是同一类型(即一个班级一个年级同一类型，例如语文试卷)的多张试卷，这里以一张试卷作为目标试卷的分数统计为例进行解释和说明。

将图像采集设备采集到的目标试卷的图像获取初始图像，以图2所示初始图像为例，将该初始图像存储至存储设备，以备步骤2中的拟合过程的调用，图像采集与存储的过程与识别的过程采用双线程。

步骤2、对所述初始图像进行拟合，以获取初始图像中的目标数字区域图像，所述目标数字区域图像为包括多个手写数字的拟合图像。

步骤2的拟合过程是通过三通道拟合，根据拟合结果选择目标数字区域图像。其具体包括以下步骤：

步骤21、将初始图像的颜色空间转换为rgb色彩空间。

根据教学要求试卷批改使用红色笔，将对应的颜色空间转换为rgb色彩空间。

步骤22、对所述rgb色彩空间的初始图像的r，g，b三个通道的图像按照公式(1)所示进行拟合，得到拟合图像：

f＝{k1*r+k2*g+k3*b|k∈[-2-1012]}(1)

公式(1)中，f为拟合图像；k为拟合系数，k＝k1，k2，k3；k1、k2、k3分别为r，g，b三个通道的图像的拟合系数，r、g、b分别为初始图像在rgb色彩空间下的各通道的图像；在获取拟合图像过程中，需要消除拟合系数冗余项的拟合图像，即消除重复或者无用的拟合图像，消除的拟合图像例如是f＝{k1*r+k2*g+k3*b|k1＝k2＝k3}和f＝{k1*r+k2*g+k3*b|k1＝k2＝k3＝0}等，可将三通道图像扩展为49帧图像，将拟合后的图像归一化到0～255范围。

步骤23、选取拟合图像中手写分数和背景之间分离的一张，作为目标数字区域图像，上述图2经过拟合得到的图像如图3所示。

步骤3、通过积分质心法对所述拟合图像进行分割，得到分割图像，所述分割图像的个数为预设类别的数量。

其具体包括以下步骤：

步骤31、将所述目标数字区域图像进行二值化处理。

二值化过程中选择的阈值为100。二值化后得到的图像如图4所示。

步骤32、应用积分质心法计算目标数字区域图像的质心。

处理后的二值化图像表示为矩阵的形式为f(x,y)，x，y分别表示像素点的坐标，图像的坐标系原点为左上角。矩形区域的x轴方向广义质心积分为y轴方向的积分为因此，(xi,yj)的广义积分质心如图5所示的1，2，3，4四个区域。其中第4区域的矩形顶点为a，b，c，d。如果需要求d区域的广义质心积分sum(d)＝ψ(d)-ψ(b)-ψ(c)+ψ(a)。d区域的x轴方向质心可以表示为y轴方向的质心为根据质心求解如图3所示质心，然后根据质心位置将图像沿质心位置的y轴方向进行分割，对分割区域重新进行质心求解。图3中的原点(直线上的两个端点)即为经过两次计算获得的质心。

步骤33、根据质心位置将目标数字区域图像沿质心位置的y轴方向进行分割，对分割后的目标数字区域图像应用积分质心法进行再次求质心操作，得到分割后的目标数字区域图像的两个质心，记为分割质心。

步骤34、按照分割质心的连线计算整个目标数字区域图像的旋转角度，对所述目标数字区域图像进行旋转，获取矫正后的目标数字区域图像。

两个质心的连线确定了图像采集时的角度，为了对多数字进行分离，需要对数字区域进行校准。校准的结果即是按照质心点连线计算出整个图像需要旋转的角度，然后对图像进行旋转(超出图像的区域进行线性填充)，给出矫正后的图像，然后图像的积分质心矩阵的数值对图像进行剪裁，最终对数字区域进行精准定位。图像的旋转和精准定位的结果如图6所示。图像在旋转的同时，积分质心的矩阵也旋转相同的角度，同时不足区域也进行双线性插值。最终形成积分区域数值矩阵。依据转换后的积分质心图像对校准后的图像提取数字区域。

步骤35、确定矫正后的目标数字区域图像的x轴上的两条边界线和y轴上的两条边界线，这些边界线组成目标数字区域图像的矩形区域。矩形区域如图7所示。

yc对应的线确定为当而时怎确定y＝yc为数字区域的一条边界线。当且则确定y＝yd为数字区域的一条边界线。同理可得出x轴的两条分界线，最终确定目标数字区域图像的矩形区域，并将矩形区域切割出，为进行一步的具体数字精确分割做准备，确定了矩形区域(xa,yc)，(xb,yd)。

步骤36、依据二值化处理后的目标数字区域图像确定所述矩形区域对应的相应数值区域，给出非零像素点的分布规律。

步骤37、在像素点为零的位置做切割线，将所述矩形区域分割成预设类别数量的子区域，每个子区域内的图像构成分割图像。

依据此区域在积分质心图像中确定数字区域对应的相应数值区域，给出非零像素点的分布规律，实例如图8所示。如图8所示，非零像素的投影位置在y＝5时，非零的位置为直线，像素点为零的位置即是分离数字区域的切割区域，为了得到最优的切割结果，本发明将非零像素投影到y＝5直线上看作是线性的多分类问题。以本发明为例，y＝5直线上有八个部分的非零区域，因此可以认为此类别的数目为八。为了保证分割的准确性，需要做到以下两点：

1、相邻两个连续非零像素点的位置之间的间隔设定一定的阈值，小于该阈值的两个连续非零像素点位置之间的零像素位置不会被分割，避免了双位手写数字被分割的可能性；

2、相邻两个连续非零像素点的位置之间的像素点为零的位置较长，为了避免相邻两个连续非零像素点的位置被分割到，影响分割区域内的手写数字，优选，切割位置为像素点为零的位置的中部。

步骤4、应用mnist数据集作为训练样本，对单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett。

由于各分割区域的数字可能是单个手写数字，也可能是双位手写数字，因此，采用常规的单个手写数字识别算法模型lenet-5对分割区域进行识别可能造成非常严重的误差。

因此，在本发明较佳的实施例中，先训练生成双位手写数字识别算法模型lenett。其获取的方法为：

应用mnist数据集，将该mnist数据集的任意两个数字进行组合，将组合后的结果对单个手写数字识别算法模型lenet-5进行训练，从而实现基于lenet-5手写双位数字识别，获取双位手写数字识别算法模型lenett。原始的mnist数据集中为单一的手写数字样本，将对应的数字样本进行拼接实现两位数字的组合，同时将样本类别进行相应的整合。样本组合过程中(例如数字0和1组合成10)采用顺序组合和随机组合进行样本的扩展。顺序组合是对手写数字0和1的样本进行编号，按编号的顺序组合成手写数字10作为训练样本，然后进行循环错位组合的形式生成新的训练样本。训练样本采用随机组合的形式生成。如果应用顺序组合样本训练的模型精确度不够，则启用部分随机组合样本添加进训练样本的集合，直至达到较高的精度为止，最后生成的训练样本输入单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett。

步骤5、依据单个手写数字识别算法模型lenet-5和双位手写数字识别算法模型lenett对每个分割图像进行识别，得到目标分数。

步骤51、将目标分割图像输入单个手写数字识别算法模型lenet-5中进行识别，并对识别结果的精确度设定一个阈值，即为预设阈值t，如果识别结果的精确度不小于预设阈值t，则单个手写数字识别算法模型lenet-5识别获取的图像数字即为所述目标分割图像对应的目标分数，如果所述识别结果的精确度小于预设阈值t，说明目标分割图像为双位手写数字，则执行步骤52的操作；所述目标分割图像即是待识别的分割图像。

步骤6、将所述目标分数按照预设类别的顺序进行存储，并对所述目标分数进行统计分析。

对所述目标试卷内的各个目标分数进行求和，获取所述目标试卷的成绩；

对多个同类型的目标试卷相应类别的目标分数依据正态分布的形式进行拟合，并给出该多个同类型的目标试卷每个类别的平均值和方差，为教师进行教学过程中的改革提供更加精细的理论依据，所述类别为题号。

实施例二

实施例二公开了一种对应上述实施例的试卷分数自动统计装置，为上述实施例的虚拟装置结构，请参照图9所示，包括：

图像采集模块71，用于对目标试卷进行图像采集，获取初始图像；

拟合模块72，用于对所述初始图像进行拟合，以获取初始图像中的目标数字区域图像，所述目标数字区域图像为包括多个手写数字的拟合图像；

分割模块73，用于通过积分质心法对所述拟合图像进行分割，得到分割图像，所述分割图像的个数为预设类别的数量；

训练模块74，用于应用mnist数据集作为训练样本，对单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett；

识别模块75，用于依据单个手写数字识别算法模型lenet-5和双位手写数字识别算法模型lenett对每个分割图像进行识别，得到目标分数；

分析模块76，用于将所述目标分数按照预设类别的顺序进行存储，并对所述目标分数进行统计分析。

实施例三

图10为本发明实施例三提供的一种电子设备的结构示意图，如图10所示，该电子设备包括处理器81、存储器82、输入装置83和输出装置84；计算机设备中处理器81的数量可以是一个或多个，图10中以一个处理器81为例；电子设备中的处理器81、存储器82、输入装置83和输出装置84可以通过总线或其他方式连接，图10中以通过总线连接为例。

存储器82作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的试卷分数自动统计方法对应的程序指令/模块(例如，试卷分数自动统计装置中的图像采集模块71、拟合模块72、分割模块73、训练模块74、识别模块75和分析模块76)。处理器81通过运行存储在存储器82中的软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现上述的试卷分数自动统计方法。

存储器82可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器82可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器82可进一步包括相对于处理器81远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置83可用于接收输入的用户身份信息。输出装置84可包括显示屏等显示设备。

实施例四

本发明实施例四还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种试卷分数自动统计方法，该方法包括：

对目标试卷进行图像采集，获取初始图像；

对所述初始图像进行拟合，以获取初始图像中的目标数字区域图像，所述目标数字区域图像为包括多个手写数字的拟合图像；

通过积分质心法对所述拟合图像进行分割，得到分割图像，所述分割图像的个数为预设类别的数量；

应用mnist数据集作为训练样本，对单个手写数字识别算法模型lenet-5进行训练，获取双位手写数字识别算法模型lenett；

依据单个手写数字识别算法模型lenet-5和双位手写数字识别算法模型lenett对每个分割图像进行识别，得到目标分数；

将所述目标分数按照预设类别的顺序进行存储，并对所述目标分数进行统计分析。

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的基于试卷分数自动统计方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、闪存(flash)、硬盘或光盘等，包括若干指令用以使得一台电子设备(可以是手机，个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述基于试卷分数自动统计装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

上述实施方式仅为本发明的优选实施方式，不能以此来限定本发明保护的范围，本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵运基;张海波;张新良;李新伟;仝兆景
技术所有人：河南理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。