客观题智能阅卷方法及系统的制作方法

文档序号:10625032阅读:729来源:国知局
客观题智能阅卷方法及系统的制作方法
【专利摘要】本发明公开了一种客观题智能阅卷方法及系统,该方法包括:获取答题卡图像;对所述答题卡图像进行灰度化处理,得到灰度图;根据答题卡模板参数对所述灰度图的答题区域进行分割,得到答题区域子图像;提取所述子图像中各选项的填涂特征,所述填涂特征用于描述单个选项的填涂程度;基于统计模型及所述填涂特征对所述选项进行识别,得到所述选项的填涂程度得分;根据所述选项的填涂程度得分确定填涂的选项。利用本发明,可以提升选项答案判定的准确度。
【专利说明】
客观题智能阅卷方法及系统
技术领域
[0001] 本发明设及信息处理技术领域,具体设及一种客观题智能阅卷方法及系统。
【背景技术】
[0002] 随着计算机科学与技术的发展,自动化信息处理能力得到了显著的提高。教育模 式也一步步向信息自动化方向发展,自动阅卷系统的出现将人从繁重的机械劳动中解放出 来,如对客观题的批阅。通过机器进行阅卷有利于教师对学生的成绩做出客观公正的评价, 并且自动阅卷的结果容易保存、统计和查询。现有的自动阅卷系统对客观题的答案进行判 定时,主要根据答题卡选项区域填涂的前景与背景像素比例来判定选项是否被填涂。所述 方法对答题卡的质量要求较高,当答题卡的纸质较差时,会严重影响当前选项答案的判定; 同时不同的设备由于性能上的差异,采集到的答题卡图像在清晰度上也会有所不同,使用 现有方法很难排除所述干扰进行选项答案的判定;此外,现有方法对用户的填涂方法要求 也较为严格,如果用户在一次考试中有的选项填涂程度较重,有的填涂程度较轻,传统方法 在填涂程度较轻的地方容易出现误判,从而降低整个阅卷系统的识别准确率。

【发明内容】

[0003] 本发明实施例提供一种客观题智能阅卷方法及系统,提升选项答案判定的准确 度。
[0004] 为此,本发明实施例提供如下技术方案:
[0005] 一种客观题智能阅卷方法,包括:
[0006] 获取答题卡图像;
[0007] 对所述答题卡图像进行灰度化处理,得到灰度图;
[0008] 根据答题卡模板参数对所述灰度图的答题区域进行分割,,得到答题区域子图 像;
[0009] 提取所述子图像中各选项的填涂特征,所述填涂特征用于描述单个选项的填涂程 度;
[0010] 基于统计模型及所述填涂特征对所述选项进行识别,得到所述选项的填涂程度得 分;
[0011] 根据所述选项的填涂程度得分确定填涂的选项。
[0012] 优选地,所述获取答题卡图像包括:
[0013] 利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。
[0014] 优选地,所述答题区域子图像包括:准考证号填涂区域子图像、身份证号填涂区域 子图像、及客观题选项填涂区域子图像。
[0015] 优选地,所述方法还包括:
[0016] 在根据答题卡模板参数对所述灰度图的答题区域进行分割之前,对所述灰度图进 行二值化处理,得到二值化图;
[0017] 对所述二值化图进行模糊检测和/或图像校正。
[0018] 优选地,所述对所述二值化图进行模糊检测包括:
[0019] 对所述二值化图进行模糊处理;
[0020] 根据模糊前后边缘的前景比例计算所述二值化图的模糊度;
[0021] 如果所述模糊度小于设定的模糊度阔值,则执行根据答题卡模板参数对所述灰度 图的答题区域进行分割的步骤;否则拒识所述答题卡图像。
[0022] 优选地,所述对所述二值化图进行图像校正包括:
[0023] 根据答题卡模板定位块及所述二值化图中的定位块建立映射关系;
[0024] 根据所述映射关系对所述二值化图进行图像校正;
[0025] 如果校正后的二值化图满足要求,则根据所述映射关系对所述二值化图对应的灰 度图进行图像校正,然后执行根据答题卡模板参数对校正后的灰度图的答题区域进行分割 的步骤;否则拒识所述答题卡图像。
[00%] 优选地,所述方法还包括:
[0027] 在提取所述子图像中各选项的填涂特征之前,对所述子图像进行二值化处理,得 到二值化子图;
[0028] W标准答题卡布局中选项位置为基准,对所述二值化子图中各选项填涂区域进行 修正,得到修正后的二值化子图;
[0029] 根据修正后的二值化子图修正所述子图像中各选项的位置。
[0030] 优选地,所述方法还包括:对所述二值化子图中各选项填涂区域进行修正之前,滤 除所述二值化子图中的边框线。
[0031] 优选地,所述填涂特征包括W下一种或多种特征:前景特征、属性特征、均值特征、 对比度特征、形状投影特征、HAAR特征;
[0032] 提取所述子图像中当前选项的前景特征包括:
[0033] 在所述子图像对应的修正后的二值化子图中确定当前选项前景外接矩形区域;
[0034] 计算所述外接矩形区域中的前景像素数;
[0035] 计算所述前景像素数与所述子图像的像素数的比值,并将该比值作为所述当前选 项的前景特征;
[0036] 所述属性特征包括水平属性特征和垂直属性特征,提取所述子图像中当前选项的 属性特征包括:
[0037] 计算所述子图像的面积及像素均值;
[0038] 统计当前选项区域中水平方向相隔设定距离的两个点的像素值都大于所述像素 均值的像素点对数Ni,并统计当前选项区域中垂直方向相隔设定距离的两个点的像素值都 大于所述像素均值的像素点对数成;
[0039] 计算所述像素点对数Ni与所述子图像的面积的比值,并将该比值作为所述当前选 项的水平属性特征;
[0040] 计算所述像素点对数成与所述子图像的面积的比值,并将该比值作为所述当前选 项的垂直属性特征;
[0041] 提取所述子图像中当前选项的均值特征包括:
[0042] 在所述子图像中获取当前选项的外接矩形区域;
[0043] 计算所述外接矩形区域像素均值;
[0044] 对所述外接矩形区域像素均值进行规整,得到所述当前选项的均值特征;
[0045] 提取所述子图像中当前选项的对比度特征包括:
[0046] 确定所述子图像的背景像素阔值;
[0047] 根据所述背景像素阔值确定所述子图像中的背景像素点;
[0048] 计算所述背景像素点的像素均值;
[0049] 根据所述背景像素点的像素均值与所述子图像中所有像素值的差值,得到像素差 值图;
[0050] 统计所述像素差值图中当前选项区域像素值大于设定阔值的像素的均值;
[0051] 对所述均值进行规整,得到所述当前选项的对比度特征;
[0052] 所述形状投影特征包括向上投影特征和向下投影特征;提取所述子图像中当前选 项的形状投影特征包括:
[0053] 计算所述子图像对应的修正后的二值化子图中当前选项区域每一列从顶部开始 到第一个前景点像素的距离投影及每一列从底部开始到第一个前景点像素的距离投影,得 到当前选项区域的上投影图像和下投影图像;
[0054] 分别对所述上投影图像和下投影图像进行区间化,得到当前选项区域的上投影区 间及下投影区间; 阳化5] 获取各投影区间内的像素值;
[0056] 对所述投影区间内的像素值求和,得到所述投影区间的区间特征;
[0057] 将各上投影区间的区间特征的集合作为当前选项的上投影特征,并将各下投影区 间的区间特征的集合作为当前选项的下投影特征;
[005引提取所述子图像中当前选项的HAAR特征包括:
[0059] 将当前选项的区域作为整个HAAR特征的区域,计算所述当前选项的水平线特征 和垂直线特征。
[0060] 优选地,所述方法还包括:
[0061] 从所述子图像上提取全局特征,所述全局特征包括同类对比度特征和异类对比度 特征;
[0062] 基于所述全局特征计算各选项的填涂程度得分;
[0063] 根据基于所述全局特征计算得到的所述选项的填涂程度得分,对基于统计模型识 别得到的所述选项的填涂程度得分进行修正,得到修正后的所述选项的填涂程度得分;
[0064] 所述根据所述选项的填涂程度得分确定填涂的选项具体为:根据修正后的所述选 项的填涂程度得分确定填涂的选项。
[00化]一种客观题智能阅卷系统,包括:
[0066] 图像获取模块,用于获取答题卡图像;
[0067] 预处理模块,用于对所述答题卡图像进行灰度化处理,得到灰度图;
[0068] 分割模块,用于根据答题卡模板参数对所述灰度图的答题区域进行分割,得到答 题区域子图像;
[0069] 填涂特征提取模块,用于提取所述子图像中各选项的填涂特征,所述填涂特征用 于描述单个选项的填涂程度;
[0070] 识别模块,用于基于统计模型及所述填涂特征对所述选项进行识别,得到所述选 项的填涂程度得分;
[0071] 答案判定模块,用于根据所述选项的填涂程度得分确定填涂的选项。
[0072] 优选地,所述图像获取模块为:光标阅读设备、或者高拍仪、或者移动终端设备。
[0073] 优选地,所述系统还包括:
[0074] 第一二值化处理模块,用于在所述分割模块根据答题卡模板参数对所述灰度图的 答题区域进行分割之前,对所述灰度图进行二值化处理,得到二值化图;
[0075] 模糊检测模块,用于对所述二值化图进行模糊检测;和/或
[0076] 图像校正模块,用于对所述二值化图进行图像校正。
[0077] 优选地,所述模糊检测模块,具体用于对所述二值化图进行模糊处理,并根据模糊 前后边缘的前景比例计算所述二值化图的模糊度;在所述模糊度小于设定的模糊度阔值 时,触发所述分割模块根据答题卡模板参数对所述灰度图的答题区域进行分割;否则确定 拒识所述答题卡图像。
[0078] 优选地,所述图像校正模块,具体用于根据答题卡模板定位块及所述二值化图中 的定位块建立映射关系,根据所述映射关系对所述二值化图进行图像校正;并在校正后的 二值化图满足要求时,根据所述映射关系对所述二值化图对应的灰度图进行图像校正,然 后触发所述分割模块根据答题卡模板参数对校正后的灰度图的答题区域进行分割;否则确 定拒识所述答题卡图像。 阳0巧]优选地,所述系统还包括:
[0080] 第二二值化处理模块,用于在所述填涂特征提取模块提取所述子图像中各选项的 填涂特征之前,对所述子图像进行二值化处理,得到二值化子图;
[0081] 局部修正模块,用于W标准答题卡布局中选项位置为基准,对所述二值化子图中 各选项填涂区域进行修正,得到修正后的二值化子图;
[0082] 选项位置修正模块,用于根据修正后的二值化子图修正所述子图像中各选项的位 置。
[0083] 优选地,所述系统还包括:
[0084] 滤除干扰模块,用于在所述局部修正模块对所述二值化子图中各选项填涂区域进 行修正之前,滤除所述二值化子图中的边框线。
[00化]优选地,所述填涂特征提取模块包括W下任意一个或多个单元:
[0086] 前景特征提取单元,用于提取所述子图像中各选项的前景特征;
[0087] 属性特征提取单元,用于提取所述子图像中各选项的属性特征;
[0088] 均值特征提取单元,用于提取所述子图像中各选项的均值特征;
[0089] 对比度特征提取单元,用于提取所述子图像中各选项的对比度特征;
[0090] 形状投影特征提取单元,用于提取所述子图像中各选项的形状投影特征;
[0091] HAAR特征提取单元,用于提取所述子图像中各选项的HAAR特征。
[0092] 优选地,所述系统还包括:
[0093] 全局特征提取模块,用于从所述子图像上提取全局特征,所述全局特征包括同类 对比度特征和异类对比度特征;
[0094] 计算模块,用于基于所述全局特征计算各选项的填涂程度得分;
[0095] 得分修正模块,用于根据基于所述全局特征计算得到的所述选项的填涂程度得 分,对基于统计模型识别得到的所述选项的填涂程度得分进行修正,得到修正后的所述选 项的填涂程度得分;
[0096] 所述答案判定模块,具体用于根据所述得分修正模块修正后的所述选项的填涂程 度得分确定填涂的选项。
[0097] 本发明实施例提供的客观题智能阅卷方法及系统,基于统计模型的方法对每个选 项的填涂程度进行判定,可W有效解决采集到的答题卡图像清晰度不一致问题,及用户在 一次考试中对每个选项填涂程度不一致问题;有效提升客观题阅卷的准确度。
[0098] 本发明实施例的方案对答题卡的质量要求较低,可W处理纸质答题卡或印刷情况 不理想的答题卡。
【附图说明】
[0099] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一 些实施例,对于本领域普通技术人员来讲,还可W根据运些附图获得其他的附图。 阳100] 图1是本发明实施例客观题智能阅卷方法的流程图; 阳101] 图2是本发明实施例中分割后的答题区域子图像示例之一; 阳102] 图3是本发明实施例中分割后的答题区域子图像示例之二; 阳103] 图4是本发明实施例中答题区域修正前后效果对比图;
[0104] 图5是本发明实施例中选项A填涂前的灰度图、二值化图、向上投影图及向下投影 图;
[0105] 图6是本发明实施例中选项A填涂后的灰度图、二值化图、向上投影图及向下投影 图;
[0106] 图7是本发明实施例中HAAR特征示意图; 阳107] 图8是本发明实施例中选项A的灰度图及水平线特征模板和垂直线特征模板; 阳10引图9是本发明实施例中全局特征示例图; 阳109] 图10是本发明实施例客观题智能阅卷系统的一种结构示意图;
[0110]图11是本发明实施例客观题智能阅卷系统的另一种结构示意图; 阳111] 图12是本发明实施例客观题智能阅卷系统的另一种结构示意图。
【具体实施方式】
[0112] 为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施 方式对本发明实施例作进一步的详细说明。
[0113] 如图1所示,是本发明实施例客观题智能阅卷方法的流程图,包括W下步骤:
[0114] 步骤101,获取答题卡图像。
[0115] 答题卡图像的获取可W采用光标阅读设备进行扫描,或者采用高拍仪、移动终端 等设备进行拍照获取。
[0116] 步骤102,对所述答题卡图像进行灰度化处理,得到灰度图。
[0117] 需要说明的是,在实际应用中,在进行后续对所述灰度图的答题区域进行分割之 前,还可进一步对所述灰度图进行模糊检测及图像校正,拒识掉模糊程度较大的图像w及 异常的图像,W保证阅卷识别的准确性。
[0118] 模糊检测及图像校正是根据所述灰度图对应的二值化图进行的,因此,在本发明 另一实施例中,还可进一步包括W下步骤:
[0119] 在根据答题卡模板参数对所述灰度图的答题区域进行分割之前,对所述灰度图进 行二值化处理,得到二值化图;然后对所述二值化图进行模糊检测和/或图像校正。
[0120] 图像的二值化处理就是将图像上的像素点的灰度值设置为0或255, W将整个图 像呈现出明显的黑白效果,即将256个亮度等级的灰度图像通过适当的阔值选取而获得仍 然可W反映图像整体和局部特征的二值化图像。 阳121] 另外,还可W根据图像局部灰度特性来自适应地选取阔值对图像进行二值化处 理,即局部自适应阔值二值化方法。具体地,根据预先设定的二值化窗口大小,将图像分为 不重叠的图像块,根据每个图像块像素的均值和标准差计算得到每个图像块的二值化阔 值,根据所述阔值将每个图像块二值化,得到二值化后的答题卡图像。
[0122] 在进行模糊检测时,可W首先对所述二值化图进行模糊处理,利用图像模糊前后 边缘的前景比例来判断图像的模糊程度。一般清晰图像模糊前后图像边缘的前景比例较 大,而模糊图像模糊前后图像边缘的前景比例较小。根据运一特性,设置相应的模糊度阔 值,可W拒识掉模糊度大于该阔值的答题卡图像。在实际应用中,对于拒识掉的运部分答 题,可W由人工完成阅卷。 阳123] 在进行图像校正时,可W根据答题卡模板定位块及所述二值化图中的定位块建立 映射关系;然后根据所述映射关系对所述二值化图进行图像校正。
[0124] 具体地,可W首先对所述二值化图进行定位检测,找到所述二值化图中与模板定 位块形状相符合的定位块建立映射关系,然后根据所述映射关系对出现倾斜、旋转等问题 的二值化图像进行校正,校正过程中如果出现W下情况之一,确认校正后的二值化图不满 足要求,对其可W拒识,否则还需要根据所述映射关系对所述二值化图对应的灰度图进行 图像校正,然后执行后续对所述灰度图的答题区域进行分割的步骤,而且此时分割的对象 是校正后的灰度图: 阳125] (1)2个W上定位块被遮挡;
[01%] (2)2个W上定位块被涂改严重,大小形状发生了变化; 阳127] (3)定位块旁边增加形状大小与定位块相似的人工涂改块; 阳12引 (4)校正后的图像不完整。
[0129] 当然,还可W有其它一些应该拒识的情况,在此不再一一列举。
[0130] 需要说明的是,在实际应用中,可W先进行模糊检测,然后再进行图像校正,也可 W反之,对此本发明实施例不做限定,但通常可W优选先进行模糊检测,一旦检测到模糊, 后续的图像校正就不需要再进行,因为图像校正的操作远比模糊检测的操作复杂。 阳131 ] 步骤103,根据答题卡模板参数对所述灰度图的答题区域进行分割,得到答题区域 子图像。
[0132] 具体地,可W根据答题卡模板参数对所述灰度图的答题区域进行分割,得到答题 区域的子图像的灰度图。通常,所述答题区域子图像可W包括:准考证号填涂区域子图像、 身份证号填涂区域子图像、及客观题选项填涂区域子图像。
[0133] 如图2、图3所示,为分割后的答题区域子图像的灰度图,其中,图2为准考证选项 区域实例图,图3为客观题选项区域实例图。
[0134] 进一步地,为了防止由于答题卡印刷问题造成的定位块位置错误,导致图像校正 后获取到的选项填涂位置不一定准确,还可对图像中的答题区域进行局部修正。
[0135] 具体地,首先对答题区域子图像进行二值化,得到二值化后的子图像;然后在所述 子图像上滤除边框线,消除所述边框线对答题区域的干扰,即根据水平或垂直连续前景点 的数目是否达到阔值来滤除边框线,所述阔值可W根据经验确定,滤除边框时将前景点置0 即可;最后,W标准答题卡布局中选项位置为基准,进行答题区域的局部修正,具体修正时, 需要对各选项填涂区域整体进行局部捜索,如对选项区域的上下前后8个像素进行捜索, 步长为2 ;选择前景点最多的位置作为最终选项的位置,得到每个选项填涂区域修正后的 位置参数。如图4所示为答题区域修正前后效果对比图。
[0136] 步骤104,提取所述子图像中各选项的填涂特征,所述填涂特征用于描述单个选项 的填涂程度。
[0137] 在提取子图像中各选项的填涂特征时,首先要获取所述选项的位置。为了进一步 保证各选项位置的准确性,在本发明方法另一实施例中,还可W在步骤104前,对各子图像 中各选项的位置进行修正,W得到更准确的选项位置,进而使提取的填涂特征更准确。具体 地,可W首先对所述子图像进行二值化处理,得到二值化子图;然后W标准答题卡布局中选 项位置为基准,对所述二值化子图中各选项填涂区域进行修正,得到修正后的二值化子图; 最后根据修正后的二值化子图修正所述子图像中各选项的位置。
[0138] 所述填涂特征具体可W包括W下一种或多种特征:前景特征、属性特征、均值特 征、对比度特征、形状投影特征、HAAR特征。下面对运几种特征的提取方式分别进行详细说 明。 阳139] (1)前景特征
[0140] 在所述子图像对应的修正后的二值化子图中获取各选项区域,为了防止填涂范围 超过选项区域,可W在当前选项区域的基础上,上下左右各扩展多个像素,如扩展2个像 素。在所述当前选项区域中计算前景像素数与整个子图像像素数的比值,将所述比值作为 自IJ景特化,用Χι表不。 阳141] (2)属性特征
[0142] 所述属性特征包括水平属性特征和垂直属性特征。 阳143] 首先计算整个子图像的面积S及像素均值μ,然后统计整个子图像中水平方向相 隔距离为d的两个点的像素值都大于μ的像素点对数Ni,及整个子图像中垂直方向相隔距 离为d的两个点的像素值都大于μ的像素点对数成,所述距离d指两个像素点相隔的像素 点数,一般根据经验确定,如3。水平属性特征值X2和垂直属性特征X 3的计算方法如下:
[0146] 0)均值特征 阳147] 在所述子图像中获取当前选项区域,计算所述当前选项区域像素均值μ 1,对像素 均值进行规整后,即可得到均值特征Χ4,如下式所示:
[0148]
阳149] (4)对比度特征
[0150] 首先提取所述子图像的背景像素点,将所述像素点值从小到大进行排序,在像素 值大于设定值(比如200)的像素点中选取一定比例(比如10% )的像素点,按照从大到小 的顺序选取,计算选取像素点的平均值μ 2,将μ 2作为提取背景像素点的阔值,将大于μ 2 的像素点作为背景像素点,小于μ2的像素点作为前景像素点;然后计算提取到的背景像素 点的均值μ3;随后,计算将所述均值μ 3减去所述子图像中所有像素值,得到一个像素差值 图;最后,统计差值图中当前选项区域的像素值大于阔值的像素的均值μ4,所述阔值一般 根据经验设定,比如为50,对所述均值μ 4进行规整,得到对比度特征X
[0151]
阳152] (5)形状投影特征 阳153] 形状投影特征包括向上投影特征和向下投影特征,如图5所示为选项A填涂前的 灰度图、二值化图、向上投影图及向下投影图,图6所示为选项A填涂后的灰度图、二值化 图、向上投影图及向下投影图。
[0154] 首先在所述子图像对应的修正后的二值化子图中,计算当前选项区域每一列从顶 部开始到第一个前景点像素的距离投影及每一列从底部开始到第一个前景点像素的距离 投影,得到上投影图像和下投影图像;然后根据预先设置的区间数m对得到的投影图像进 行区间化,得到各区间内的像素值;最后对所述像素值求和得到每个区间的区间特征,所述 投影图像区间化的计算如下式所示: 阳1巧]
[0156] 其中,d为区间大小,为当前选项区域宽度的前景像素点数。
[0157] 投影特征是区间特征的集合,第i个上投影特征P及第i个下投影特征q 1的计算 如下:
阳160] 其中,il和id分别表示第i个投影区间的开始索引和结束索引,曰1,和b 1,分别表 示第i个上投影区间内第j个像素值和第i个下投影区间内第j个像素值,则上投影特征 P= {pi,P2…PnJ,下投影特征Q=站,化…q"J。
[0161] (6)HAAR 特征
[0162] HAAR特征,是计算机视觉领域一种常用的特征描述算子。目前常用的HAAR特征 有边缘特征和线特征,如图7所示。边缘特征有4种:X方向,y方向,X倾斜方向,y倾斜方 向;线特征有8种。每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域 的像素值之和的差值计算出来的,运个差值就是所谓的HAAR特征的特征值。
[0163] 在本发明实施例中,可W选用水平线特征和垂直线特征。在计算特征值时,采用两 个HAAR线特征模板,即水平线特征模板和垂直线特征模板来描述当前选项的水平或垂直 灰度变化,本案所用线特征模板白色部分像素数与黑色部分像素数相等,用K表示。将线 特征模板中的白色区域像素值之和减去黑色区域像素值之和作为相应的HAAR特征。具体 地,将当前选项区域(对选项区域进行周边扩展)作为整个HAAR特征的区域,例如图8中 选项A的第一个线特征(垂直HAAR线特征)的计算如下:将当前选项区域分成垂直条状4 等份,中间两份代表黑色区域,外边两份代表白色区域,即将当前选项区域两边2等份区域 所有像素和相加,再减去中间2等份区域的所有像素值之和作为垂直HAAR特征值。
[0164] 再如图8所示,为选项A的灰度图及水平线特征模板和垂直线特征模板,相应线 特征模板的特征值计算方法如下式所示,即为白色部分像素值的和减去黑色部分像素值的 和。 阳1佑I
阳166] 其中,Li和L2分别表示水平线特征模板特征值和垂直线特征模板特征值,a 1表示 白色部分第1个像素点值,bk表示黑色部分第k个像素点值;所述特征值越大,表示灰度变 化越小,特征值越小,表示灰度变化越大。 阳167] 步骤105,基于统计模型及所述填涂特征对所述选项进行识别,得到所述选项的填 涂程度得分。
[0168] 所述统计模型可W为一种或多种模型的线性组合,所述统计模型的训练与现有模 型的训练类似,如 SVM(Suppo;rt Vector Machine)、决策树、D順值eep 化ural 化tworks), GMM(Gaussian Mix1:ure Model)等。
[0169] 在基于统计模型对选项答案进行识别时,输入为当前选项的填涂特征,输出为当 前选项的填涂程度得分Τι。 阳170] W SVM为例,使用线性核函数进行模型训练,得到模型参数W和b的取值,如下式 所示。利用模型参数W和b的取值,计算当前选项填涂程度得分T1。
[0171] T1 = WX+b
[0172] 其中,W是权重系数向量,b是偏移向量,W和b可W通过离线收集大量数据进行训 练得到,X为当前选项的特征向量,比如X = Ixi,而,如X"馬,P,Q,Li,Lz}。
[0173] 需要说明的是,所述统计模型可W预先通过收集大量数据训练得到,所述训练数 据包含采用多种不同设备获取到的大量不同质纸及不同印刷的答题卡答题信息。此外,针 对特殊考试,所述统计模型还可W通过有针对性的收集数据进行训练得到。
[0174] 步骤106,根据所述选项的填涂程度得分确定填涂的选项。
[0175] 根据选项填涂程度得分T1,对选项答案进行判定,具体如下式所示: 阳 176]
[0177] 其中,Jw表示第e题,第V个选项的识别结果,1表示当前选项是填涂的,0表示当 前选项是未填涂的,τ为填涂程度阔值,一般根据经验取值。
[0178] 本发明实施例提供的客观题智能阅卷方法,基于统计模型的方法对每个选项的填 涂程度进行判定,可W有效解决采集到的答题卡图像清晰度不一致问题,及用户在一次考 试中对每个选项填涂程度不一致问题;有效提升客观题阅卷的准确度。
[0179] 本发明实施例的方案对答题卡的质量要求较低,可W处理纸质答题卡或印刷情况 不理想的答题卡。
[0180] 由于基于统计模型的方法在模型训练时使用的特征都是针对单个选项填涂程度 的描述,因此,为了从总体上更准确地判定每个选项的答案,在本发明另一实施例中,还可 W使用全局特征对基于统计模型方法得到的填涂程度得分进行修正,得到修正后的填涂程 度得分,然后再根据修正后的填涂程度得分进行选项答案的判定,具体过程如下: 阳181] (1)从子图像(灰度图)上提取全局特征,所述全局特征包括同类对比度特征及异 类对比度特征,具体如下: 阳182] 所述同类对比度特征是指子图像中不同题目的相同选项间的对比度,如图9左图 框内选项。所述同类对比度越大,表示选项的填涂程度越大,计算方法下式所示: 阳 183]
[0184] 其中,Xgi为同类对比度特征,μ 1为当前选项区域像素均值,Mmaxi和Mmi。進个子图 像内与当前选项相同的选项像素均值的最大值和最小值,如图9左图,像素均值的最大值 和最小值为1到5题中所有选项A的像素均值中的最大值和最小值。为了防止上式的分母 为0,增加了一个很小的数ε,其取值可W是0.0001。
[0185] 所述异类对比度特征是指子图像中同一题中所有选项间的对比度,如图9右图框 内选项。所述异类对比度越大,表示选项的填涂程度越大,计算方法如下式所示: 阳 186]
阳187] 其中,Xg2为当前选项的异类对比度特征,Mm,x2和Mmi"2同一题内所有选项像素均值 的最大值和最小值,如图9右图中,像素均值的最大值和最小值为选项A、B、C、D像素均值 的最大值和最小值。
[0188] (2)基于提取的全局特征计算当前选项的填涂程度得分T2,计算方法如下式所 示: 阳1例 了2= a*x gi+b*x姑 阳190] 其中,a和b为全局特征系数,且a+b = l,0<a<l,0<b< 1,具体取值根据经 验获取。通过全局特征的描述可W准确识别出当前选项的擦除涂痕。 阳191] (3)根据全局特征对当前选项填涂程度的得分,对基于统计模型方法得到的填涂 程度得分进行修正,修正后的得分为T,具体计算如下式所示: 阳 192] T =曰 *Τι+β *了2
[0193] 其中,α和β为填涂程度得分的权重系数,具体取值根据经验获取,本案α = β 二 0· 5d
[0194] (4)根据修正后的选项填涂程度得分Τ,对选项答案进行判定,判定方法与Τι类 似。
[0195] 通过上述对基于统计模型识别得到的所述选项的填涂程度得分的修正,进而根据 修正后的填涂程度得分进行选项答案的判定,可w进一步提升选项答案判定的准确度。
[0196] 相应地,本发明实施例还提供一种客观题智能阅卷系统,如图10所示,是该系统 的一种结构示意图。 阳197] 在该实施例中,所述系统包括:
[0198] 图像获取模块901,用于获取答题卡图像;
[0199] 预处理模块902,用于对所述答题卡图像进行灰度化处理,得到灰度图; 阳200] 分割模块903,用于根据答题卡模板参数对所述灰度图的答题区域进行分割,得到 答题区域子图像; 阳201] 填涂特征提取模块904,用于提取所述子图像中各选项的填涂特征,所述填涂特征 用于描述单个选项的填涂程度; 阳202] 识别模块905,用于基于统计模型及所述填涂特征对所述选项进行识别,得到所述 选项的填涂程度得分; 阳203]答案判定模块906,用于根据所述选项的填涂程度得分确定填涂的选项。 阳204] 上述图像获取模块901具体可W使用光标阅读设备、或者高拍仪、或者移动终端 设备等。 阳205] 需要说明的是,在实际应用中,本发明实施例的系统还可进一步对所述灰度图进 行模糊检测和/或图像校正,拒识掉模糊程度较大的图像W及异常的图像,W保证阅卷识 别的准确性,模糊检测及图像校正的过程是在二值化图中进行的。相应地,在所述系统中设 置第一二值化处理模块、模糊检测模块和/或图像校正模块(未图示)。其中: 阳206] 第一二值化处理模块,用于在分割模块903根据答题卡模板参数对所述灰度图的 答题区域进行分割之前,对所述灰度图进行二值化处理,得到二值化图。 阳207] 模糊检测模块用于对所述二值化图进行模糊检测,具体可W先对所述二值化图进 行模糊处理,然后根据模糊前后边缘的前景比例计算所述二值化图的模糊度;并在所述模 糊度小于设定的模糊度阔值时,触发所述分割模块根据答题卡模板参数对所述灰度图的答 题区域进行分割;否则确定拒识所述答题卡图像。
[0208] 图像校正模块用于对所述二值化图进行图像校正,具体可W根据答题卡模板定位 块及所述二值化图中的定位块建立映射关系,根据所述映射关系对所述二值化图进行图像 校正;并在校正后的二值化图满足要求时,根据所述映射关系对所述二值化图对应的灰度 图进行图像校正,然后触发所述分割模块根据答题卡模板参数对校正后的灰度图的答题区 域进行分割的步骤;;否则确定拒识所述答题卡图像。 阳209] 在本发明实施例中,所述填涂特征用于描述单个选项的填涂程度,具体可W包括 W下一种或多种特征:前景特征、属性特征、均值特征、对比度特征、形状投影特征、HAAR特 征。
[0210] 相应地,上述填涂特征提取模块904可W包括W下任意一个或多个单元: 阳211] 前景特征提取单元,用于提取所述子图像中各选项的前景特征;
[0212] 属性特征提取单元,用于提取所述子图像中各选项的属性特征;
[0213] 均值特征提取单元,用于提取所述子图像中各选项的均值特征;
[0214] 对比度特征提取单元,用于提取所述子图像中各选项的对比度特征;
[0215] 形状投影特征提取单元,用于提取所述子图像中各选项的形状投影特征;
[0216] HAAR特征提取单元,用于提取所述子图像中各选项的HAAR特征。
[0217] 上述各特征提取单元提取相应特征的具体实现方式可W参照前面本发明方法实 施例中的描述,在此不再寶述。
[0218] 本发明实施例提供的客观题智能阅卷系统,基于统计模型的方法对每个选项的填 涂程度进行判定,可W有效解决采集到的答题卡图像清晰度不一致问题,及用户在一次考 试中对每个选项填涂程度不一致问题;有效提升客观题阅卷的准确度。
[0219] 本发明实施例的方案对答题卡的质量要求较低,可W处理纸质答题卡或印刷情况 不理想的答题卡。
[0220] 上述填涂特征提取模块904在提取所述子图像中各选项的填涂特征时,首先要获 取各选项的位置。为了进一步保证各选项位置的准确性,在本发明系统另一实施例中,还可 提供对局部修正功能。相应地,如图11所示,所述系统还包括W下各模块: 阳221 ] 第二二值化处理模块111,用于在填涂特征提取模块904提取所述子图像中各选 项的填涂特征之前,对所述子图像进行二值化处理,得到二值化子图; 阳222] 局部修正模块112,用于W标准答题卡布局中选项位置为基准,对所述二值化子图 中各选项填涂区域进行修正,得到修正后的二值化子图; 阳223] 选项位置修正模块113,用于根据修正后的二值化子图修正对应的子图像中各选 项的位置。
[0224] 该实施例的系统还可进一步包括滤除干扰模块(未图示),用于在所述局部修正 模块112对所述二值化子图中各选项填涂区域进行修正之前,滤除所述二值化子图中的边 框线,W排除边框线对选项区域的干扰。
[0225] 本发明实施例提供的客观题智能阅卷系统,可W有效防止由于答题卡印刷问题造 成的定位块位置错误、进而导致图像校正后获取到的选项填涂位置不一定准确的情况,进 一步提升客观题阅卷的准确度。
[0226] 如图12所示,是本发明实施例客观题智能阅卷系统的另一种结构示意图。 阳227] 与图10所示实施例不同的是,在该实施例中,所述系统还包括W下各模块:
[0228] 全局特征提取模块907,用于从所述子图像上提取全局特征,所述全局特征包括同 类对比度特征和异类对比度特征; 阳229] 计算模块908,用于基于所述全局特征计算各选项的填涂程度得分; 阳230] 得分修正模块909,用于根据基于所述全局特征计算得到的所述选项的填涂程度 得分,对基于统计模型识别得到的所述选项的填涂程度得分进行修正,得到修正后的所述 选项的填涂程度得分; 阳231 ] 相应地,在该实施例中,答案判定模块906可W根据得分修正模块909修正后的所 述选项的填涂程度得分确定填涂的选项。 阳232] 需要说明的是,在该实施例中,所述系统也可W进一步包括上述第二二值化处理 模块111,局部修正模块112,选项位置修正模块113。 阳233] 本发明实施例的客观题智能阅卷系统,通过上述对基于统计模型识别得到的所述 选项的填涂程度得分的修正,进而根据修正后的填涂程度得分进行选项答案的判定,可W 进一步提升选项答案判定的准确度。
[0234] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。w上所描述的系 统实施例仅仅是示意性的,其中所述作为分离部件说明的模块可W是或者也可W不是物理 上分开的,作为单元显示的部件可W是或者也可W不是物理单元,即可W位于一个地方,或 者也可W分布到多个网络单元上。可W根据实际的需要选择其中的部分或者全部模块来实 现本实施例方案的目的。而且,其中的一些模块所提供的功能也可W由软件来实现,一些模 块可W与现有的设备(比如个人电脑、平板电脑、手机)中的相同功能模块共用。本领域普 通技术人员在不付出创造性劳动的情况下,即可W理解并实施。
[0235] W上对本发明实施例进行了详细介绍,本文中应用了【具体实施方式】对本发明进行 了阐述,W上实施例的说明只是用于帮助理解本发明的方法及系统;同时,对于本领域的 一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所 述,本说明书内容不应理解为对本发明的限制。
【主权项】
1. 一种客观题智能阅卷方法,其特征在于,包括: 获取答题卡图像; 对所述答题卡图像进行灰度化处理,得到灰度图; 根据答题卡模板参数对所述灰度图的答题区域进行分割,,得到答题区域子图像; 提取所述子图像中各选项的填涂特征,所述填涂特征用于描述单个选项的填涂程度; 基于统计模型及所述填涂特征对所述选项进行识别,得到所述选项的填涂程度得分; 根据所述选项的填涂程度得分确定填涂的选项。2. 根据权利要求1所述的方法,其特征在于,所述获取答题卡图像包括: 利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。3. 根据权利要求1所述的方法,其特征在于,所述答题区域子图像包括:准考证号填涂 区域子图像、身份证号填涂区域子图像、及客观题选项填涂区域子图像。4. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 在根据答题卡模板参数对所述灰度图的答题区域进行分割之前,对所述灰度图进行二 值化处理,得到二值化图; 对所述二值化图进行模糊检测和/或图像校正。5. 根据权利要求4所述的方法,其特征在于,所述对所述二值化图进行模糊检测包括: 对所述二值化图进行模糊处理; 根据模糊前后边缘的前景比例计算所述二值化图的模糊度; 如果所述模糊度小于设定的模糊度阈值,则执行根据答题卡模板参数对所述灰度图的 答题区域进行分割的步骤;否则拒识所述答题卡图像。6. 根据权利要求4所述的方法,其特征在于,所述对所述二值化图进行图像校正包括: 根据答题卡模板定位块及所述二值化图中的定位块建立映射关系; 根据所述映射关系对所述二值化图进行图像校正; 如果校正后的二值化图满足要求,则根据所述映射关系对所述二值化图对应的灰度图 进行图像校正,然后执行根据答题卡模板参数对校正后的灰度图的答题区域进行分割的步 骤;否则拒识所述答题卡图像。7. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 在提取所述子图像中各选项的填涂特征之前,对所述子图像进行二值化处理,得到二 值化子图; 以标准答题卡布局中选项位置为基准,对所述二值化子图中各选项填涂区域进行修 正,得到修正后的二值化子图; 根据修正后的二值化子图修正所述子图像中各选项的位置。8. 根据权利要求7所述的方法,其特征在于,所述方法还包括:对所述二值化子图中各 选项填涂区域进行修正之前,滤除所述二值化子图中的边框线。9. 根据权利要求7所述的方法,其特征在于,所述填涂特征包括以下一种或多种特征: 前景特征、属性特征、均值特征、对比度特征、形状投影特征、HAAR特征; 提取所述子图像中当前选项的前景特征包括: 在所述子图像对应的修正后的二值化子图中确定当前选项前景外接矩形区域; 计算所述外接矩形区域中的前景像素数; 计算所述前景像素数与所述子图像的像素数的比值,并将该比值作为所述当前选项的 前景特征; 所述属性特征包括水平属性特征和垂直属性特征,提取所述子图像中当前选项的属性 特征包括: 计算所述子图像的面积及像素均值; 统计当前选项区域中水平方向相隔设定距离的两个点的像素值都大于所述像素均值 的像素点对数Ni,并统计当前选项区域中垂直方向相隔设定距离的两个点的像素值都大于 所述像素均值的像素点对数N2; 计算所述像素点对数K与所述子图像的面积的比值,并将该比值作为所述当前选项的 水平属性特征; 计算所述像素点对数N2与所述子图像的面积的比值,并将该比值作为所述当前选项的 垂直属性特征; 提取所述子图像中当前选项的均值特征包括: 在所述子图像中获取当前选项的外接矩形区域; 计算所述外接矩形区域像素均值; 对所述外接矩形区域像素均值进行规整,得到所述当前选项的均值特征; 提取所述子图像中当前选项的对比度特征包括: 确定所述子图像的背景像素阈值; 根据所述背景像素阈值确定所述子图像中的背景像素点;; 计算所述背景像素点的像素均值; 根据所述背景像素点的像素均值与所述子图像中所有像素值的差值,得到像素差值 图; 统计所述像素差值图中当前选项区域像素值大于设定阈值的像素的均值; 对所述均值进行规整,得到所述当前选项的对比度特征;; 所述形状投影特征包括向上投影特征和向下投影特征;提取所述子图像中当前选项的 形状投影特征包括: 计算所述子图像对应的修正后的二值化子图中当前选项区域每一列从顶部开始到第 一个前景点像素的距离投影及每一列从底部开始到第一个前景点像素的距离投影,得到当 前选项区域的上投影图像和下投影图像; 分别对所述上投影图像和下投影图像进行区间化,得到当前选项区域的上投影区间及 下投影区间; 获取各投影区间内的像素值; 对所述投影区间内的像素值求和,得到所述投影区间的区间特征; 将各上投影区间的区间特征的集合作为当前选项的上投影特征,并将各下投影区间的 区间特征的集合作为当前选项的下投影特征; 提取所述子图像中当前选项的HAAR特征包括: 将当前选项的区域作为整个HAAR特征的区域,计算所述当前选项的水平线特征和垂 直线特征。10.根据权利要求1至9任一项所述的方法,其特征在于,所述方法还包括: 从所述子图像上提取全局特征,所述全局特征包括同类对比度特征和异类对比度特 征; 基于所述全局特征计算各选项的填涂程度得分; 根据基于所述全局特征计算得到的所述选项的填涂程度得分,对基于统计模型识别得 到的所述选项的填涂程度得分进行修正,得到修正后的所述选项的填涂程度得分; 所述根据所述选项的填涂程度得分确定填涂的选项具体为:根据修正后的所述选项的 填涂程度得分确定填涂的选项。11. 一种客观题智能阅卷系统,其特征在于,包括: 图像获取模块,用于获取答题卡图像; 预处理模块,用于对所述答题卡图像进行灰度化处理,得到灰度图; 分割模块,用于根据答题卡模板参数对所述灰度图的答题区域进行分割,得到答题区 域子图像; 填涂特征提取模块,用于提取所述子图像中各选项的填涂特征,所述填涂特征用于描 述单个选项的填涂程度; 识别模块,用于基于统计模型及所述填涂特征对所述选项进行识别,得到所述选项的 填涂程度得分; 答案判定模块,用于根据所述选项的填涂程度得分确定填涂的选项。12. 根据权利要求11所述的系统,其特征在于,所述图像获取模块为:光标阅读设备、 或者高拍仪、或者移动终端设备。13. 根据权利要求11所述的系统,其特征在于,所述系统还包括: 第一二值化处理模块,用于在所述分割模块根据答题卡模板参数对所述灰度图的答题 区域进行分割之前,对所述灰度图进行二值化处理,得到二值化图; 模糊检测模块,用于对所述二值化图进行模糊检测;和/或 图像校正模块,用于对所述二值化图进行图像校正。14. 根据权利要求13所述的系统,其特征在于, 所述模糊检测模块,具体用于对所述二值化图进行模糊处理,并根据模糊前后边缘的 前景比例计算所述二值化图的模糊度;在所述模糊度小于设定的模糊度阈值时,触发所述 分割模块根据答题卡模板参数对所述灰度图的答题区域进行分割;否则确定拒识所述答题 卡图像。15. 根据权利要求13所述的系统,其特征在于, 所述图像校正模块,具体用于根据答题卡模板定位块及所述二值化图中的定位块建立 映射关系,根据所述映射关系对所述二值化图进行图像校正;并在校正后的二值化图满足 要求时,根据所述映射关系对所述二值化图对应的灰度图进行图像校正,然后触发所述分 割模块根据答题卡模板参数对校正后的灰度图的答题区域进行分割;否则确定拒识所述答 题卡图像。16. 根据权利要求11所述的系统,其特征在于,所述系统还包括: 第二二值化处理模块,用于在所述填涂特征提取模块提取所述子图像中各选项的填涂 特征之前,对所述子图像进行二值化处理,得到二值化子图; 局部修正模块,用于以标准答题卡布局中选项位置为基准,对所述二值化子图中各选 项填涂区域进行修正,得到修正后的二值化子图;; 选项位置修正模块,用于根据修正后的二值化子图修正所述子图像中各选项的位置。17. 根据权利要求16所述的系统,其特征在于,所述系统还包括: 滤除干扰模块,用于在所述局部修正模块对所述二值化子图中各选项填涂区域进行修 正之前,滤除所述二值化子图中的边框线。18. 根据权利要求16所述的系统,其特征在于,所述填涂特征提取模块包括以下任意 一个或多个单元: 前景特征提取单元,用于提取所述子图像中各选项的前景特征; 属性特征提取单元,用于提取所述子图像中各选项的属性特征; 均值特征提取单元,用于提取所述子图像中各选项的均值特征; 对比度特征提取单元,用于提取所述子图像中各选项的对比度特征; 形状投影特征提取单元,用于提取所述子图像中各选项的形状投影特征; HAAR特征提取单元,用于提取所述子图像中各选项的HAAR特征。19. 根据权利要求11至18任一项所述的系统,其特征在于,所述系统还包括: 全局特征提取模块,用于从所述子图像上提取全局特征,所述全局特征包括同类对比 度特征和异类对比度特征; 计算模块,用于基于所述全局特征计算各选项的填涂程度得分; 得分修正模块,用于根据基于所述全局特征计算得到的所述选项的填涂程度得分,对 基于统计模型识别得到的所述选项的填涂程度得分进行修正,得到修正后的所述选项的填 涂程度得分; 所述答案判定模块,具体用于根据所述得分修正模块修正后的所述选项的填涂程度得 分确定填涂的选项。
【文档编号】G06K9/54GK105989347SQ201510091479
【公开日】2016年10月5日
【申请日】2015年2月28日
【发明人】吴爱红, 邓宏平, 竺博, 魏思, 胡国平, 胡郁, 刘庆峰
【申请人】科大讯飞股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1