基于机器视觉的试卷信息采集系统的制作方法

文档序号:11077229阅读:1003来源:国知局
基于机器视觉的试卷信息采集系统的制造方法与工艺

本实用新型属于试卷信息采集技术领域,尤其涉及基于机器视觉的试卷信息采集系统。



背景技术:

当前的考试除了像高考类的大型考试会将整张试卷扫描到电脑上,并在电脑上阅卷后直接将分数录入电脑外,大部分的试卷仍然是通过老师手工阅卷并将分数写在试卷上,之后再进行人工统分登分和成绩分析。此项工作虽不复杂,但是需要大量精力和足够的细心,尤其是试卷特别多的时候,手工统分登分的弊端就愈发显著,不仅占据了老师的精力和时间,而且统计的准确率也会随之下降,从而引发后续难题。

同样的,现有技术中的答题卡解决了选项题的审批问题,原理是利用对碳很敏感的红外线,对答题卡上2B铅笔涂迹的位置进行坐标,使得阅读机识别出学号和答案的正确与否。但如果把该技术应用到普通试卷来进行统分登分的话,不仅需要对试卷进行区域修改,并要求学生用2B铅笔准确填涂学号,而且老师打总分时也要用铅笔填涂,这样仅仅在阅卷过程中就会浪费很多的时间,同时老师还要时时刻刻检查是否涂错,且在考试频繁的时期更显不便,甚至会造成整体工作效率的下降。

随着机器视觉技术的发展,使用光学器件进行非接触感知,自动获取和解释一个真实场景的图像,以获取信息和(或)控制机器或过程,即通过机器视觉产品将摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。机器视觉可以理解为给机器驾加装上视觉装置,使机器具备视觉功能,在某些领域代替人眼来做测量和判断,使其能认识和看懂观察到的东西,能确定它所见范围内的目标的位置。机器视觉不仅是人眼的延伸,也具有人脑的部分功能,目的是提高机器的自动化和智能化程度。因此利用机器视觉技术来实现现在工业和生活的自动化已成为越来越多的人关注的焦点。



技术实现要素:

本实用新型的目的是提供一种基于机器视觉的试卷信息采集系统,本实用新型结构简单,使用方便,可以快速有效地采集试卷信息并传送至PC机上进行数据解析,大大降低了试卷审批以及分数统计的劳动强度和出错频率,提高工作效率。

为解决上述技术问题,本实用新型采用的技术方案如下:

基于机器视觉的试卷信息采集系统,所述系统包括信息采集装置和信息分析装置,所述信息采集装置包括底座、立柱和摄像机构,立柱垂直固设在底座一侧,摄像机构通过卡夹与立柱滑动配合;信息分析装置包括与信息采集装置信号连接的PC机。

优选的,所述摄像机构包括工业相机,工业相机的输入端和输出端通过数据采集卡与PC机信号连接。

优选的,所述摄像机构还包括与工业相机连接的固定板和水平调节器,水平调节器包括固设在基板上的两块挡板,两块挡板之间设有上、下两根滑杆,固定板上、下端分别与两根滑杆配合;基板通过卡夹与立柱连接。

优选的,所述水平调节器还包括位于两根滑杆之间且顺次贯穿两挡板和固定板的丝杆,丝杆与固定板螺纹配合且丝杆一端固定有扭轮。

优选的,所述摄像机构还包括底部周向设有数个LED灯的补光圈,补光圈通过吊板与固定板底部连接,且补光圈与工业相机的镜头同轴设置。

优选的,所述固定板底部设有红外线发射器,底座上对应设有红外线接收器,红外线接收器通过数据采集卡与PC机信号连接。

优选的,所述卡夹的两夹片端部通过调距螺栓连接。

本实用新型在使用时,将需要审批的试卷放置在底座上,由于试卷遮挡红外线发射器发射的红外线,使得红外线接收器无法接收,红外线接收器将该信号通过数据采集卡的A/D转换后传递至PC机,PC机在接收到红外阻断信号后自动控制工业相机对试卷进行拍摄照片,照片数据通过数据采集卡传递至PC机并存储图像。然后PC机从拍摄存储的图像中提取出含有学号和总分的区域,再对提取出的图像进行图像灰度化、二值化处理、图像闭运算、数字分割、倾斜调整、提取骨架以及归一化等预处理,最后通过设定的算法对数字进行识别并进行存储。最终由成绩分析单元对识别出的学号、成绩进行系统分析并得出结果。

图像信息分析步骤具体如下:从拍摄的图像中提取出含有学号和总分的区域,由于放置试卷时位置不固定,因此首先利用模版匹配工具来对试卷进行自动拍摄包含目标的大块区域,又由于试卷上学号和分数的位置相对于摄取出的大块区域一般固定,而且还有下划线定位,所以通过相对坐标位置判断和直线位置定位识别就能将含有分数和学号的小块区域截取出来。然后对图像进行下述预处理:图像灰度化、二值化处理、图像闭运算、数字分割、倾斜调整、提取骨架以及归一化。

其中,图像灰度化即将工业相机拍摄的彩色图像变成灰度图像,以减少图像原始数据量便于后续计算。由于对拍摄环境已经调试到最好状态,并经实验验证无需对图像进行增强、滤波,可直接将灰度图像进行二值化处理,即呈现出非黑即白效果。二值化处理的方法是先利用最大类间方差法来获得最佳阈值,之后再使用阈值变换法把灰度图像转换成二值图像。

最大类间方差阈值算法:

设T为分割阈值,μ为图像均值,则图像可分为两个区,目标区(O区)与背景区(B区)。P(i)为第i级灰度的概率。

对应以T为阈值的类间方差为:

有对应以T为阈值的类间方差使σ2最大的T值即为最佳阈值。

图像进行闭运算(先膨胀后腐蚀的过程,膨胀的公式:含义:集合B先作关于原点的映射,然后平移x,形成新的集合,该集合与集合X相交不为空集时的结构元素参考点的集合;腐蚀的公式:含义:B平移x后仍在集合X内部的参考点集合)时,其中使用圆盘形结构元素进行运算,目的使图像中数字部分细小的空洞被填充;连接邻近物体,例如数字:0、4、6、8、9,则会把其孔洞边界断开部分连接成一个完整孔洞,用于特征识别;平滑其边界用来数字分割和特征识别。

数字切割即沿着数字的上下左右边缘将数字剪切出来,为了使数字识别更简便。本发明采用扫描的方法,找出每个数字的上下左右切点,然后根据上下切点的行数和左右切点的列数来决定所要剪切的数字的起始和终止的行数与列数,就可以将数字切割出来。

下面为一图片的矩阵实例:

由于图像已二值化处理,数字部分灰度值不为0,本切割方法即寻找矩阵中灰度值不为0的整个区域边界的坐标,找出上下左右的切点,之后进行数字切割。

对数字进行倾斜调整:先计算二值图像的高宽比来估计图像的倾斜角度,高宽比越小,则倾斜角度越大,反之,倾斜角度越小。通过观察,当高宽比达到最大时,数字最接近竖直。之后通过仿射变换进行旋转。

仿射旋转变换:目标图形以(x,y)为轴心(取图片中心)顺时针旋转θ弧度,变换矩阵为:

接下来进行提取骨架,直接细化处理,但会出现毛刺。为除去毛刺,本发明采用毛刺阈值删除法。需要先找出骨架中的分叉点,求分叉点的方法:

细化后得到二值图像f(x,y)中,如果其中的像素i,满足f(xi,yi)=255,则在像素i的8邻域模板内统计其f(xi+Δx,yi+Δy)=255的个数并记入Counti中,其中xi,yi={-1 0 1}。重复此操作,直至所有像素操作完毕。Counti>3即为分支点;如果Counti=1,即为端点。

通过人工设置一个T阈值长度,将小于T长度的毛刺自动删除,即可除去毛刺。最后归一化,将每个数字放在规定大小的图片空间中,用来统一字符的大小及格式。

所述数字识别过程中,采用的方法为数字的特征提取,通过每个数字的特征不同,分别进行识别。

数字“1”:提取数字1离心率最大的特征,经理论验证和大量实验验证,数字1的离心率e最大并且离心率e均在0.99~1.00之间,其他数字离心率e均在0.99以下。

数字“7”:采用与数字1相同的方法。不同的地方在于截取数字7的下半部分求离心率。

数字“0、6、8、9”:提取孔洞特征,它们的共同点就是全都有孔洞,根据有无孔洞将其筛选出来,再根据孔洞数量将数字8(两个孔洞)筛选出来。其余三个数字(一个孔洞)根据孔洞位置进行区分。因为每个数字均沿着数字的上下左右边缘将数字剪切出来的,所以数字0的孔洞上下边界均紧贴图片边界,在图片上下边界均有灰度值为255的像素点;数字6的孔洞只有下边界紧贴图片边界,图片下边界有灰度值为255的像素点;数字9的孔洞只有上边界紧贴图片边界,图片上边界有灰度值为255的像素点。

计算孔洞数量和位置通过下述图片的矩阵实例说明:

通过上述方法,求得A中有两个孔洞(数字1包围的一个、数字2包围的一个)。同时可以求得孔洞的位置坐标。

数字“4”:由于是手写数字,每个人笔迹有所差异,所以数字4会有三种明显不同的情况:第一种是数字4没有闭合部分(无孔洞),提取四交叉点特征,只有数字4存在四交叉点,由于是手写,所有会有规则和不规则四交叉点两种情况,经过对大量规则和不规则四交叉点样本的像素组合进行研究,发现四交叉点都是由放置位置各不相同的“T”字型和“L”字型组合而成。建立“十”字型模板和“T、L”字型的四方向(上下左右)模板,通过模板匹配的方法,只要匹配一个“十”字型模板或者“T、L”字型的四方向(上下左右)模板任意两个组合,就可以确定四交叉点的存在;第二种是左上方部分闭合,第三种是右上方部分闭合,均会形成一个孔洞,如按识别上述0、6、8、9四个数字的方法来识别数字4,便会导致与数字9混淆,需要再进一步区分。本发明区分的方法是对除去孔洞的部分进行离心率计算,手写的数字9除去孔洞后只剩一条直线,而数字4除去孔洞后无论如何都不能是一条直线,即利用识别数字1的方法来区分数字4和9。

数字“2、3、5”:提取端点特征,通过端点位置来区分这四个数。在进行除毛刺的过程已经求得端点(Counti=1),只需记录下端点位置坐标。存在一个端点位置在右上时,则为数字5;存在一个端点位置在右下时,则为数字2;端点均在左侧时,则为数字3。

以上数字识别有先后顺序:先用孔洞识别出数字0、6、8、9,之后再识别数字1、7,然后识别数字4,最后识别数字2、3、5。

所述的存储结果并分析成绩过程,即将识别出来的学号和分数存储在EXCEL表格中,软件自动按学号大小排序,将名字与之对应,对分数进行系统的分析。

本实用新型与现有技术相比,具有如下优点:结构简单,使用方便,可以快速有效地采集试卷信息并传送至PC机上进行数据解析,大大降低了试卷审批以及分数统计的劳动强度和出错频率,提高工作效率。

附图说明

图1为具体实施方式中基于机器视觉的试卷信息采集系统的结构示意图;

图2为图1所示信息采集系统的俯视示意图;

图3为图1所示信息采集系统的侧视示意图。

具体实施方式

为了使本实用新型的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本实用新型进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本实用新型,并不用于限定本实用新型。

如图1-3所示,基于机器视觉的试卷信息采集系统,所述系统包括信息采集装置和信息分析装置,所述信息采集装置包括底座1,底座1上设有红外线接收器10,立柱12垂直固设在底座1一侧,基板14通过卡夹13与立柱12滑动配合且卡夹13的两夹片端部通过调距螺栓131连接;基板14上固设有水平调节器,水平调节器包括固设在基板14上的两块挡板15,两块挡板15之间设有上、下两根滑杆151,固定板17上、下端分别与两根滑杆151配合,丝杆153位于两根滑杆151之间且顺次贯穿两挡板15和固定板17,丝杆153与固定板17螺纹配合且丝杆153一端固定有扭轮152;固定板17上固设有工业相机18,固定板17底部设有红外线发射器101,且固定板17底部通过吊板161与补光圈16连接,补光圈16与工业相机18的镜头同轴设置且底部周向设有数个LED灯;信息分析装置包括通过数据采集卡19分别与红外线接收器10和工业相机18的输入端和输出端信号连接的PC机191。

本实用新型在使用时,将需要审批的试卷放置在底座上,由于试卷遮挡红外线发射器发射的红外线,使得红外线接收器无法接收,红外线接收器将该信号通过数据采集卡的A/D转换后传递至PC机,PC机在接收到红外阻断信号后自动控制工业相机对试卷进行拍摄图像,图像数据通过数据采集卡传递至PC机,存储图像。然后PC机从拍摄存储的图像中提取出含有学号和总分的区域,再对提取出的图像进行图像灰度化、二值化处理、图像闭运算、数字分割、倾斜调整、提取骨架以及归一化等预处理,最后通过设定的算法对数字进行识别并进行存储。最终由成绩分析单元对识别出的学号、成绩进行系统分析并得出结果。

图像信息分析步骤具体如下:从拍摄的图像中提取出含有学号和总分的区域,由于放置试卷时位置不固定,因此首先利用模版匹配工具来对试卷进行自动拍摄包含目标的大块区域,又由于试卷上学号和分数的位置相对于摄取出的大块区域一般固定,而且还有下划线定位,所以通过相对坐标位置判断和直线位置定位识别就能将含有分数和学号的小块区域截取出来。然后对图像进行下述预处理:图像灰度化、二值化处理、图像闭运算、数字分割、倾斜调整、提取骨架以及归一化。

其中,图像灰度化即将工业相机拍摄的彩色图像变成灰度图像,以减少图像原始数据量便于后续计算。由于对拍摄环境已经调试到最好状态,并经实验验证无需对图像进行增强、滤波,可直接将灰度图像进行二值化处理,即呈现出非黑即白效果。二值化处理的方法是先利用最大类间方差法来获得最佳阈值,之后再使用阈值变换法把灰度图像转换成二值图像。

最大类间方差阈值算法:

设T为分割阈值,μ为图像均值,则图像可分为两个区,目标区(O区)与背景区(B区)。P(i)为第i级灰度的概率。

对应以T为阈值的类间方差为:

有对应以T为阈值的类间方差使σ2最大的T值即为最佳阈值。

图像进行闭运算(先膨胀后腐蚀的过程,膨胀的公式:含义:集合B先作关于原点的映射,然后平移x,形成新的集合,该集合与集合X相交不为空集时的结构元素参考点的集合;腐蚀的公式:含义:B平移x后仍在集合X内部的参考点集合)时,其中使用圆盘形结构元素进行运算,目的使图像中数字部分细小的空洞被填充;连接邻近物体,例如数字:0、4、6、8、9,则会把其孔洞边界断开部分连接成一个完整孔洞,用于特征识别;平滑其边界用来数字分割和特征识别。

数字切割即沿着数字的上下左右边缘将数字剪切出来,为了使数字识别更简便。本发明采用扫描的方法,找出每个数字的上下左右切点,然后根据上下切点的行数和左右切点的列数来决定所要剪切的数字的起始和终止的行数与列数,就可以将数字切割出来。

下面为一图片的矩阵实例:

由于图像已二值化处理,数字部分灰度值不为0,本切割方法即寻找矩阵中灰度值不为0的整个区域边界的坐标,找出上下左右的切点,之后进行数字切割。

对数字进行倾斜调整:先计算二值图像的高宽比来估计图像的倾斜角度,高宽比越小,则倾斜角度越大,反之,倾斜角度越小。通过观察,当高宽比达到最大时,数字最接近竖直。之后通过仿射变换进行旋转。

仿射旋转变换:目标图形以(x,y)为轴心(取图片中心)顺时针旋转θ弧度,变换矩阵为:

接下来进行提取骨架,直接细化处理,但会出现毛刺。为除去毛刺,本发明采用毛刺阈值删除法。需要先找出骨架中的分叉点,求分叉点的方法:

细化后得到二值图像f(x,y)中,如果其中的像素i,满足f(xi,yi)=255,则在像素i的8邻域模板内统计其f(xi+Δx,yi+Δy)=255的个数并记入Counti中,其中xi,yi={-1 0 1}。重复此操作,直至所有像素操作完毕。Counti>3即为分支点;如果Counti=1,即为端点。

通过人工设置一个T阈值长度,将小于T长度的毛刺自动删除,即可除去毛刺。最后归一化,将每个数字放在规定大小的图片空间中,用来统一字符的大小及格式。

所述数字识别过程中,采用的方法为数字的特征提取,通过每个数字的特征不同,分别进行识别。

数字“1”:提取数字1离心率最大的特征,经理论验证和大量实验验证,数字1的离心率e最大并且离心率e均在0.99~1.00之间,其他数字离心率e均在0.99以下。

数字“7”:采用与数字1相同的方法。不同的地方在于截取数字7的下半部分求离心率。

数字“0、6、8、9”:提取孔洞特征,它们的共同点就是全都有孔洞,根据有无孔洞将其筛选出来,再根据孔洞数量将数字8(两个孔洞)筛选出来。其余三个数字(一个孔洞)根据孔洞位置进行区分。因为每个数字均沿着数字的上下左右边缘将数字剪切出来的,所以数字0的孔洞上下边界均紧贴图片边界,在图片上下边界均有灰度值为255的像素点;数字6的孔洞只有下边界紧贴图片边界,图片下边界有灰度值为255的像素点;数字9的孔洞只有上边界紧贴图片边界,图片上边界有灰度值为255的像素点。

计算孔洞数量和位置通过下述图片的矩阵实例说明:

通过上述方法,求得A中有两个孔洞(数字1包围的一个、数字2包围的一个)。同时可以求得孔洞的位置坐标。

数字“4”:由于是手写数字,每个人笔迹有所差异,所以数字4会有三种明显不同的情况:第一种是数字4没有闭合部分(无孔洞),提取四交叉点特征,只有数字4存在四交叉点,由于是手写,所有会有规则和不规则四交叉点两种情况,经过对大量规则和不规则四交叉点样本的像素组合进行研究,发现四交叉点都是由放置位置各不相同的“T”字型和“L”字型组合而成。建立“十”字型模板和“T、L”字型的四方向(上下左右)模板,通过模板匹配的方法,只要匹配一个“十”字型模板或者“T、L”字型的四方向(上下左右)模板任意两个组合,就可以确定四交叉点的存在;第二种是左上方部分闭合,第三种是右上方部分闭合,均会形成一个孔洞,如按识别上述0、6、8、9四个数字的方法来识别数字4,便会导致与数字9混淆,需要再进一步区分。本发明区分的方法是对除去孔洞的部分进行离心率计算,手写的数字9除去孔洞后只剩一条直线,而数字4除去孔洞后无论如何都不能是一条直线,即利用识别数字1的方法来区分数字4和9。

数字“2、3、5”:提取端点特征,通过端点位置来区分这四个数。在进行除毛刺的过程已经求得端点(Counti=1),只需记录下端点位置坐标。存在一个端点位置在右上时,则为数字5;存在一个端点位置在右下时,则为数字2;端点均在左侧时,则为数字3。

以上数字识别有先后顺序:先用孔洞识别出数字0、6、8、9,之后再识别数字1、7,然后识别数字4,最后识别数字2、3、5。

所述的存储结果并分析成绩过程,即将识别出来的学号和分数存储在EXCEL表格中,软件自动按学号大小排序,将名字与之对应,对分数进行系统的分析。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1