机读信息卡或机读试卷的信息识别方法

文档序号:6561827阅读:432来源:国知局
专利名称:机读信息卡或机读试卷的信息识别方法
技术领域
本发明涉及一种机读信息卡或机读客观性试题答题试卷的信息识别方法。
背景技术
光学标记阅读机(简称OMR)是计算机的一种快速录入设备。它集机、光、电技术于一身,以其快速、可靠的性能在标准化考试和各种统计中得到广泛应用。OMR最早出现于六十年代,现在该系统在国内外广泛用于考生阅卷、评分、统计甚至赛马等信息的处理系统。
光标阅读机是利用光电转换原理将规定的信息卡上的光学信息符号转换成计算机能处理的电信号的装置。信息卡通常是纸质卡片,纸上一些确定位置印有涂写信息的矩形或圆形标志区,用铅笔等对一些标志区涂黑以后,光电转换部件便能够通过卡片的反光或投射能力识别这些信息,并将其转换为电信号。
使用OMR对信息卡进行光学识别的方式具有以下缺陷a、对信息卡的印刷精度要求高,因为传统的OMR机是靠纸边定位的;b、只取识别区的灰度信息进行选择,对于信息卡上的污迹或者笔误甚至擦改后残留的痕迹都有误认的可能,因此有时不能真实地反映考生答题地实际情况,例如某选择题有四个选项A/B/C/D,考生在B上填涂地密度为90%而C答案上只是划了一条线(可能是考生笔误也可能是其他污迹),结果却是该题的答案识别结果为BC;c、对识别结果缺少校验手段d、没有原图信息,发现错误只能抽原卡校验,极为不便。
后期出现的使用高速扫描仪对信息卡进行图像数码转换,并且对信息卡图像进行坐标定位后对选项区域进行密度和灰度识别的方法,这种方法比光标阅读机有一定的进步,但是由于是对选项区域进行密度和灰度的识别,所以只能识别填涂区块的信息卡,不能识别采用画线填选方法的新型信息卡,而且对填涂答题卡上擦改过的选项仍然存在误识别的可能。
发明人在另一项专利申请里提出一种采用画线填选方法的新型信息卡,并提出一种采用画线填选方法的机读试卷。此种机读试卷,在试卷其上印制有客观性试题和与试题相应的选项,在每个选项区域内印制有位置确定的多个点、多条彩色线段或彩色曲线,用于答题者对选项进行选择时,对点与点进行连线或对彩色线段或彩色曲线进行描绘,形成选项被选中的机读符号。

发明内容
本发明针对现有技术的不足,提出一种适用于机读信息卡和上述机读试卷的信息识别方法,利用该识别方法,能够建立和存储每张信息卡或机读试卷原图的数码图像,能够实现信息卡或试卷数码图像的坐标定位,能够获取更多的信息卡或试卷选项区域的信息,实现更为精确的信息识别。采用本发明提供的方法,不仅仅能够识别传统的采用填涂区块方法答题的信息卡,还能够识别采用画线填选方法的新型信息卡。
为此,本发明采用如下的技术方案一种机读信息卡或试卷的信息识别方法,机读信息卡或试卷上设置有坐标标记,包括以下步骤(1)根据信息卡选项或试卷选项被选中所采用的符号,制作信息卡或试卷选项的电子模板,存储在计算机内;(2)根据信息卡或试卷的坐标标记制作坐标标记电子模板,存储在计算机内;(3)将信息卡或者试卷的各个选项区域的位置信息储存在计算机内。
(4)通过光学图像信息数字转换设备采集信息卡或试卷的数码图像,并存储在计算机内;(5)根据信息卡或试卷的坐标标记的电子模板和各个选项区域的位置信息,确定数码图像上的各个选项区域的坐标,(6)对各个选项区域的数码图像进行符号特征抽取,获取符号信息;(7)将各个选项区域的符号信息分别与信息卡选项的电子模板相比对,识别各个选项区域的符号信息所表达的答题信息。
本发明的机读信息卡或试卷的信息识别方法,在步骤(1)中,最好还对选中后又被修改成不选择或选中和修改成不选择而后又被重新选中的不同符号,制作信息卡或试卷选项的电子模版。
信息识别方法所识别的信息卡或试卷可以为在各个选项区域印制有位置确定的多个点或多条彩色线段或彩色曲线的信息卡或试卷。
上述的信息卡或试卷选项被选中的符号是由点与点之间的部分或全部连线,或对部分或全部彩色线段或彩色曲线描绘所得到符号。
信息卡或试卷选项被选中后又被修改成不选择或选中和修改成不选择而后又被重新选中的符号是由点与点之间的连线的部分或全部连线,或对部分或全部彩色线段或彩色曲线描绘所得到的符号,该符号不同于权利要求3所述的选项被选中的符号。
本发明的有益效果1、对信息卡的印刷要求低,不再依靠纸边定位,而且对图像定位,只要印刷标准即可;2、采用了图像识别技术,获取了更多的识别信息。与现有技术只能识别在选项的部分或全部区域进行填涂的灰度和密度信息不同,本发明还能够识别利用画线进行答题的信息卡;3、对画线等填卡方式产生的符号的识别比单纯的灰度和密度识别更准确,抗干扰性更强,更能真是的反映出填写者的真实意思。
4、图像录入工具多样化,只要能构清晰完整的将信息卡或试卷图像数字化并录入电脑的光学图像数字化设备均可。
5、校验时可以调用原图对比。


图1本发明的信息卡或试卷识别方法流程图;图2-7分别为采用本发明能够识别的信息卡或试卷的某个选项所印制的图形,以及答题后在信息卡或试卷的该选项上所生成的符号的实例。各图的(a)为空白选项,(b)为选中的选项,(c)为由选中改为不选择的选项,(d)为由选中改为不选择,又改为选中的选项;图8信息卡或试卷选项电子模板举例。
图9和图10分别为本发明机读试卷的一个试题及其选项的实施例。
具体实施例方式
下面结合附图对本发明做进一步描述。
本发明是在图像识别技术已经成熟的技术背景下提出的信息卡或试卷识别方法,实现本发明的软硬件包括下面几种数码摄像头、光学图像扫描仪等进行光学图像数码转换之类的设备、计算机、在计算机上运行的信息卡或试卷识别软件,如对答题符号进行光学字符识别(OCR)、存储在计算机里的针对信息卡或试卷选项未被选中、被选中等所制作的信息卡或试卷选项电子模板、信息卡或试卷定位用的坐标标记电子模板等。
在信息卡或试卷识别之前,需要做以下的准备工作(1)根据信息卡或试卷选项被选中所采用的符号,制作信息卡或试卷选项的电子模板,并存储在计算机里。信息卡或试卷选项的电子模板里还可以包括选项被选中后又修改成不选择所采用的符号的电子模板,也可以包括选项被选中后又修改,而后又被重新选中所采用的符号的电子模板;未被选中的信息卡或试卷选项的电子模板,通常是空白模板。
(2)根据信息卡或试卷坐标标记制作坐标标记电子模板,并存储在计算机里;(3)将信息卡或者试卷的各个选项区域的位置信息储存在计算机内。
(4)利用数码摄像头、光学图像扫描仪之类的设备摄制或扫描信息卡或试卷的光学图像,经过数码转换,制成数码图像,输入并存储在计算机内;(5)对数码图像进行正规化、去除噪声、图像矫正等的图像处理。
信息卡或试卷识别方法采用光学字符识别(OCR),参见图1,包括以下步骤;
(1)根据坐标标记电子模板,在信息卡或试卷数码图像上寻找坐标标记,并根据各个选项区域的位置信息,建立信息卡或试卷数码图像的各个选项的坐标;(2)根据信息卡或试卷数码图像上的各个选项区域的坐标,对各个选项区域的数码图像进行符号特征抽取,获取符号信息;(3)将各个选项区域的符号信息分别与信息卡或试卷选项的电子模板相比对,识别各个选项区域的符号信息所表达的答题信息;(4)格式化输出识别结果。
下面再结合附图2-7对采用本发明的识别方法能够识别的新型信息卡或试卷及选项被选中、被修改所采用的符号的实例做一下介绍。
此种新型的信息卡或试卷,在每个选项区域印制了一些点、线段或曲线。点可以是孤立的点,也可以是图形上的点,所印制的点的颜色不限,可以是黑色,也可以是彩色。线段或曲线可以是虚线也可以是实线。由于人们答题时所使用的笔一般是黑色的,为了相区别,所以线段或曲线应当是彩色的,即除了白色、黑色之外的颜色,例如可以由红、绿、蓝等特定的非答题笔颜色的单色印制,也可以是由两种或多种非答题笔颜色印制而成。
这里所说的选项区域指的是每个选项与其相邻选项平均分配面积所得的属于该选项的一块区间。
实例一和二在每个选项周围的固定位置印制特定的点。此种信息卡或试卷,对点的颜色没有限制,可以由红、绿、蓝等特定的非答题笔颜色的单色印制,也可以由与答题笔颜色一样,(如黑色)的单色印制而成,如图2(a)和图3(a)所示,图1和图2的(b)、(c)、(d)用对选项周围的点的连线的各种情况分别表达对该选项的取舍。
实例三和四在每个选项周围的固定位置印制特定的线段,线段的端点可以印有明显的点,也可以不印制点,除了印制特定的线段外,还可以印制一些位置固定的单独的点。在这两个实施例中,对各条线段和点的颜色可以不限制,例如可以由红、绿、蓝等特定的非答题笔颜色的单色印制而成,也可以直接印制成黑色,如图4(a)和图5(a)所示,图4和图5的(b)、(c)、(d)用对选项周围的点和线的连线的各种情况分别表达对该选项的取舍。线段可以印制成与答题笔颜色一致的颜色,如黑色,原因是在对这两个实施例的所设计的答题规则中,没有描绘已经印制好的线段,而是用点的连线来表达答题信息。
实例五和六在每个选项的周围印制特定的线段或曲线,这些线段或曲线可以是实线,也可以是虚线,如图6(a)和图7(a)所示(图中仅仅画出线段或曲线是虚线的情况)。线段或曲线可以是由红、绿、蓝等特定的非答题笔颜色的单色印制而成,但不能是由与答题笔颜色一样的颜色(如黑色)印制而成。图6和图7的(b)、(c)、(d),用对线段、曲线的描绘的情况分别表达对该选项的取舍。
对信息卡或试卷进行拍摄时,最好选用能够滤去与信息卡或试卷上印制的线段或曲线的颜色相反的颜色的镜头进行拍摄,也可以在暗室里利用与信息卡或试卷的印刷色彩相同的灯光照明,例如,如果信息卡或试卷是红色,那么就采用红色等光照明。由于白色和单色印制图案对同等的单色光反射强度相对都较高,数码设备所采集到的图像信息里直接滤除了印制在信息卡或试卷上的彩色图案。另一种方法是对已经进行数码转换的信息卡或试卷数码图像进行色彩处理,滤去与印制颜色相同的颜色。一般情况下,规定人们在答题时使用如铅笔、黑色签字笔、圆珠笔等黑色的答题笔,经过上述的一种或多种处理办法,再通过选项区域的坐标定位以及与选项电子模板的比对,能够准确地获得答题者的答题信息。
信息卡或试卷选项的电子模板根据信息卡或试卷上印制的图案和针对信息卡或试卷制定的答题规则而定。采用本发明提供的识别方法,应当在用于信息卡或试卷信息识别的计算机里,安装机读符号编辑器,利用这种编辑器,能够根据不同的答题规则,直接生成相应的信息卡或试卷选项电子模板。例如,对于上面所列举的第二种实例,如果信息卡或试卷采用红色单色印刷,那么,信息卡或试卷选项的电子模板有代表未选择的空白模板、代表被选中的模板(如图8(a)所示),代表选中后又被修改成不选择的模板(如图8(b)所示),代表选中后又被修改成不选择而后又重新选中的模板(如图8(c)所示)。
本发明提供的机读试卷,在选项的印制图形和印制颜色要求上与信息卡类似,实施例一至六(图2-7)也可以作为机读试卷的选项图形和填选方法的实施例,这里不再赘述。实施例七和实施例八如图9和图10所示,分别单独给出机读试卷的一道试题被选中的实施例。在这两个实施例里,空白机读试卷的选项区域只是印制了点,印制在选项号旁边,试卷本身可以采用常规的黑墨印刷,不必采用单色印刷。图中点与点之间连线形成的折线代表选项被选中。
有关坐标标记(俗称同步头)及其模板、数字图像采集处理方法、OCR方法等,由于已经在多种技术领域得到广泛应用,这里不再详细介绍。
权利要求
1.一种机读信息卡或机读试卷的信息识别方法,机读信息卡或机读客观性试题答题试卷上设置有坐标标记,包括以下步骤(1)根据信息卡选项或试卷选项被选中所采用的符号,制作信息卡或试卷选项的电子模板,存储在计算机内;(2)根据信息卡或试卷的坐标标记制作坐标标记电子模板,存储在计算机内;(3)通过光学图像信息数字转换设备采集信息卡或试卷的数码图像,并存储在计算机内;(4)根据信息卡或试卷的坐标标记的电子模板,确定数码图像上的各个选项区域的坐标,(5)对各个选项区域的数码图像进行符号特征抽取,获取符号信息;(6)将各个选项区域的符号信息分别与信息卡选项的电子模板相比对,识别各个选项区域的符号信息所表达的答题信息。
2.根据权利要求1所述的机读信息卡或试卷的信息识别方法,其特征在于,在步骤(1)中,还对选中后又被修改成不选择或选中和修改成不选择而后又被重新选中的不同符号,制作信息卡或试卷选项的电子模版。
3.根据权利要求1所述的机读信息卡的信息识别方法,其特征在于,所述信息识别方法所识别的信息卡或试卷为在各个选项区域印制有位置确定的多个点或多条彩色线段或彩色曲线的信息卡或试卷。
4.根据权利要求3所述的机读信息卡的信息识别方法,其特征在于,所述信息卡或试卷选项被选中的符号是由所述点与点之间的部分或全部连线,或对部分或全部彩色线段或彩色曲线描绘所得到符号。
5.根据权利要求4所述的机读信息卡的信息识别方法,其特征在于,所述信息卡或试卷选项被选中后又被修改成不选择或选中和修改成不选择而后又被重新选中的符号是由点与点之间的连线的部分或全部连线,或对部分或全部彩色线段或彩色曲线描绘所得到的符号,该符号不同于权利要求3所述的选项被选中的符号。
全文摘要
本发明涉及一种机读信息卡或机读试卷的信息识别方法,机读信息卡或机读客观性试题答题试卷上设置有坐标标记,包括以下步骤根据信息卡选项或试卷选项被选中所采用的符号,制作信息卡或试卷选项的电子模板,存储在计算机内;根据信息卡或试卷的坐标标记制作坐标标记电子模板,存储在计算机内;通过光学图像信息数字转换设备采集信息卡或试卷的数码图像,并存储在计算机内;根据信息卡或试卷的坐标标记的电子模板,确定数码图像上的各个选项区域的坐标,对各个选项区域的数码图像进行符号特征抽取,获取符号信息;将各个选项区域的符号信息分别与信息卡选项的电子模板相比对,识别各个选项区域的符号信息所表达的答题信息。采用本发明提供的方法,不仅仅能够识别传统的采用填涂区块方法答题的信息卡,还能够识别采用画线填选方法的新型信息卡,并且方便了答题,减少了误答率和机器识别错误率。
文档编号G06K7/00GK1975766SQ20061012981
公开日2007年6月6日 申请日期2006年12月4日 优先权日2006年12月4日
发明者凌子龙 申请人:凌子龙
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1