错题识别方法、系统、可读存储介质及设备与流程

文档序号:18621538发布日期:2019-09-06 22:32阅读:346来源:国知局
错题识别方法、系统、可读存储介质及设备与流程

本发明涉及数据分析处理技术领域,特别涉及一种错题识别方法、系统、可读存储介质及设备。



背景技术:

随着社会竞争的不断积累,全国人民越来越注重对学生的教育培养。目前,许多教育、培训机构,包括学校在内都会定期通过试卷来对学生进行考核,以通过考试成绩来评判学生在这一段学习期间的学习成果。

为了能够更好的作针对性培训,可以通过对学生做错的题目进行统计,然后挑选出错误率较高的一些题目进行着重讲解,以达到事半功倍的效果,从而快速的提高学生的学习成果。

然而,现有技术当中,目前缺少一种能够对试卷中学生做错的错题进行自动识别的方法,导致错题统计只能依赖于老师来完成,增加了老师的工作量。



技术实现要素:

基于此,本发明的目的是提供一种错题识别方法、系统、可读存储介质及设备,以解决现有技术无法对试卷中学生做错的错题进行自动识别的技术问题。

根据本发明实施例的一种错题识别方法,包括:

获取带有批改痕迹的试卷图像;

分别对所述试卷图像中的每一试题所在的图像区域进行截取,以得到多个试题图像;

分别对每一所述试题图像中的批改痕迹进行识别,并根据识别结果筛选出所有错题的试题图像;

根据所述错题的试题图像,从题库中识别出所述试卷中所有做错的试题。

另外,根据本发明上述实施例的一种错题识别方法,还可以具有如下附加的技术特征:

进一步地,所述分别对所述试卷图像中的每一试题所在的图像区域进行截取的步骤包括:

对所述试卷图像中每个试题编号所在的位置进行识别:

以所述试题编号所在的位置作为截图边界,对所述试卷图像进行截图,以得到所述多个试题图像。

进一步地,所述试题编号所在的位置为所述试题图像的横向边界,所述试题图像的竖向边界为所述试卷图像的竖向边界以内的预设距离处。

进一步地,对所述试题图像中的批改痕迹进行识别的步骤包括:

从所述试题图像中截取所述批改痕迹所在的图像区域,以得到批改痕迹图像;

将所述批改痕迹图像与预设的批改标准图像进行匹配,以得出所述试题图像的批改类型。

进一步地,所述根据识别结果筛选出所有错题的试题图像的步骤包括:

将所述批改类型为错题类型的所有所述试题图像归类为所述错题的试题图像。

进一步地,在所述分别对每一所述试题图像中的批改痕迹进行识别的步骤之前,还包括:

分别判断每一所述试题图像中是否存在完整的批改痕迹;

若否,则扩大截取范围,并在所述试卷图像中,重新对不存在完整的批改痕迹的试题图像对应的试题所在的图像区域进行截取;

若是,则执行所述分别对每一所述试题图像中的批改痕迹进行识别的步骤。

进一步地,在所述根据所述错题的试题图像,从题库中识别出所述试卷中所有做错的试题的步骤之后,还包括:

对所述做错的试题进行标记。

根据本发明实施例的一种错题识别系统,包括:

图像获取模块,用于获取带有批改痕迹的试卷图像;

图像截取模块,用于分别对所述试卷图像中的每一试题所在的图像区域进行截取,以得到多个试题图像;

痕迹识别模块,用于分别对每一所述试题图像中的批改痕迹进行识别,并根据识别结果筛选出所有错题的试题图像;

错题识别模块,用于根据所述错题的试题图像,从题库中识别出所述试卷中所有做错的试题。

本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的错题识别方法。

本发明还提出一种错题识别设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的错题识别方法。

本发明当中的错题识别方法、系统、可读存储介质及设备,通过获取带有批改痕迹(如老师的批改痕迹)的试卷图像,然后截取出每一试题的试卷图像,并对每一试题图像中的批改痕迹进行识别,从而筛选出所有错题的试题图像,最后再根据错题的试题图像,从题库中识别出试卷中所有做错的试题,因此本错题识别方法、系统、可读存储介质及设备,能够实现自动对试卷中学生做错的错题进行识别,为后续错题自动统计打下基础,降低老师的工作量。

附图说明

图1为本发明第一实施例中的错题识别方法的流程图;

图2为本发明第二实施例中的错题识别方法的流程图;

图3为本发明第二实施例中的截图试题图像的一种示意图;

图4为本发明第二实施例中的截图试题图像的另一种示意图;

图5为本发明第三实施例中的错题识别系统的结构框图;

图6为本发明第四实施例中的错题识别设备的结构框图。

主要元件符号说明:

以下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

请参阅图1,所示为本发明第一实施例中的错题识别方法,可应用于一错题识别设备中,该错题识别设备可以由软件和/或硬件实现,所述方法包括步骤s01至步骤s04。

步骤s01,获取带有批改痕迹的试卷图像。

在具体实施时,可在该错题识别设备上设置摄像头和/或扫描仪,以使可以通过摄像头对带有批改痕迹的试卷进行拍照、或者扫描仪对带有批改痕迹的试卷进行扫描成像的方式来获得所述试卷图像。或者还可以通过数据下载、上传、导入等方式直接从外接设备中获取。

其中,所述的批改痕迹是指试卷批改者(如老师)对试卷中学生做出的每一试题的答案的对错评判,因此所述试卷图像中的批改痕迹可以包括“√”和“×”,“√”代表该试题答案正确,“×”代表该试题答案错误。

步骤s02,分别对所述试卷图像中的每一试题所在的图像区域进行截取,以得到多个试题图像。

作为一种实现方式,本步骤可以通过文字识别技术(opticalcharacterrecognition,简称ocr)来识别出每一试题所在的图像区域,然后根据识别结果进行每一试题的图像截取。作为另一种实现方式,可以对试卷进行排版,使试卷中的每一试题都处在一独立的边框内,且对于客观题该边框内可以预留足够的答题空间,基于此本步骤即可将试题边框作为截取边界进行每一试题的图像截取。其中,ocr是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

可以理解的,在截取试题图像时,也可以根据设定的分析对象的要求,只截取出部分试题的试题图像,例如只截图选择题的试题图像等,这样可以为后续实现针对同一类型的试题进行错题统计。

步骤s03,分别对每一所述试题图像中的批改痕迹进行识别,并根据识别结果筛选出所有错题的试题图像。

可以理解的,本步骤可以基于图像识别技术来识别每一试题图像中的批改痕迹,例如当识别到一试题图像中的批改痕迹为“×”时,代表该批改痕迹对应的试题为学生做错的试题,则将其归类为错题的试题图像,从而筛选出所有错题的试题图像。

步骤s04,根据所述错题的试题图像,从题库中识别出所述试卷中所有做错的试题。

作为一种实现方式,可以将每一所述错题的试题图像分别与题库中每一试题的预设标准图像进行匹配,从而匹配出相似度最高的预设标准图像,则该相似度最高的预设标准图像对应的试题即为所述试卷中做错的试题。作为一种替代的实现方式,还可以根据文字识别技术来识别出所述错题的试题图像的文字内容,从而根据该文字内容来从题库中识别出对应的试题。

综上,本发明上述实施例当中的错题识别方法,通过获取带有批改痕迹(如老师的批改痕迹)的试卷图像,然后截取出每一试题的试卷图像,并对每一试题图像中的批改痕迹进行识别,从而筛选出所有错题的试题图像,最后再根据错题的试题图像,从题库中识别出试卷中所有做错的试题,因此本错题识别方法、系统、可读存储介质及设备,能够实现自动对试卷中学生做错的错题进行识别,为后续错题自动统计打下基础,降低老师的工作量。

请参阅图2,所示为本发明第二实施例中的错题识别方法,可应用于错题识别设备中,所述错题识别设备上设置有用于对试卷进行拍照的高清摄像头,该错题识别设备可以由软件和/或硬件实现,所述方法包括步骤s11至步骤s18。

步骤s11,启用所述高清摄像头对带有批改痕迹的试卷进行拍照,以获取试卷图像。

在具体实施时,可将带有批改痕迹的试卷放置在所述错题识别设备上,然后启用所述高清摄像头对该试卷进行拍照,从而得到所述试卷图像。

其中,所述的批改痕迹是指试卷批改者(如老师)对试卷中学生做出的每一试题的答案的对错评判,因此所述试卷图像中的批改痕迹可以包括“√”和“×”,“√”代表该试题答案正确,“×”代表该试题答案错误。

步骤s12,对所述试卷图像中每个试题编号所在的位置进行识别。

在具体实施时,可采用文字识别技术识别出试卷图像中每个试题编号所在的位置。

步骤s13,以所述试题编号所在的位置作为截图边界,对所述试卷图像进行截图,以得到所述多个试题图像。

请参阅图3,由于试题编号为区分试题与试题之间的分隔号,因此在本实施例当中,所述试题编号所在的位置为所述试题图像的横向边界,所述试题图像的竖向边界为所述试卷图像的竖向边界以内的预设距离处。即在截取时以试题编号所在的位置为横向边界,以试题图像的竖向边界以内的预设距离处为竖向边界进行截图,从而得到所述试卷中每一试题的试题图像。其中,所述预设距离可以为5-15mm之间的任意值。

步骤s14,分别判断每一所述试题图像中是否存在完整的批改痕迹。

其中,当判断到任一试题图像中不存在完整的批改痕迹时,执行步骤s15,当判断到每一试题图像中均存在完整的批改痕迹时,则执行步骤s16。

可以理解的,一般情况下,试卷批改者在批改试卷时,会将批改痕迹写在对应试题的区域内,这种情况下截取的每一试题图像中均会存在完整的批改痕迹(如图3所示),当特殊情况时,试卷批改者在批改试卷时,若无意间将批改痕迹写在对应试题的区域上或区域外,这种情况下截取的某一或某些试题图像中会不存在批改痕迹,或者存在批改痕迹但批改痕迹不完整(如图4所示)。

步骤s15,扩大截取范围,并在所述试卷图像中,重新对不存在完整的批改痕迹的试题图像对应的试题所在的图像区域进行截取,并返回执行步骤s14。

其中,截取范围的每次扩大距离可以进行预设,例如每次向外偏移5mm。

本实施例针对上述的特殊批改情况,当识别到任一试题图像中不存在完整的批改痕迹时,会自动扩大截取范围,并重新对相应试题所在的图像区域进行截取,直到每一试题图像中均会存在完整的批改痕迹;若扩大截取范围预设次数后,该试题图像中扔不存在完整的批改痕迹,或者扩大截取范围后,该试题图像中存在两个及以上的批改痕迹时,可以进行报警提示,并将该无法确认的试题进行显示。

步骤s16,分别对每一所述试题图像中的批改痕迹进行识别,并根据识别结果筛选出所有错题的试题图像。

可以理解的,本步骤可以基于图像识别技术来识别每一试题图像中的批改痕迹,例如当识别到一试题图像中的批改痕迹为“×”时,代表该批改痕迹对应的试题为学生做错的试题,则将其归类为错题的试题图像,从而筛选出所有错题的试题图像。

步骤s17,根据所述错题的试题图像,从题库中识别出所述试卷中所有做错的试题。

作为一种实现方式,可以将每一所述错题的试题图像分别与题库中每一试题的预设标准图像进行匹配,从而匹配出相似度最高的预设标准图像,则该相似度最高的预设标准图像对应的试题即为所述试卷中做错的试题。作为一种替代的实现方式,还可以根据文字识别技术来识别出所述错题的试题图像的文字内容,从而根据该文字内容来从题库中识别出对应的试题。

步骤s18,对所述做错的试题进行标记。

其中,将所述做错的试题进行标记的方式包括但不限于如下方式:

(1)计数标记,例如错一下计数一次;

(2)变色标记,例如显示为红色;

(3)将做错的试题列入错题列表中。

在另一实施例当中,所述错题识别方法在获取到所述试卷图像的步骤之后,还可以包括:

对所述试卷图像进行图像处理;其中,对所述试卷图像进行的图像处理至少可以包括灰度化处理,灰度化处理的目的在于减少数据量,加快数据处理速度,在具体实施时可以采用分量法、最大值法、平均值法和加权平均法四种方法对试卷图像进行灰度化处理。此外,在其它实施例当中,还可以对试卷图像进行滤波、降噪等图像处理。

本发明另一方面还提供一种错题识别系统,请查阅图5,所示为本发明第三实施例中的错题识别系统,可应用于一错题识别设备中,该错题识别设备可以由软件和/或硬件实现,所述系统包括图像获取模块11、图像截取模块12、痕迹识别模块13以及错题识别模块14。其中:

图像获取模块11,用于获取带有批改痕迹的试卷图像。

在具体实施时,可在该错题识别设备上设置摄像头和/或扫描仪,以使可以通过摄像头对带有批改痕迹的试卷进行拍照、或者扫描仪对带有批改痕迹的试卷进行扫描成像的方式来获得所述试卷图像。或者还可以通过数据下载、上传、导入等方式直接从外接设备中获取。

其中,所述的批改痕迹是指试卷批改者(如老师)对试卷中学生做出的每一试题的答案的对错评判,因此所述试卷图像中的批改痕迹可以包括“√”和“×”,“√”代表该试题答案正确,“×”代表该试题答案错误。

图像截取模块12,用于分别对所述试卷图像中的每一试题所在的图像区域进行截取,以得到多个试题图像。

作为一种实现方式,本步骤可以通过文字识别技术(opticalcharacterrecognition,简称ocr)来识别出每一试题所在的图像区域,然后根据识别结果进行每一试题的图像截取。作为另一种实现方式,可以对试卷进行排版,使试卷中的每一试题都处在一独立的边框内,且对于客观题该边框内可以预留足够的答题空间,基于此本步骤即可将试题边框作为截取边界进行每一试题的图像截取。其中,ocr是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

可以理解的,在截取试题图像时,也可以根据设定的分析对象的要求,只截取出部分试题的试题图像,例如只截图选择题的试题图像等,这样可以为后续实现针对同一类型的试题进行错题统计。

痕迹识别模块13,用于分别对每一所述试题图像中的批改痕迹进行识别,并根据识别结果筛选出所有错题的试题图像。

可以理解的,本步骤可以基于图像识别技术来识别每一试题图像中的批改痕迹,例如当识别到一试题图像中的批改痕迹为“×”时,代表该批改痕迹对应的试题为学生做错的试题,则将其归类为错题的试题图像,从而筛选出所有错题的试题图像。

错题识别模块14,用于根据所述错题的试题图像,从题库中识别出所述试卷中所有做错的试题。

作为一种实现方式,可以将每一所述错题的试题图像分别与题库中每一试题的预设标准图像进行匹配,从而匹配出相似度最高的预设标准图像,则该相似度最高的预设标准图像对应的试题即为所述试卷中做错的试题。作为一种替代的实现方式,还可以根据文字识别技术来识别出所述错题的试题图像的文字内容,从而根据该文字内容来从题库中识别出对应的试题。

进一步地,所述图像截取模块12还可以用于对所述试卷图像中每个试题编号所在的位置进行识别,并以所述试题编号所在的位置作为截图边界,对所述试卷图像进行截图,以得到所述多个试题图像。

在一实施例当中,所述试题编号所在的位置为所述试题图像的横向边界,所述试题图像的竖向边界为所述试卷图像的竖向边界以内的预设距离处。

进一步地,所述痕迹识别模块13还可以用于从所述试题图像中截取所述批改痕迹所在的图像区域,以得到批改痕迹图像,并将所述批改痕迹图像与预设的批改标准图像进行匹配,以得出所述试题图像的批改类型。

进一步地,所述痕迹识别模块13还可以用于将所述批改类型为错题类型的所有所述试题图像归类为所述错题的试题图像。

进一步地,所述错题识别系统还包括:

痕迹判断模块15,用于分别判断每一所述试题图像中是否存在完整的批改痕迹;

当判断到任一试题图像中不存在完整的批改痕迹时,所述图像截取模块12扩大截取范围,并在所述试卷图像中,重新对不存在完整的批改痕迹的试题图像对应的试题所在的图像区域进行截取;

当判断到每一试题图像中均存在完整的批改痕迹时,所述痕迹识别模块13分别对每一所述试题图像中的批改痕迹进行识别。

进一步地,所述错题识别系统还包括:

试题标记模块16,用于对所述做错的试题进行标记。

综上,本发明上述实施例当中的错题识别系统,通过获取带有批改痕迹的试卷图像,然后截取出每一试题的试卷图像,并对每一试题图像中的批改痕迹进行识别,从而筛选出所有错题的试题图像,最后再根据错题的试题图像,从题库中识别出试卷中所有做错的试题,因此本错题识别方法、系统、可读存储介质及设备,能够实现自动对试卷中学生做错的错题进行识别,为后续错题自动统计打下基础,降低老师的工作量。

本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的错题识别方法。

本发明还提出一种错题识别设备,请参阅图6,所示为本发明第四实施例当中的错题识别设备,包括处理器10、存储器20、存储在存储器上并可在处理器上运行的计算机程序30、以及用于对试卷进行图像捕捉的图像捕捉仪器40,所述处理器10执行所述程序30时实现如上述的错题识别方法。

其中,处理器10在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据。

其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是错题识别设备的内部存储单元,例如该错题识别设备的硬盘。存储器20在另一些实施例中也可以是错题识别设备的外部存储设备,例如错题识别设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。

其中,所述图像捕捉仪器40在一些实施例中可以是摄像头或者扫描仪。

需要指出的是,图6示出的结构并不构成对错题识别设备的限定,在其它实施例当中,该错题识别设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

综上,本实施例当中的错题识别设备,通过获取带有批改痕迹的试卷图像,然后截取出每一试题的试卷图像,并对每一试题图像中的批改痕迹进行识别,从而筛选出所有错题的试题图像,最后再根据错题的试题图像,从题库中识别出试卷中所有做错的试题,因此本错题识别方法、系统、可读存储介质及设备,能够实现自动对试卷中学生做错的错题进行识别,为后续错题自动统计打下基础,降低老师的工作量。

本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1