一种基于人工智能的试卷批改方法和系统与流程

文档序号：18398244发布日期：2019-08-09 23:37阅读：815来源：国知局

本申请涉及自然语言处理技术领域，尤其涉及一种基于人工智能的试卷批改方法和系统。

背景技术：

随着计算机技术和教育信息化的不断推进，计算机技术已经逐步应用于日常的教育教学各项活动中，例如在教学评测场景下得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试，在此状况下，教师背负着很大的批改作业和试卷的工作压力。针对这种现象，在大中型或重要性高的考试或测试中已经逐渐推广和采用了各类自动阅卷系统，这类系统能够一定程度上减轻教师阅卷的工作量。

现有的自动阅卷系统中完全由计算机完成阅卷的部分多是对填涂性客观题(如选择题)的阅卷，采用的处理方法是读取填图卡的数据，将其和标准答案进行比对，这个方法虽然有效提高了批阅速度，但是需要学生作答时使用2b铅笔进行客观题的作答，不仅多有不便，还容易出现误涂、漏涂等情况。此外，学生手写作答的打印试卷在批改时则严重依赖老师或家长的手动检查和批改，特别是填空题或主观题这类题目，答案的位置和具体内容无法有效通过现有的阅卷系统进行自动识别，或者识别效果差效率低。

随着互联网技术和产品逐步向教育领域渗透，在线教育的受众的规模不断扩大，又进一步增加了考试和作业评阅的数量。因此如何减少人工评阅的工作量，提高试卷批改效率，是目前业界亟待解决的问题。

技术实现要素：

有鉴于此，本申请的目的在于提出一种基于人工智能的试卷批改方法和系统，来解决现有技术中的人工评阅的工作量大，试卷批改效率较低的技术问题。

基于上述目的，在本申请的一个方面，提出了一种基于人工智能的试卷批改方法，包括：

获取待批改试卷的题干图像信息；

利用预先训练的神经网络模型对所述题干图像信息进行切分，将所述题干图像信息切分为多个第一字段；

利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息，生成统一的第一切分图像；

获取所述待批改试卷的答案图像信息；

利用所述神经网络模型对所述答案图像信息进行切分，将所述答案图像信息切分为多个第二字段；

利用计算机识别技术识别出切分后的多个第二字段中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置信息，生成统一的第二切分图像；

将所述第二切分图像与对应的标准答案进行比对，确定所述第二切分图像对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。

在一些实施例中，在所述利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息的同时，还包括：

判断是否能识别出所述多个第一字段中的分值，若能识别出所述多个第一字段中的分值，则识别出所述多个第一字段中的分值，若不能识别出所述多个第一字段中的分值，则由人工输入分值。

在一些实施例中，还包括：

接收人工输入的修正信息，根据所述修正信息对所述第一切分图像进行修正和补充。

在一些实施例中，所述获取所述待批改试卷的答案图像信息，包括：

扫描所述待批改试卷的答案区信息，获取所述待批改试卷的答案图像信息，并对所述图像信息进行识别，输出识别结果，若遇到无法识别的或者可信度低于第一预设阈值的图像信息，则保留原图像信息作为识别结果。

在一些实施例中，所述获取所述待批改试卷的答案图像信息，包括：

根据智能笔书写痕迹和对应位置的坐标点，获取答案笔迹信息，对所述笔迹信息进行识别，输出识别结果，若遇到无法识别的或者可信度低于第二预设阈值的笔迹信息，则保留原笔迹信息，作为识别结果。

在一些实施例中，还包括：

对于无法识别的或者可信度低于第一预设阈值的图像信息和无法识别的或者可信度低于第二预设阈值的笔迹信息，接收人工确定的对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。

在一些实施例中，所述确定所述第二切分图像对应的分值，包括：

对于客观题，将识别结果与标准答案进行比对，直接输出对应的分值；

对于主观题，先对识别结果进行语义分析，并将语义分析后的识别结果与标准答案进行比对，对语义分析后的识别结果进行批改，生成批改后的结果以及批改可信度；

对于作文，先对识别结果进行语义分析，对语义分析后的识别结果进行批改，输出对应的语言能力等级、优点、缺点和分值。

在一些实施例中，还包括：

接收人工对确定的所述第二切分图像对应的分值的修正，并将修正后的分值作为输出结果。

基于上述目的，在本申请的另一个方面，还提出了一种基于人工智能的试卷批改系统，包括：

第一图像信息获取模块，用于获取待批改试卷的题干图像信息；

第一图像信息切分模块，用于利用预先训练的神经网络模型对所述题干图像信息进行切分，将所述题干图像信息切分为多个第一字段；

第一图像识别模块，用于利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息，生成统一的第一切分图像；

第二图像信息获取模块，用于获取所述待批改试卷的答案图像信息；

第二图像信息切分模块，用于利用所述神经网络模型对所述答案图像信息进行切分，将所述答案图像信息切分为多个第二字段；

第二图像识别模块，用于利用计算机识别技术识别出切分后的多个第二字段中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置信息，生成统一的第二切分图像；

对比模块，用于将所述第二切分图像与对应的标准答案进行比对，确定所述第二切分图像对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。

在一些实施例中，还包括：

人工输入模块，用于接收人工输入的分值，并接收人工输入的修正信息，根据所述修正信息对所述第一切分图像进行修正和补充，以及，接收人工对确定的所述第二切分图像对应的分值的修正，并将修正后的分值作为输出结果。

本申请实施例提供的一种基于人工智能的试卷批改方法和系统，其中方法包括：获取待批改试卷的题干图像信息；利用预先训练的神经网络模型对所述题干图像信息进行切分，将所述图像信息切分为多个第一字段；利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息，生成统一的第一切分图像；获取所述待批改试卷的答案图像信息；利用所述神经网络模型对所述题干图像信息进行切分，将所述图像信息切分为多个第二字段；利用计算机识别技术识别出切分后的多个第二字段中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置信息，生成统一的第二切分图像；将所述第二切分图像与对应的标准答案进行比对，确定所述第二切分图像对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。本申请实施例的基于人工智能的试卷批改方法和系统，能够对填空题或主观题进行自动识别，且识别效率较高，减少了人工评阅的工作量，提高试卷批改效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请实施例一的基于人工智能的试卷批改方法的流程图；

图2是本申请实施例二的基于人工智能的试卷批改系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本申请实施例的基于人工智能的试卷批改方法和系统，基于计算机视觉、卷积神经网络和自然语言处理技术对试卷进行批改，首先获取待批改试卷的题干图像信息，利用计算机视觉将获取到的题干图像信息切分为多个独立的字段，然后利用预先训练的神经网络模型对切分后的字段进行识别，从而识别出待批改试卷的题号、题型和知识点以及题号、题型和知识点的对应位置等，再扫描学生的答案，获取待批改试卷的答案图像信息，利用计算机视觉将获取到的答案图像信息切分为多个独立的字段，然后利用预先训练的神经网络模型对切分后的字段进行识别，从而识别出答案图像信息中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置信息，再将识别出来的文字、数字和公式与标准答案进行对比，输出对应的分值，从而完成对试卷的批改。具体地，如图1所示，是本申请实施例一的基于人工智能的试卷批改方法的流程图，从图1中可以看出，本实施例的基于人工智能的试卷批改方法，包括以下步骤：

s101：获取待批改试卷的题干图像信息。

在本实施例中，当需要利用本申请实施例的方法对试卷进行批改时，首先需要获取待批改试卷的题干图像信息。在获取待批改试卷的题干图像信息时，可以通过扫描未作答的试卷来获取待批改试卷的题干图像信息，也可以扫描作答试卷的题干区域来获取待批改试卷的题干图像信息，此外，还可以扫描作答试卷的全部区域，然后利用计算机视觉从中提取出待批改试卷的题干图像信息，或者也可以由人工输入待批改试卷的题干图像信息。

s102：利用预先训练的神经网络模型对所述题干图像信息进行切分，将所述题干图像信息切分为多个第一字段。

在获取到待批改试卷的题干图像信息后，可以利用预先训练的神经网络模型对所述题干图像信息进行切分，将所述题干图像信息切分为多个第一字段。具体地，对于上述题干图像信息，利用计算机视觉从中提取出文字信息，然后再利用预先训练的神经网络模型将提取出来的文字信息切分为多个第一字段，即将题干中的汉字序列切分成一个一个单独的词，本实施例中的第一字段是指题干中的单独的词。本实施例中的神经网络模型是以大量的文本作为学习样本，对神经网络模型进行训练，并输出文本包含的单独的词，并利用生成的单独的词对神经网络模型的参数进行修正，从而生成本实施例中用于对题干图像信息进行切分的神经网络模型。

s103：利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息，生成统一的第一切分图像。

在完成对题干的切分后，利用计算机识别技术识别出切分后的单独的词中分别表示题号、题型和知识点的词，以及表示题号、题型和知识点的词在原题干中的对应位置，并根据表示题号、题型和知识点的词在原题干中的对应位置生成第一切分图像，该第一切分图像例如可以是答题卡等包括题号和题型的表格，或者包括题号、题型和答题位置的表格，该答题位置为空白区域，用于填写学生针对题干做出的答案。此外，还可以接收人工输入的修正信息，根据所述修正信息对所述第一切分图像进行修正和补充。

通过上述步骤，可以生成统一的答题卡，对试卷的批改。

s104：获取所述待批改试卷的答案图像信息。

在本实施例中，可以通过扫描待批改试卷的答案区域来获取所述待批改试卷的答案图像信息。具体地，对于纸质试卷，可以扫描所述待批改试卷的答案区信息，获取所述待批改试卷的答案图像信息，并对所述图像信息进行识别，输出识别结果，若遇到无法识别的或者可信度低于第一预设阈值的图像信息，则保留原图像信息作为识别结果。而对于电子试卷，即用户(学生)通过电子笔在触控屏上作答的试卷，则可以根据智能笔书写痕迹和对应位置的坐标点，获取答案笔迹信息，对所述笔迹信息进行识别，输出识别结果，若遇到无法识别的或者可信度低于第二预设阈值的笔迹信息，则保留原笔迹信息，作为识别结果。在本实施例中，可信度低于第一预设阈值的图像信息和可信度低于第二预设阈值的图像信息是指识别结果的准确率低于预设阈值的图像信息，第一预设阈值相对于纸质试卷而言，第二预设阈值相对于电子试卷而言。对于无法识别的或者可信度低于第一预设阈值的图像信息和无法识别的或者可信度低于第二预设阈值的笔迹信息，接收人工确定的对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。

s105：利用所述神经网络模型对所述答案图像信息进行切分，将所述答案图像信息切分为多个第二字段。

在本实施例中，在获取到待批改试卷的答案图像信息后，可以利用预先训练的神经网络模型对所述答案图像信息进行切分，将所述答案图像信息切分为多个第二字段。具体地，对于上述答案图像信息，利用计算机视觉从中提取出文字信息，然后再利用预先训练的神经网络模型将提取出来的文字信息切分为多个第二字段，即将答案中的汉字序列切分成一个一个单独的词，本实施例中的第二字段是指答案中的单独的词。

s106：利用计算机识别技术识别出切分后的多个第二字段中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置信息，生成统一的第二切分图像。

在本实施例中，在完成对答案的切分后，利用计算机识别技术识别出切分后的单独的词中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置，生成统一的第二切分图像，该第二切分图像例如可以是答题卡等包括答案的表格，答题卡中的答案具有统一的位置。

s107：将所述第二切分图像与对应的标准答案进行比对，确定所述第二切分图像对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。

在生成第二切分图像后，将第二切分图像中的答案与对应的标准答案进行对比，确定第二切分图像中各答案的分值。具体地，对于客观题，将识别结果与标准答案进行比对，直接输出对应的分值。对于主观题，先对识别结果进行语义分析，并将语义分析后的识别结果与标准答案进行比对，对语义分析后的识别结果进行批改，生成批改后的结果以及批改可信度。对于作文，对先识别结果进行语义分析，对语义分析后的识别结果进行批改，输出对应的语言能力等级、优点、缺点和分值。并将所述分值添加到第一切分图像中的对应位置处。例如该答案是选择题的选项，则将该选项对应的分值添加到第一切分图像中与该选项对应的题号对应的空白位置处。此外，还可以接收人工对确定的所述第二切分图像对应的分值的修正，并将修正后的分值作为输出结果。

本申请实施例的基于人工智能的试卷批改方法，能够对填空题或主观题进行自动识别，且识别效率较高，减少了人工评阅的工作量，提高试卷批改效率。

此外，作为本申请的一个可选实施例，在上述实施例中，在利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息的同时，还可以同时判断是否能识别出所述多个第一字段中的分值，若能识别出所述多个第一字段中的分值，则识别出所述多个第一字段中的分值，若不能识别出所述多个第一字段中的分值，则由人工输入分值。

如图2所示，是本申请实施例二的基于人工智能的试卷批改系统的结构示意图。从图中可以看出，本实施例的基于人工智能的试卷批改系统，可以包括：

第一图像信息获取模块201，用于获取待批改试卷的题干图像信息。在获取待批改试卷的题干图像信息时，可以通过扫描未作答的试卷来获取待批改试卷的题干图像信息，也可以扫描作答试卷的题干区域来获取待批改试卷的题干图像信息，此外，还可以扫描作答试卷的全部区域，然后利用计算机视觉从中提取出待批改试卷的题干图像信息，或者也可以由人工输入待批改试卷的题干图像信息。

第一图像信息切分模块202，用于利用预先训练的神经网络模型对所述题干图像信息进行切分，将所述题干图像信息切分为多个第一字段。

第一图像识别模块203，用于利用计算机识别技术识别出切分后的多个第一字段中的题号、题型和知识点以及所述题号、所述题型和所述知识点的对应位置信息，生成统一的第一切分图像。

在完成对题干的切分后，由所述第一图像识别模块203利用计算机识别技术识别出切分后的单独的词中分别表示题号、题型和知识点的词，以及表示题号、题型和知识点的词在原题干中的对应位置，并根据表示题号、题型和知识点的词在原题干中的对应位置生成第一切分图像，该第一切分图像例如可以是答题卡等包括题号和题型的表格，或者包括题号、题型和答题位置的表格，该答题位置为空白区域，用于填写学生针对题干做出的答案。此外，还可以接收人工输入的修正信息，根据所述修正信息对所述第一切分图像进行修正和补充。

第二图像信息获取模块204，用于获取所述待批改试卷的答案图像信息。

第二图像信息切分模块205，用于利用所述神经网络模型对所述答案图像信息进行切分，将所述答案图像信息切分为多个第二字段。

第二图像识别模块206，用于利用计算机识别技术识别出切分后的多个第二字段中的文字、数字和公式以及所述文字、所述数字和所述公式的对应位置信息，生成统一的第二切分图像。

对比模块207，用于将所述第二切分图像与对应的标准答案进行比对，确定所述第二切分图像对应的分值，并将所述分值添加到所述第一切分图像中的对应位置处。

本申请实施例的基于人工智能的试卷批改系统，能够对填空题或主观题进行自动识别，且识别效率较高，减少了人工评阅的工作量，提高试卷批改效率。

此外，作为本申请基于人工智能的试卷批改系统的一个可选实施例，在上述实施例中，还可以包括：

人工输入模块，所述人工输入模块用于接收人工输入的分值，并接收人工输入的修正信息，根据所述修正信息对所述第一切分图像进行修正和补充，以及，接收人工对确定的所述第二切分图像对应的分值的修正，并将修正后的分值作为输出结果。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明，还可以是其它实施方式，如，步骤101-103与步骤104-106同时进行，也即并行处理。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张明;瞿波;张国斌
技术所有人：杭州笔声智能科技有限公司
我是此专利的发明人

上一篇：一种适用于高通量基因分型的水稻DNA样本的提取方法与流程
上一篇：一种莜麦的特色保健食品的制作方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。