一种离题检测方法、装置、设备及可读存储介质与流程

文档序号：24875143发布日期：2021-04-30 12:49阅读：116来源：国知局

本申请涉及离题检测技术领域，特别涉及一种离题检测方法、离题检测装置、离题检测设备及计算机可读存储介质。

背景技术：

目前，在进行网络机考或纸笔笔试后，需要大量阅卷人进行人工阅卷。其中，阅卷的重点项目之一为判断针对题目的回答是否离题。当针对问题的回答没有切题，即离题时，说明学生没有理解问题的实质，因此即使回答语句写得再好，也不应该得到高分。因此，如何判断作文是否离题对于机器自动阅卷具有重要意义。目前，该项目需要阅卷人对题目和回答进行仔细阅读和分析，需要花费较多时间和精力，会降低阅卷速度，使得阅卷工作繁重，进而浪费了大量人力物力。

因此，如何当前人工阅卷速度慢，浪费大量人力物力的问题，是本领域技术人员需要解决的技术问题。

技术实现要素：

有鉴于此，本发明的目的在于提供一种离题检测方法、离题检测装置、离题检测设备及计算机可读存储介质，解决了人工阅卷速度慢，浪费大量人力物力的问题。

为解决上述技术问题，本发明提供了一种离题检测方法，包括：

获取问题和与所述问题对应的回答；

分别对所述问题和所述回答进行编码处理，在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征；

对所述问题rnn特征和多个所述回答rnn特征进行注意力权重分配处理，得到注意力特征；

对所述问题rnn特征和所述注意力特征进行相关性计算，得到与所述问题和所述回答对应的相关性特征；

利用所述相关性特征确定所述问题和所述回答之间的离题检测结果。

可选的，所述分别对所述问题和所述回答进行编码处理，在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征，包括：

利用训练好的全局词表征向量对所述问题和所述回答中的每个token进行提取并编码表示，得到多个问题编码token和多个回答编码token；

将各个所述问题编码token先后输入循环神经网络，得到一个所述问题rnn特征；

将各个所述回答编码token分别输入所述循环神经网络，得到多个分别与所述回答编码token对应的回答rnn特征。

可选的，所述对所述问题rnn特征和多个所述回答rnn特征进行注意力权重分配处理，得到注意力特征，包括：

利用所述问题rnn特征和所述问题编码token生成一个问题短链接；

分别利用各个所述回答编码token和与所述回答编码token对应的回答rnn特征生成多个对应的回答短链接；

分别利用各个所述回答短链接和所述问题短链接进行相似度计算，对计算结果进行归一化，得到多个与所述回答编码token对应的归一化相似度；

利用所述归一化相似度和对应的所述回答短链接进行加权求和计算，得到所述注意力特征。

可选的，在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征，包括：

将各个所述问题编码token先后输入具有双向lstm结构的循环神经网络中，得到一个所述问题rnn特征。

可选的，所述对所述问题rnn特征和所述注意力特征进行相关性计算，得到与所述问题和所述回答对应的相关性特征，包括：

利用所述门控单元对所述问题rnn特征和所述注意力特征进行0-1映射计算，得到映射值；

利用所述映射值、所述问题rnn特征和所述注意力特征进行相关性计算，得到所述相关性特征。

可选的，利用所述相关性特征确定所述问题和所述回答之间的离题检测结果，包括：

对所述相关性特征进行归一化处理和dropout处理，得到处理后特征；

将所述处理后特征输入全连接层，得到所述离题检测结果。

可选的，将所述处理后特征输入全连接层，得到所述离题检测结果，包括：

将所述处理后特征输入第一全连接层，得到第一结果；

将所述第一结果输入第二全连接层，得到所述离题检测结果。

本发明还提供了一种离题检测装置，包括：

问题和回答获取模块，用于获取问题和与所述问题对应的回答；

循环特征获取模块，用于分别对所述问题和所述回答进行编码处理，在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征；

注意力特征获取模块，用于对所述问题rnn特征和多个所述回答rnn特征进行注意力权重分配处理，得到注意力特征；

相关性特征获取模块，用于对所述问题rnn特征和所述注意力特征进行相关性计算，得到与所述问题和所述回答对应的相关性特征；

检测结果获取模块，用于利用所述相关性特征确定所述问题和所述回答之间的离题检测结果。

本发明还提供了一种离题检测设备，包括存储器和处理器，其中：

所述存储器，用于保存计算机程序；

所述处理器，用于执行所述计算机程序，以实现上述的离题检测方法。

本发明还提供了一种计算机可读存储介质，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现上述的离题检测方法。

本发明提供的离题检测方法，获取问题和与问题对应的回答。对问题和回答进行编码、rnn特征提取和注意力权重分配处理，得到问题rnn特征和注意力特征。对问题rnn特征和注意力特征进行相关性计算，得到与问题和回答对应的相关性特征。利用相关性特征确定问题和回答之间的离题检测结果。

可见，该方法对问题和回答进行处理后，利用问题rnn特征和注意力特征进行相关性计算，可以得到问题与回答的相关性特征，再利用相关性特征确定离题检测结果。该方法可以在阅卷工作中帮助阅卷人进行回答离题判断，不需要阅卷人进行人工判断，因此减少了阅卷人的工作量，同时减少了阅卷所需的时间，避免了人力物力的浪费。

此外，本发明还提供了一种离题检测装置、离题检测设备及计算机可读存储介质，同样具有上述有益效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种离题检测方法流程图；

图2为本发明实施例提供的一种注意力特征生成方法流程图；

图3为本发明实施例提供的另一种注意力特征生成方法流程图；

图4为本发明实施例提供的另一种离题检测方法流程图；

图5为本发明实施例提供的一种离题检测装置的结构示意图；

图6为本发明实施例提供的一种离题检测设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，图1为本发明实施例提供的一种离题检测方法流程图。该方法包括：

s101：获取问题和与问题对应的回答。

具体的，问题和与问题对应的回答可以为连续的文字句子，也可以为其他形式，例如可以为问题音频和回答音频，对音频进行识别并转换，得到与其对应的文字。需要说明的是，每次获取均获取一个问题和一个与问题对应的回答。本实施例并不限定执行获取操作的时机，例如当检测到获取指令时执行获取操作。

s102：分别对问题和回答进行编码处理，在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征。

分别对问题和回答进行编码处理，并在编码处理后分别进行rnn特征提取处理。在本实施例中，可以利用训练好的glove(globalvectorsforwordrepresentation，全局词表征向量)词向量分别对问题和回答中的每个token进行提取并编码。token为问题和回答中的单词或标点符号。glove词向量的具体训练过程可以参考相关技术，在此不再赘述。利用训练好的全局词表征向量对问题和回答中的每个token进行提取并编码表示，得到多个问题编码token和多个回答编码token。在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征，具体的，将各个问题编码token先后输入循环神经网络，即rnn神经网络，并取循环神经网络最后一个时间步对应的隐层输出，即可得到一个问题rnn特征。

将多个回答编码token分别输入上述的循环神经网络，得到多个分别与回答编码token对应的回答rnn特征。本实施例不限定问题rnn特征和回答rnn特征的具体形式，例如可以为向量。

进一步，为了兼顾问题rnn特征和回答rnn特征的上下文信息，提高识别准确率，本实施例中优选的，利用具有双向lstm结构的循环神经网络进行rnn特征提取处理。即将各个问题编码token先后输入具有双向lstm结构的循环神经网络中，得到问题rnn特征。将多个回答编码token分别输入上述具有双向lstm结构的循环神经网络，得到多个分别与回答编码token对应的回答rnn特征。lstm(longshort-termmemory，长短时记忆网络)属于特殊rnn神经网络，能够较好处理长依赖并缓解rnn梯度消失的问题，而双向lstm结构能够兼顾token前后的上下文信息，因此本实施例优选具有双向lstm结构的循环神经网络进行rnn特征提取。

s103：对问题rnn特征和多个回答rnn特征进行注意力权重分配处理，得到注意力特征。

利用注意力(attention)机制，对问题rnn特征和回答rnn特征进行注意力权重分配处理，可以得到注意力特征。本实施例中，具体的注意力特征生成方法可参考图2，图2为本发明实施例提供的一种注意力特征生成方法流程图，包括：

s201：利用问题rnn特征和问题编码token生成一个问题短链接。

为了丰富问题和回答的语义表征，使得生成注意力特征时的输入信息不仅包含rnn特征，还包含问题和回答的编码token特征。本实施例优选的，借鉴resnet的残差链接(residualconnection)方法，生成一个问题短链接和多个回答短链接。具体的，将所有问题编码token相加后取平均，得到问题平均token，利用该问题平均token和问题rnn特征按照残差链接方法拼接生成一个问题短链接。具体的生成方法可参考相关技术，在此不再赘述。

s202：分别利用各个回答编码token和与回答编码token对应的回答rnn特征生成多个对应的回答短链接。

获取各个回答编码token和对应的回答rnn特征，按照上述残差链接的方法拼接生成多个回答短链接。需要说明的是，生成的回答短链接的数量与回答rnn特征的数量相同，即每个回答短链接与一个回答rnn特征相对应，也与一个回答编码token相对应。

s203：分别利用各个回答短链接和问题短链接进行相似度计算，对计算结果进行归一化，得到多个与回答编码token对应的归一化相似度。

利用回答短连接和问题短链接进行相似度计算，得到多个计算计算结果，并对计算结果进行归一化得到多个与回答编码token对应的归一化相似度，即得到多个与回答rnn特征对应的归一化相似度。具体的，请参考图3，图3为本发明实施例提供的另一种注意力特征生成方法流程图。其中key与value均为回答短连接，query为问题短链接，attentionvalue为注意力特征。本实施例中，假设有四个回答短链接，其中key1与value1相同，key2与value2相同，key3和value3相同，key4和value4相同。将回答短链接和问题短链接输入后，经过f(q,k)计算，得到s1、s2、s3和s4。对s1、s2、s3和s4进行类softmax()归一化处理，得到对应的归一化相似度a1、a2、a3和a4。

s204：利用归一化相似度和对应的回答短链接进行加权求和计算，得到注意力特征。

利用归一化相似度和对应的回答短连接进行加权求和计算，即可得到注意力特征，归一化相似度即为加权求和计算过程中的权重。请参考图3，图3为本发明实施例提供的另一种注意力特征生成方法流程图。将归一化西安四度和对应的回答短链接相乘后再相加，即可得到注意力特征。即将a1和value1相乘，将a2和value2相乘，将a3和value4相乘，将a4和value4相乘，将相乘后的结果进行相加，得到注意力特征。

s104：对问题rnn特征和注意力特征进行相关性计算，得到与问题和回答对应的相关性特征。

为了加强回答中与问题相关的关键词，并弱化回答中与问题不相关的关键词，进而提高识别准确率。本发明对问题rnn特征和注意力特征进行相关性计算，得到与问题和回答对应的相关性特征。本实施例并不限定相关性特征的计算方法和过程，例如可以计算问题rnn特征和注意力特征之间的cosine相似度作为相关性特征；或者可以计算上述二者之间的欧氏距离作为相关性特征；或者可以计算上述二者之间的皮尔逊距离作为相关性特征。优选的，本实施例利用门控单元计算相关性特征，具体的，利用门控单元对问题rnn特征和注意力特征进行0-1映射计算，得到映射值。在本实施例中，可以利用sigmoid函数来进行0-1映射，得到映射值。再利用映射值、问题rnn特征和注意力特征进行相关性计算，得到相关性特征。

具体的，利用

计算相关性特征，其中，利用表示问题rnn特征，利用ct表示注意力特征，利用gt表示映射值，利用表示相关性特征，wt为固定参量。映射值为一个向量，其中的元素接近于0，说明该元素对应的回答编码token与问题越不相关；元素越接近于1，说明该元素对应的回答编码token与问题越相关。

s105：利用相关性特征确定问题和回答之间的离题检测结果。

在得到相关性特征后，利用该相关性特征确定问题与回答之间的离题检测结果。具体的，先对相关性特征进行归一化和dropout处理，得到处理后特征。dropout处理为止随机移除神经网络中的某些神经元以及其对应的连接，即在前向传播时，让某些神经元的激活值以一定概率为0。这样可以防止神经网络过拟合，增强神经网络的泛化能力。将处理后特征输入全连接层进行识别，最总得到离题检测结果。

进一步，为了提高检测准确率，本实施例优选的，采用两个全连接层对相关性特征进行处理。具体的，可以将处理后特征输入第一全连接层，得到第一结果，将第一结果输入第二全连接层，得到离题检测结果。第一全连接层可以提取高层次特征，有利于提高检测准确率。

应用本发明实施例提供的离题检测方法，对问题和回答进行处理后，利用问题rnn特征和注意力特征进行相关性计算，可以得到问题与回答的相关性特征，再利用相关性特征确定离题检测结果。该方法可以在阅卷工作中帮助阅卷人进行回答离题判断，不需要阅卷人进行人工判断，因此减少了阅卷人的工作量，同时减少了阅卷所需的时间，避免了人力物力的浪费。

在一种可能的实施方式中，利用深度学习模型实施本发明提供的离题检测方法，具体请参考图4，图4为本发明实施例提供的另一种离题检测方法流程图，包括：

用于实施离题检测方法的深度学习模型，该模型包括编码层、循环神经网络层、注意力机制层、问答关联层和输出层。编码层用于提取和编码问题与回答中的各个token，得到问题编码token和回答编码token。循环神经网络层用于提取rnn特征，即用于获取一个问题rnn特征和多个回答rnn特征。注意力机制层用于对问题rnn特征和多个回答rnn特征进行注意力权重分配处理，得到注意力特征。问答关联层用于对问题rnn特征和注意力特征进行相关性计算，得到相关性特征。输出层用于对相关性特征进行处理得到离题检测结果。

在实际应用中，本发明提供的离题检测方法可以使切题召回率(即对切题的答案与问题进行检测并检测正确的比率)可达到99.5％(205题正确/共206题)，离题召回率(即对离题的答案与问题进行检测并检测正确的比率)可达到95.6％(197题正确/共206题)，平均准确率为97.6％，准确率极高。因此该方法可以在阅卷工作中帮助阅卷人进行回答离题判断，不需要阅卷人进行人工判断，减少了阅卷人的工作量，同时减少了阅卷所需的时间，避免了人力物力的浪费。

下面对本发明实施例提供的离题检测装置进行介绍，下文描述的离题检测装置与上文描述的离题检测方法可相互对应参照。

请参考图5，图5为本发明实施例提供的一种离题检测装置的结构示意图，包括：

问题和回答获取模块510，用于获取问题和与问题对应的回答；

循环特征获取模块520，用于分别对问题和回答进行编码处理，在编码处理后再分别进行rnn特征提取处理，得到一个问题rnn特征和多个回答rnn特征；

注意力特征获取模块530，用于对问题rnn特征和多个回答rnn特征进行注意力权重分配处理，得到注意力特征；

相关性特征获取模块540，用于对问题rnn特征和注意力特征进行相关性计算，得到与问题和回答对应的相关性特征；

检测结果获取模块550，用于利用相关性特征确定问题和回答之间的离题检测结果。

可选的，循环特征获取模块520，包括：

编码单元，用于利用训练好的全局词表征向量对问题和回答中的每个token进行提取并编码表示，得到多个问题编码token和多个回答编码token；

问题rnn特征获取单元，用于将各个问题编码token先后输入循环神经网络，得到一个问题rnn特征；

回答rnn特征获取单元，用于将各个回答编码token分别输入循环神经网络，得到多个分别与回答编码token对应的回答rnn特征。

可选的，注意力特征获取模块530，包括：

问题短链接生成单元，用于利用问题rnn特征和问题编码token生成一个问题短链接；

回答短连接生成单元，用于分别利用各个回答编码token和与回答编码token对应的回答rnn特征生成多个对应的回答短链接；

归一化相似度计算单元，用于分别利用各个回答短链接和问题短链接进行相似度计算，对计算结果进行归一化，得到多个与回答编码token对应的归一化相似度；

注意力特征计算单元，用于利用归一化相似度和对应的回答短链接进行加权求和计算，得到注意力特征。

可选的，问题rnn特征获取单元，包括：

rnn特征获取子单元，用于将各个问题编码token先后输入具有双向lstm结构的循环神经网络中，得到一个问题rnn特征。

可选的，相关性特征获取模块540，包括：

映射值计算单元，用于对问题rnn特征和注意力特征进行0-1映射计算，得到映射值；

相关性特征计算单元，用于利用映射值、问题rnn特征和注意力特征进行相关性计算，得到相关性特征。

可选的，检测结果获取模块550，包括：

处理单元，用于对相关性特征进行归一化处理和dropout处理，得到处理后特征；

结果获取单元，用于将处理后特征输入全连接层，得到离题检测结果。

可选的，结果获取单元，包括：

第一结果获取子单元，用于将处理后特征输入第一全连接层，得到第一结果；

离题检测结果获取子单元，用于将第一结果输入第二全连接层，得到离题检测结果。

下面对本发明实施例提供的离题检测设备进行介绍，下文描述的离题检测设备与上文描述的离题检测方法可相互对应参照。

请参考图6，图6为本发明实施例提供的一种离题检测设备的结构示意图，该离题检测设备包括存储器、处理器，其中：

存储器610，用于保存计算机程序；

处理器620，用于执行计算机程序，以实现上述的离题检测方法。

下面对本发明实施例提供的计算机可读存储介质进行介绍，下文描述的计算机可读存储介质与上文描述的离题检测方法可相互对应参照。

本发明还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述的离题检测方法的步骤。

该计算机可读存储介质可以包括：u盘、移动硬盘、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应该认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其他任何变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

以上对本发明所提供的一种离题检测方法、离题检测装置、离题检测设备及计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：查叶飞;李若冰
技术所有人：上海流利说信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。