本发明涉及自然语言处理,尤其涉及一种答题评分模型训练、答题评分方法、装置、设备和介质。
背景技术:
1、在日常教学中,老师通常会布置小测或课后作业来巩固学生的知识。然而,数学解答题的评阅是一项耗时较长且需要投入大量精力的任务。老师需要仔细分析学生的解题思路,并结合标准答案要求给出具体得分。尤其在高年级阶段,学生的解答思路可能和标准答案有所出入,这会降低老师的阅卷速度,同时也容易导致误判。
2、对此,传统方法多利用大量的作答文本以及对应的评分训练得到答题评分模型。上述答题评分模型适用于对解题思路较为单一,解题步骤较为固定的作答文本进行评分,但对于同一试题文本,可能存在多个不同解题思路,而上述得分预测模型无法理解不同解题思路,进而容易误判为低分或错误扣分。
技术实现思路
1、本发明提供一种答题评分模型训练、答题评分方法、装置、设备和介质,用以解决现有技术中答题评分精度较低的缺陷。
2、本发明提供一种答题评分模型训练方法,包括:
3、将试题文本以及所述试题文本对应的作答文本输入至答案生成模型,得到所述答案生成模型输出的所述试题文本对应的多个标准答案文本,所述多个标准答案文本中存在与所述作答文本解题思路一致的目标答案文本,且各标准答案文本对应的解题思路不同;
4、以各标准答案文本以及所述作答文本作为输入,以所述目标答案文本以及所述作答文本的实际评分作为标签,对初始模型进行训练,得到答题评分模型。
5、根据本发明提供的一种答题评分模型训练方法,所述以各标准答案文本以及所述作答文本作为输入,以所述目标答案文本以及所述作答文本的实际评分作为标签,对初始模型进行训练,得到答题评分模型,包括:
6、将各标准答案文本以及所述作答文本输入至初始模型,由所述初始模型预测各标准答案文本中与所述作答文本解题思路一致的预测答案文本,以及所述作答文本的预测评分;
7、基于所述预测答案文本与所述目标答案文本之间的差异,以及所述作答文本的预测评分与所述作答文本的实际评分之间的差异,对所述初始模型进行训练,得到所述答题评分模型。
8、根据本发明提供的一种答题评分模型训练方法,所述初始模型包括编码层、注意力层、分类层以及评分层;
9、所述将各标准答案文本以及所述作答文本输入至初始模型,由所述初始模型预测各标准答案文本中与所述作答文本解题思路一致的预测答案文本,以及所述作答文本的预测评分,包括:
10、将各标准答案文本以及所述作答文本输入至所述初始模型,依次经所述编码层、所述注意力层、所述分类层以及所述评分层处理后,预测各标准答案文本中与所述作答文本解题思路一致的预测答案文本,以及所述作答文本的预测评分。
11、根据本发明提供的一种答题评分模型训练方法,所述将各标准答案文本以及所述作答文本输入至所述初始模型,依次经所述编码层、所述注意力层、所述分类层以及所述评分层处理后,预测各标准答案文本中与所述作答文本解题思路一致的预测答案文本,以及所述作答文本的预测评分,包括:
12、将各标准答案文本以及所述作答文本输入至所述编码层,由所述编码层分别对各标准答案文本以及所述作答文本进行分句编码,得到各标准答案文本的编码特征以及所述作答文本的编码特征;
13、将各标准答案文本的编码特征以及所述作答文本的编码特征输入至所述注意力层,由所述注意力层将各标准答案文本的编码特征分别与所述作答文本的编码特征进行注意力交互,得到各标准答案文本的注意力特征;
14、将各标准答案文本的注意力特征输入至所述分类层,由所述分类层基于各标准答案文本的注意力特征,预测各标准答案文本中与所述作答文本解题思路一致的预测答案文本;
15、将各标准答案文本的注意力特征输入至所述评分层,由所述评分层基于各标准答案文本的注意力特征对所述作答文本进行评分,得到所述作答文本的预测评分。
16、根据本发明提供的一种答题评分模型训练方法,所述基于所述预测答案文本与所述目标答案文本之间的差异,以及所述作答文本的预测评分与所述作答文本的实际评分之间的差异,对所述初始模型进行训练,得到所述答题评分模型,包括:
17、基于所述预测答案文本与所述目标答案文本之间的差异,确定分类损失;
18、基于所述作答文本的预测评分与所述作答文本的实际评分之间的差异,确定得分损失;
19、基于预设权重,对所述分类损失和所述得分损失进行加权求和,得到模型损失;
20、以最小化所述模型损失为目标,对所述初始模型进行训练,得到所述答题评分模型。
21、根据本发明提供的一种答题评分模型训练方法,所述将试题文本以及所述试题文本对应的作答文本输入至答案生成模型,得到所述答案生成模型输出的所述试题文本对应的多个标准答案文本,包括:
22、基于所述试题文本以及所述作答文本,构建提示文本;
23、将所述试题文本、所述作答文本以及所述提示文本输入至所述答案生成模型,得到所述答案生成模型输出的所述试题文本对应的多个标准答案文本。
24、根据本发明提供的一种答题评分模型训练方法,所述将试题文本以及所述试题文本对应的作答文本输入至答案生成模型,得到所述答案生成模型输出的所述试题文本对应的多个标准答案文本,包括:
25、获取多个候选作答文本;
26、将评分大于阈值的候选作答文本作为所述作答文本,并将所述试题文本以及所述作答文本输入至所述答案生成模型,得到所述答案生成模型输出的所述试题文本对应的多个标准答案文本。
27、本发明还提供一种答题评分方法,包括:
28、确定待评分的目标作答文本以及所述目标作答文本对应的目标试题文本;
29、将所述目标作答文本以及所述目标试题文本输入至答案生成模型,得到所述答案生成模型输出的所述目标试题文本对应的多个标准作答文本;
30、将各标准作答文本以及所述目标作答文本输入至答题评分模型,得到所述答题评分模型输出的所述目标作答文本的评分;
31、其中,所述答题评分模型基于如上任一项所述的答题评分模型训练方法训练得到。
32、本发明还提供一种答题评分模型训练装置,包括:
33、第一生成单元,用于将试题文本以及所述试题文本对应的作答文本输入至答案生成模型,得到所述答案生成模型输出的所述试题文本对应的多个标准答案文本,所述多个标准答案文本中存在与所述作答文本解题思路一致的目标答案文本,且各标准答案文本对应的解题思路不同;
34、模型训练单元,用于以各标准答案文本以及所述作答文本作为输入,以所述目标答案文本以及所述作答文本的实际评分作为标签,对初始模型进行训练,得到答题评分模型。
35、本发明还提供一种答题评分装置,包括:
36、文本确定单元,用于确定待评分的目标作答文本以及所述目标作答文本对应的目标试题文本;
37、第二生成单元,用于将所述目标作答文本以及所述目标试题文本输入至答案生成模型,得到所述答案生成模型输出的所述目标试题文本对应的多个标准作答文本;
38、答题评分单元,用于将各标准作答文本以及所述目标作答文本输入至答题评分模型,得到所述答题评分模型输出的所述目标作答文本的评分;
39、其中,所述答题评分模型基于如上任一项所述的答题评分模型训练方法训练得到。
40、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述答题评分模型训练方法,或实现如上述任一种所述答题评分方法。
41、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述答题评分模型训练方法,或实现如上述任一种所述答题评分方法。
42、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述答题评分模型训练方法,或实现如上述任一种所述答题评分方法。
43、本发明提供的答题评分模型训练、答题评分方法、装置、设备和介质,基于答案生成模型,能够生成解题思路互不相同的标准答案文本,且多个标准答案文本中包括与作答文本解题思路一致的目标答案文本,从而以各标准答案文本以及所述作答文本作为输入,以目标答案文本以及作答文本的实际评分作为标签训练得到的答题评分模型能够实现针对不同解题思路的作答文本进行准确评分。