基于增强动态键值记忆网络的知识追踪方法

文档序号:37599556发布日期:2024-04-18 12:40阅读:9来源:国知局
基于增强动态键值记忆网络的知识追踪方法

本发明属于智慧教育,具体涉及基于增强动态键值记忆网络的知识追踪方法。


背景技术:

1、知识追踪(knowledge tracking,kt)旨在根据学生与过去练习题之间的交互序列来预测学生的未来表现,并跟踪他们技能掌握水平随时间的变化。

2、传统的kt模型主要包括贝叶斯知识追踪、表现因子分析和知识追踪机等。然而,这些模型使用简单的离散随机状态变量,这导致它们难以建模复杂的知识结构和关系;另外,这些模型假设当前的学习状态只与前一个状态有关,忽略了更长期的依赖关系,因此在处理一些需要先前多个状态的kt任务时性能下降。近年来,许多学者在kt领域广泛运用深度学习技术。深度知识追踪(deep knowledge tracing,dkt)是最早将深度学习技术应用于知识追踪的模型,随后,出现了一系列改进dkt的方法。例如,动态键值记忆网络、深度项目反应理论和练习感知知识追踪等。

3、与传统kt模型相比,深度学习kt模型能够学习到更复杂、更抽象的知识结构和关系,也能捕捉到更长期的信息。然而,它们将所有学生视为一个整体,没有考虑到学生之间的个体差异。针对这一问题,有学者提出了具有动态学生分类的深度知识追踪和记忆网络上的动态学生分类。上述两个模型都是根据学生的学习能力对学生进行分组,并以组为单位进行训练,继而为学生提供更个性化的指导。具体地,上述两个模型在每个时间间隔上直接统计原始数据集的correct字段中1或0的个数,计算出正确率和错误率之间的差值并将其表示为学生的学习能力。然而,一方面,作差法表示学生能力的方法非线性建模能力不足,且不够细粒度;另一方面,长期序列建模时容易出现过拟合问题。


技术实现思路

1、本发明的目的在于提供基于增强动态键值记忆网络的知识追踪方法,解决了在利用现有技术评估学生技能学习能力时准确度低导致无法准确开展个性化教学支持的问题。

2、本发明所采用的技术方案是:基于增强动态键值记忆网络的知识追踪方法,包括以下步骤:

3、步骤1、构建增强的动态键值记忆网络模型,动态评估学生的学习能力和练习题的难度;

4、步骤2、采用k-means聚类算法根据步骤1所得学生的学习能力对学生分组;

5、步骤3、根据步骤1所得练习题的难度、步骤2所得学生分组结果及练习题的技能与回答正确率二元组构建丰富的模型输入特征;

6、步骤4、根据步骤3所得模型输入特征进行长期序列建模并输出预测结果。

7、本发明的特点还在于,

8、步骤1具体包括以下步骤:

9、步骤1.1、考虑技能之间的先决关系来计算查询向量与静态键矩阵之间的相关权重;

10、步骤1.2、通过读操作预测学生正确回答练习题的概率;

11、步骤1.3、根据学生的作答情况并结合学生当前的知识掌握状态来更新值矩阵;

12、步骤1.4、通过学生对技能的掌握程度进一步抽象来表示学生的学习能力,对练习题的嵌入进一步抽象来表示练习题的难度。

13、步骤1.1具体包括以下步骤:

14、步骤1.1.1、计算模型输入即练习题涉及技能的连续向量表示,记为嵌入向量kt;

15、步骤1.1.2、利用先决关系编码矩阵建模技能之间存在的先决关系,计算公式如下:

16、(mk)′=mk(1+p)

17、

18、其中,p是技能间的先决关系矩阵,p∈{0,1}|n|×|n|是一个二元矩阵,如果技能sk1∈k是技能sk2∈k的先决条件,则p[sk1,sk2]=1,否则p[sk1,sk2]=0;mk是存储所有技能的静态键矩阵,n是技能数量,是全体实数,dk是存储槽维度,(mk)′是考虑了技能之间先决关系的静态键矩阵;

19、步骤1.1.3、通过嵌入向量kt与增强的键矩阵(mk)′中的每个存储槽(mk(i))′做内积,再通过softmax层激活得到相关权重。

20、步骤1.2具体包括以下步骤:

21、步骤1.2.1、利用步骤1.1计算得到的相关权重对动态值矩阵的所有存储槽进行加权并求和,获得读取向量;

22、步骤1.2.2、将读取向量与练习题自身进行拼接传递到tanh层获得包含了学生的技能掌握水平和练习题难度信息的汇总向量ft。

23、步骤1.3具体包括以下步骤:

24、步骤1.3.1、通过学生的作答情况(st,at)与嵌入矩阵b相乘得到技能增长向量vt;

25、步骤1.3.2、使用注意力机制将包含了汇总向量ft与技能增长向量vt进行融合,计算公式如下:

26、α=softmax(w1ft+wvvt+b1)

27、

28、其中,w1和wv是可学习的权重矩阵,b1是偏差向量,α是更新值矩阵时ft和vt的重要性,是学生的自适应技能增长;

29、步骤1.3.3、将技能增长写入值矩阵,对值矩阵进行更新。

30、步骤1.4具体为:将汇总向量ft作为增强的动态键值记忆网络模型全连接层的输入,再通过tanh层激活得到学生的学习能力;将嵌入向量kt传递给一个全连接层,再通过tanh层激活得到练习题的难度;计算公式如下:

31、θtj=tanh(wθft+bθ)

32、βj=tanh(wβkt+bβ)

33、其中,wθ和wβ是权重矩阵,bθ和bβ是偏差向量,θtj是学生在时间步t对练习题涉及的技能j的学习能力,βj是练习题的难度;学生sti在第z个时间间隔内的学习能力定义如下:

34、

35、其中,是学生sti在第z个时间间隔内对不同技能的学习能力,矩阵中的每个元素θtj是学生sti在时间步t对技能j的学习能力;矩阵的行表示不同的技能,列表示不同的时间步;是学生学习能力的细粒度非线性的表示;学生sti在时间间隔1到z对所有技能的学习能力计算公式如下:

36、

37、

38、

39、其中,θzj是学生sti在第z个时间间隔内对技能j的整体学习能力,(θj)1:z是学生sti从时间间隔1到z对技能j的整体学习能力,是形状为1×n的向量,其中每个元素表示学生sti从时间间隔1到z对相应技能的平均学习能力。

40、步骤3具体为:给定学生的做题记录x={x1,x2,…,xt},其中xt=(st,at),at∈{0,1},st是学生在t时间步上所做的练习题涉及的技能;at是相应的得分情况,at=1表示回答正确,at=0表示回答错误;将xt的one-hot编码嵌入向量xt与t时间步上学生所属分组ct和练习题难度dt拼接构建丰富的模型输入特征。

41、步骤4中采用循环门控单元gru作为学生知识状态随时间变化的序列建模工具,具体为:在隐藏层中,将响应序列划分为多个时间间隔,每个时间间隔的最后一个节点作为下一个时间间隔的第一个节点;对于时间间隔z内的时间步t,将上一时间步的隐藏状态ht-1和当前时间步的输入xt联合作为gru的输入,计算当前时间步的隐藏状态;然后,将当前时间步gru的输出向量ht作为sigmoid层的输入,经过sigmoid层处理得到输出yt。

42、本发明的有益效果是:本发明的基于增强动态键值记忆网络的知识追踪方法,通过在动态键值记忆网络求解相关权重的过程中,考虑了技能之间的先决关系,从而更好地捕捉技能之间的依赖关系、优化注意力的分配;在动态键值记忆网络的写操作中,通过将包含有学生技能掌握水平和练习题信息的汇总向量与技能增长向量进行融合的方式,解决了忽视当前技能掌握状态的问题,并在融合时使用注意力机制,自适应地确定各部分的重要性,进而更准确地评估学生的学习能力,并为学生提供更准确的个性化教学和支持;进一步增加序列建模模型的输入特征,并采用参数较少的门控单元gru作为学生知识状态随时间变化的序列建模工具,进一步地缓解了模型的过拟合问题,从而提高了对学生回答问题时正确率的预测准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1