一种基于遗传算法的深度知识追踪因果解释方法及设备

文档序号:35495989发布日期:2023-09-19 22:46阅读:49来源:国知局
一种基于遗传算法的深度知识追踪因果解释方法及设备

本发明属于智能导学分析领域,更具体地,涉及一种基于遗传算法的深度知识追踪因果解释方法及设备。


背景技术:

1、知识追踪(knowledge tracing,kt)是智能导学系统(intelligent tutoringsystem,its)的核心模块,其主要职能是根据学习者的历史序列数据构建其认知发展的模型。此模型能够精准预测学习者的学习表现,为诸如学习策略调整和学习资源推荐等自适应学习技术的决策制定提供基础。近年来,随着深度学习技术的引入,由于其优越的预测表现,深度知识追踪模型逐步取代了传统模型。然而,深度神经网络的“黑盒”性质减弱了它们的可信度,限制了其更广泛的应用。因此,许多学者开始研究神经网络的可解释性,并尝试通过各种方式解读其“黑盒”。类似地,深度知识追踪(dlkt)模型也受到神经网络决策过程始终作为“黑盒”、用户无法了解决策过程的影响。为了实现高质量的学生学习过程建模,以及提高模型预测的表现,本发明应提高dlkt模型的可解释性。明确dlkt模型作出特定预测的原因将有助于分析学生的认知建模过程,从而为智能学习教学系统提供更好的学习策略支持和学习资源推荐。

2、深度神经网络的可解释性研究主要分为事后解释(post hoc explanation)和事前解释(ante hoc explanation)。前者是一种与模型无关(model-agnostic)的方法,而后者则是以可解释性作为学习目标来研究神经网络。在之前的大部分dlkt模型的可解释性工作中,大部分都是自解释模型,即设计模型本身就具备解释性,但是这在一定程度上牺牲了模型的性能。事后解释方法的一大优点是,由于预测和解释是两个相互不干扰的独立过程,因此无需为了预测性能的可解释性而妥协。相反,关于dlkt模型的事后可解释性的研究并不多。现有的研究主要是在模型中计算反向传播的梯度,以确定特征的重要性,从而为dlkt模型的决策制定提供依据。但是,所有的方法都基于相关性,这些方法获取的最终可解释结果可能会受到数据之间虚假相关性的影响。


技术实现思路

1、针对现有技术的缺陷,本发明的目的在于提供一种基于遗传算法的深度知识追踪因果解释方法及设备,旨在解决现有知识追踪模型的可解释性差,导致其可信度低,用户无法信赖知识追踪模型完成高质量学习的问题。

2、为实现上述目的,第一方面,本发明提供了一种基于遗传算法的深度知识追踪因果解释方法,包括以下步骤:

3、步骤1,构建因果归因度量框架,以确定知识追踪模型的输入序列与待预测题目信息之间的因果关联,对模型的输出结果进行解释;其通过最大化归因度量函数构造输出结果的解释子序列;所述归因度量函数用于衡量每个候选的解释子序列对模型输出结果的贡献,其中,候选的解释子序列从输入序列中生成;

4、需要说明的是,因果归因度量框架只是去度量什么样的可解释子列质量好,他的输出是因果效应值。本发明通过后续设计遗传算法,基于因果归因度量框架迭代求解,输出最终因果效应值最大的解释子序列。

5、步骤2,结合因果归因度量框架对输入序列进行基因编码操作;

6、步骤3,针对输入序列,基于多种初始化策略从中生成初始化种群;所述多种初始化策略包括顺序贪心策略、对错相关策略、技能相关策略以及随机策略,其中对错相关策略与技能相关策略是结合知识追踪领域先验所设计;

7、步骤4,评估种群中每个个体的普适度;所述普适度为个体与待预测题目之间的因果效应值,所述因果效应值对应原始输入序列中删除个体基因为预设数值的交互对后的子序列与原始输入序列之间的模型预测输出差异值;

8、步骤5,基于每个个体的普适度从种群中选择个体通过自适应交叉和自适应变异迭代生成后代;其中,在个体选择中引入惩罚项以生成更为稀疏的后代;所述自适应交叉的个体交叉概率根据个体的普适度和种群当前的迭代次数动态调整,以便迭代前期时个体和普适度相对低的个体交叉概率大,迭代后期交叉概率小;所述自适应变异中迭代次数越靠后变异概率越大,基因位置越靠后基因变异概率越大,经验矩阵提供的因果相关度越高,个体变异概率越大;所述经验矩阵用于记录可解释子序列与待预测题目之间的因果效应值;

9、步骤6,执行步骤4,之后将后代中普适度超出阈值的个体添加至精英集中,淘汰精英集中普适度低于阈值的个体;

10、步骤7,判断当前迭代是否达到终止条件,若未达到,则执行步骤5和步骤6,若达到,则对最终的后代解码得到最优解释子序列和对应的因果效应值。

11、在一个可能的实现方式中,所述知识追踪模型的输入序列为历史答题交互对和下一道待用户解答题目,输出结果为预测的下一道题目答对的概率;

12、所述因果归因度量框架的输入序列包括可解释子列和待预测题目信息,输出为可解释子列对于该预测题目的因果效应值;

13、所述结合因果归因度量框架对输入序列进行基因编码操作指基于干预操作进行基因编码,第一预设数值表示删除对应基因位上的答题交互对,第二预设数值表示保留对应基因位上的答题交互对;其中,基因位置按照答题交互对的答题时间先后排序。

14、在一个可能的实现方式中,所述因果归因度量框架通过最大化归因度量函数构造输出结果的解释子序列具体为:

15、

16、

17、其中,a(sk|yt,fθ)用于衡量每个候选解释子序列sk对输出结果yt的贡献;fθ表示待解释知识追踪模型的参数;ice(sk)为子序列sk的因果效应值,即普适度;do(·)为干预操作,do(sk)表示将原始输入序列删除sk后的序列输入到知识追踪模型;表示将原始输入序列输入到知识追踪模型,y(do(sk))指的是在原始输入序列中删除sk后知识追踪模型的输出结果,则是不对原始输入序列进行任何干预操作得到的模型输出结果。

18、在一个可能的实现方式中,所述顺序贪心策略为对全第二预设数值编码的个体采用顺序搜索的方式更改其基因为第一预设数值,如果更改后的个体得到的普适度值比更改前要高则保留该基因变化的个体,反之不保留;对错相关策略为将输入序列中做对或做错的交互对对应位的个体基因置为第一预设数值,其余全置为第二预设数值;技能相关策略为将输入序列中与最后输出结果相关或无关的答题交互对对应位的个体基因置为第一预设数值,其余全置为第二预设数值;随机策略用于随机生成余数个个体;所述余数为预设种群个数整除顺序贪心策略、对错相关策略以及技能相关策略三个策略生成个体总数后得到的余数;

19、所述方法还包括如下步骤:

20、将初始化种群中普适度排名靠前的多个个体归入初始化的精英集中。

21、在一个可能的实现方式中,所述个体选择中引入的惩罚项l为:

22、

23、其中,n为原始输入序列长度,n1为个体中含第二预设数值基因的个数,pb为模型原始输入序列对应的模型预测值,abs()表示取绝对值。

24、在一个可能的实现方式中,所述个体交叉概率pc为:

25、

26、

27、其中,g为当前迭代次数,g为总迭代次数,pmin为预设的最小交叉概率,pmax为最大交叉概率,fi为个体普适度,fa为种群平均普适度,fbest为种群最高普适度;第一预设值大于第二预设值,且第二预设值大于第三预设值,第一预设值至第三预设值均在0-0.1之间。

28、在一个可能的实现方式中,所述自适应变异的整体变异概率p为:

29、

30、其中,w1,w2,w3为三部分变异概率所占权重,w1为依据经验矩阵得出的变异概率所占权重,g为当前迭代次数,g为总迭代次数,j为个体对应基因的位置,pop[i]为种群中第i个体,len()表示计算个体基因总长度,c为置信因子,其随着迭代次数的增加而增加;b为平衡因子,当置信因子相对较低时通过平衡因子提高依据迭代次数和基因位置两部分的变异概率。

31、第二方面,本技术提供一种电子设备,包括:至少一个存储器,用于存储程序;至少一个处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行第一方面或第一方面的任一种可能的实现方式所描述的方法。

32、第三方面,本技术提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,当计算机程序在处理器上运行时,使得处理器执行第一方面或第一方面的任一种可能的实现方式所描述的方法。

33、第四方面,本技术提供一种计算机程序产品,当计算机程序产品在处理器上运行时,使得处理器执行第一方面或第一方面的任一种可能的实现方式所描述的方法。

34、总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:

35、本发明提供一种基于遗传算法的深度知识追踪因果解释方法及设备,构建了一个因果归因度量框架,并为知识追踪领域设计一个基因编码方案,能够高效、灵活、忠实和简洁地解释模型预测的决策依据,提高了知识追踪模型的可解释性,提升了模型的信任度。本发明开发了一个基于遗传算法的因果解释器,并提出一种基于先验的多策略种群初始化方法,可以极大地提高初始化种群的泛化能力。本发明引入了一个全局经验矩阵,能够捕捉知识追踪模型输入之间和实例之间的因果关联值,并利用它们来指导个体基因的变异。本发明在两个代表性的知识追踪模型上进行广泛的实验,以证明本发明解释器的有效性,并展示本发明解释器生成的结果可以揭示潜在的教育规律,挖掘潜在的知识结构。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1