时序化的学生认知诊断方法与流程

文档序号:11407359阅读:426来源:国知局

本发明涉及教育数据挖掘技术领域,尤其涉及一种时序化的学生认知诊断方法。



背景技术:

认知诊断是传统考试测验与评价的一种改进与完善。一般的教育考试,特别是大规模的考试,只提供考试分数。然而由单一的分数,既不能得到学生具体掌握或未掌握什么知识的结论,也不能得到学生做错试题的原因,以进行补救;对于相同分数的学生,更无法得到他们之间可能存在的知识状态和认知结构的差异。传统考试提供的信息已不太适合学生发展的需要,认知诊断的主要任务是根据学生的差异,挖掘出更多认知加工信息。认知诊断通过测验获得学生在测验上(可观察)的反应(测试结果),从而推知学生不可观察的知识状态。

认知诊断是对学生长时间学习的状态评估,是智能化个性教学的重要内容。准确的认知诊断,可以帮助学生清楚地对自身这段时间学习情况准确认知,同时可以辅助家长和老师为学生制定个性化的学习策略。因而如何长时间地、准确地诊断学生知识掌握程度的变化,一直是教育数据挖掘领域探索的一个重要问题。

目前,关于认知诊断的方法主要有以下几种:

1)基于单个时刻的能力值诊断

基于项目反应理论(irt)仅通过学生在试题上的答题情况,通过对题目特征函数的运算,来推测学生的能力。irt的题目参数有:难度、区分度和猜测程度。根据参数的不同,特征函数可分为单参数模型(难度)、双参数模型(难度、区分度)和三参数模型(难度、区分度、猜测参数)等。将学生建模为一维连续能力值,并以这一个单一的能力值表示学生的综合能力。在irt模型下,学生被刻画成一个具有单一能力值的对象,除题目自身的因素(区分度、难度、猜测度)之外,学生在题目上的表现情况仅受到这单一综合能力的影响。

2)基于单个时刻的知识掌握诊断

在引入了知识点相关的能力维度后,有学者提出试题所关联的知识点信息(q矩阵),并且认为一个试题所考察的多个知识点之间的相互作用有“连接性的”(需要掌握考察的所有知识点才能有机会答对试题)和“补偿性的”(只要掌握所考察的其中一个相关知识点就能得分)。该方法属于多维离散认知诊断模型(dina),且该dina模型认为知识点间的相互作用是“连接性的”。dina模型除了使用学生在试题上的答题情况之外还引入了试题知识点关联矩阵(q矩阵),通过联合更多的教育领域内特有的信息对学生的知识点掌握程度进行诊断,并将学生建模成一个在多维知识点上的能力向量,其中向量的每一维的值均是0-1的,表示学生是否掌握了对应维度上的知识点。dina模型可以进一步结合试题上的猜测和失误参数,预测学生在试题上的表现情况。

3)基于多个时刻的能力值诊断。

考虑到学习如同跑马拉松,是一个循序渐进的长期过程。单一时刻的静态认知诊断方法已经远远不能满足学生日益增长的需求,有学者提出基于时序化的认知诊断技术,该类技术主要可以分为以下两种模型:时序化的irt模型和bkt模型及其相关改进。时序化irt技术主要是在传统的irt模型中加入时间的因素,认为学生的能力值随时间的变化符合特定的规律可以用线性函数拟合,从而根据学生历史的多次测试的答题数据,得到学生在不同时刻的能力值。bkt模型被广泛应用到智能指导系统中,该应用场景的数据有一个鲜明的特征,对于同一道试题或者问题,应试者会在不同时刻多次反复作答。该模型使用隐马尔科夫方法对学生的知识掌握进行建模,同时定义了四个概率:初始的能力值,t时刻知识点掌握程度的转化概率,犯错的概率以及猜测的概率用于表征学生在每个时刻的表现和状态。

上述认知诊断方法中,基于单个时刻的能力值诊断以及知识掌握诊断虽然可以准确地得到学生在特定时刻的能力值或者知识掌握程度,但是该方法是静态的,仅能对一场考试的数据进行分析,无法适用于学生长时间学习的动态评估。基于多个时刻的能力值诊断方法,虽然可以得到学生在不同时刻的能力值,以及准确预测学生在下一个时刻的得分,但是该能力值没有实际意义,更无法解释学生的能力值是如何变化的,一个单维的能力值因为缺乏解释意义,实际的价值不大,该方法只能诊断出学生在不同时刻的能力值提升或者下降了,但是无法得知学生在哪方面的知识上退步需要加强,在哪些方面已经足够熟练不需要再额外增加训练。因此,采用现有的认知诊断方法,难以精准地捕获学生长时间学习过程中对各个知识点的掌握程度的变化情况,以及有依据地解释什么因素导致了学生的变化,例如新学习了某个知识点,或者时间间隔太长遗忘等。



技术实现要素:

本发明的目的是提供一种时序化的学生认知诊断方法,通过对试题信息以及学生答题情况,进行连续、长时间地分析处理,可以精准地分析学生在不同时间段的整体能力水平和知识掌握程度。

本发明的目的是通过以下技术方案实现的:

一种时序化的学生认知诊断方法,包括:

获取多个学生的历史答题信息;

根据获取到的历史答题信息使用时序化认知诊断方法进行建模,获得知识点掌握程度以及经过偏序限制后的试题-知识点相关性矩阵;

根据知识点掌握程度以及经过偏序限制后的试题-知识点相关性矩阵对某一学生下一个时间段的知识点掌握程度以及所做试题上的得分进行预测。

所述根据获取到的历史答题信息使用时序化认知诊断方法进行建模包括:

初始化能力向量u、试题-知识点相关性矩阵v,以及实体的难度参数b,则学生获得得分为r的后验概率表示为:

其中,t为总时间段数,n为总学生数量,m为总试题数,为学生i在第t个时间段试题j的答题结果,为学生i在第t个时间段内各个知识点上的掌握程度,vj为试题j跟各个知识点的相关程度,bj为试题j的难度,iij表示学生i是否做过试题j,iij=1代表学生i做过试题j,否则表示没做过;表示学生的得分r服从均值为方差为的高斯分布,其中形式定义如下:

给定试题关联的q矩阵,|q|=m×k:

其中,k为知识点数量;

定义如下偏序关系:对于试题j,如果其与知识点q的关系为qjq=1,与知识点p的关系为qjp=0,则认为对于试题j,知识点q比知识点p更相关;

则有:

上式中,表示对于试题j,知识点q比知识点p更相关,表示对于试题j,知识点p比知识点q更相关;

将给定的q矩阵,转换得到训练数据三元组:

令模型学习到试题-知识点相关性矩阵,并能够保持所定义的偏序关系,即极大化试题-知识点相关性矩阵v在给定偏序关系后的后验概率

上式中,为试题-知识点相关性矩阵v的似然,p(v)为试题-知识点相关性矩阵v的先验;vjq、vjp分别表示试题j跟知识点q以及p的相关程度,表示对于试题j,知识点q比知识点p更相关的概率;

对试题-知识点相关性矩阵v的后验概率同时取对数可以得到如下形式:

上式中,λ为正则化参数;

加入偏序关系之后,对于某次考试,能够得到各学生的一维知识点掌握程度,再基于学习曲线与遗忘曲线来捕捉某一学生不同考试的能力值变化;

假设学生i在第t个时间段的能力值服从均值为方差为的高斯分布:

上式中,表示学生i在第t个时间段内的知识点掌握程度为的概率,是按照假设的遗忘以及学习部分的公式后计算得到的第t时间段学生i对知识点1~k的掌握程度,为实际的掌握程度,i是指示函数,用来标识学生实际做过了哪些试题,如果学生i做了试题j,则iij=1。

第t时间段学生i对知识点k的掌握程度的计算公式为:

其中,αi为学生i的个性化参数,为学生i在第t个时间段的遗忘部分,为学生i在第t个时间段的学习部分。

学生i在第t个时间段的遗忘部分即学生i从第t-1个时间段到第t个时间段的遗忘部分,表示为:

其中,表示第t-1个时间段学生i对知识点k的掌握程度,e(-δt/s)表示经过δt的时间后,记忆残留的百分比,s表示记忆的强度,δt为第t-1个时间段到第t个时间段的时间间隔。

学生i在第t时间段的学习部分表示为:

其中,表示第t-1个时间段学生i对知识点k的掌握程度,表示第t个时间段学生i对知识点k的练习次数,表示第t个时间段,知识点练习次数对学习率的影响,r用来限制增长的速度,m'用来限制最大的增长幅度。

该方法还包括:

结合偏序关系,遗忘,以及学习三个部分,得到模型最终的损失函数e:

其中,λu与λv均为正则化参数,iij表示学生i是否做过试题j,iij=1代表学生i做过试题j,否则表示没做过我们可以根据上式定义的损失函数;

采用梯度下降的更新算法,在每一轮迭代中,分别利用损失函数对知识点掌握程度参数u、试题-知识点相关程度参数v、每个学生个性化参数α、以及试题的难度参数b求偏导数,并进行参数更新和求解,直至模型收敛,最终输出学生在1~t个时间段内的知识点掌握程度,以及经过偏序限制得到的试题-知识点相关矩阵。

根据知识点掌握程度以及经过偏序限制后的试题-知识点相关性矩阵对某一学生下一时间段的知识点掌握程度以及所做试题上的得分进行预测包括:

能力向量包含了第t时间段学生i对知识点1~k的掌握程度则第t+1时间段学生i对知识点1~k的掌握程度的计算公式为:

其中,为第t+1个时间段学生i对知识点k的掌握程度,k=1,2,...,k;表示第t个时间段学生i对知识点k的掌握程度,αi为学生i的个性化参数,表示经过δt+1的时间后,记忆残留的百分比,δt+1第t个时间段到第t+1个时间段的时间间隔,表示第t+1个时间段学生i对知识点k的练习次数,表示第t+1个时间段,知识点练习次数对学习率的影响;

第t+1个时间段学生i的得分预测公式为:

其中,为学生i在第t+1个时间段中试题j的答题结果。

由上述本发明提供的技术方案可以看出,针对学生历史答题信息,按照时间段进行划分,运用类似项目反应理论irt的形式结合教育学领域的先验知识(q矩阵)将学生的能力值对应到一个时间段所考察的每一维知识点上;对于不同时间段之间的知识点掌握程度的变化,该方法引入教育学领域两大经典理论—遗忘曲线和学习曲线对学生不同时间段的知识点维度进行建模,进而更加准确地诊断分析学生在不同时间段时知识点掌握程度的变化情况(遗忘较多还是学习进步较多),弥补了现有方法缺乏动态性和极强解释性的弊端。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种时序化的学生认知诊断方法的流程图。

具体实施方式

下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。

实施例

本发明实施例提供一种时序化的学生认知诊断方法,如图1所示,其主要包括如下步骤:

步骤11、获取多个学生的历史答题信息。

每一学生的历史答题信息可以包括:包括答题时间、已答题目所涉及的知识点(q矩阵)和各技能考查情况(即题目信息)、以及用户的答题结果(对或错)等。所述题目信息以及q矩阵由教育学专家预先标注所得,每一学生的历史答题信息可从在线学习平台智学网获得。

步骤12、根据获取到的历史答题信息使用时序化认知诊断方法进行建模,获得知识点掌握程度以及经过偏序限制后的试题-知识点相关性矩阵。

首先要初始化知识点掌握程度参数u、试题-知识点相关性矩阵v,以及试题的难度参数b,则在已知参数u、v、b之后,学生获得得分为r的概率可以表示为:

其中,为学生获得得分r的概率,t为总的时间段数,我们这里将一个月切分为一个时间段,n为总学生数量,m为总试题数,为学生i在第t个时间段内所做试题j的答题结果,为学生i在第t个时间段内各个知识点上的掌握程度,vj为试题j跟各个知识点的相关程度,bj为试题j的难度,iij表示学生i是否做过试题j,iij=1代表学生i做过试题j,否则表示没做过,表示学生的得分r服从均值为方差为的高斯分布,其中形式定义如下:

在上式中,学生的能力向量u是没有实际意义的,为了实现将学生的能力向量u对应到相应的知识点上,给定试题关联的q矩阵,|q|=m×k:

其中,k为知识点数量;

定义如下偏序关系:对于试题j,如果其与知识点q的关系为qjq=1,与知识点p的关系为qjp=0,则认为对于试题j,知识点q比知识点p更相关;

则有:

上式中,表示对于试题j,知识点q比知识点p更相关,表示对于试题j,知识点p比知识点q更相关;类似的,

将给定的q矩阵,转换得到训练数据三元组:dt:(m×k×k)我们希望模型学到试题-知识点相关性矩阵v,能够保持初始q矩阵中的偏序关系,(即:对于试题j,如果专家标注的qjq=0andqjp=1,我们希望模型学到的vjq>vjp)

这相当于极大化试题-知识点相关性矩阵v在给定偏序关系后的后验概率:

上式中,表示试题-知识点相关性矩阵v的后验概率,根据贝叶斯公式可以换算得到,试题-知识点相关性矩阵v的后验概率等于试题-知识点相关性矩阵v的先验乘以试题-知识点相关性矩阵v的似然度,即是试题-知识点相关性矩阵v的似然,p(v)是试题-知识点相关性矩阵v的先验,vjq、vjp分别表示试题j跟知识点q以及p的相关程度,表示对于试题j,知识点q比知识点p更相关的概率;

对试题-知识点相关性矩阵v的后验概率同时取对数可以得到如下形式:

其中表示试题-知识点相关性矩阵v的后验概率的对数形式,等式两边需要同时转换成对数形式,λ为正则化参数。

加入偏序关系之后,对于某次考试,能够得到各个学生的一维知识点掌握程度,为了实现时序化的建模,kpt模型参考教育学领域的两大经典理论:学习曲线和遗忘曲线来捕捉某一学生不同考试的能力值变化;具体如下:

假设学生i在第t个时间段内的知识点掌握程度服从均值为方差为的高斯分布:

其中表示学生i在第t个时间段内的知识点掌握程度为的概率,是按照我们假设的遗忘以及学习部分的公式后计算得到的掌握程度,为实际的掌握程度,i是指示函数,用来标识学生实际做过了哪些试题,如果学生i做了试题j,则iij=1。

受两方面因素的影响:学生对前一段已学习的知识点的遗忘和学生在第t个时间段内对各个知识点的学习;表示第t个时间段内学生i在经历过遗忘和学习后对知识点1~k的掌握程度(根据下面的公式计算的)。

在第t个时间段内,学生i对知识点k的掌握程度的计算公式为:

其中,αi为学生i的个性化参数,为学生i在第t个时间段内的遗忘部分,为学生i在第t个时间段内的学习部分。

对于遗忘部分,艾宾浩斯遗忘曲线认为人的记忆力随时间的推迟遗忘幅度会逐渐减小,借鉴这个思想,学生i在第t个时间段的遗忘部分即学生i从第t-1个时间段到第t个时间段的遗忘部分,表示为:

其中,表示第t-1个时间段时,学生i对知识点k的掌握程度,e(-δt/s)表示经过δt的时间后,记忆残留的百分比,s表示记忆的强度,δt为第t-1个时间段到第t个时间段的时间间隔。

而知识或者技能的掌握会随着练习次数的增加先迅速升高再逐渐趋于平缓,具体的,学生i在第t个时间段的学习部分表示为:

其中,表示第t-1个时间段,学生i对知识点k的掌握程度,表示在第t个时间段内,学生i在知识点k上的做题次数,表示第t个时间段内,知识点练习次数对学习率的影响,r用来限制增长的速度,m'用来限制最大的增长幅度。

结合偏序关系,遗忘,以及学习三个部分,我们可以得到模型最终的损失函数e如下公式所示:

其中,λu与λv均为正则化参数,iij表示学生i是否做过试题j,iij=1代表学生i做过试题j,否则表示没做过。我们可以根据上式定义的损失函数,采用梯度下降的更新算法,在每一轮迭代中,分别利用损失函数对学生的知识点掌握程度参数u、试题-知识点相关程度参数v、每个学生个性化参数α、以及试题的难度参数b求偏导数,并进行参数更新和求解,直至模型收敛,会输出学生在1~t个时间段内的知识点掌握程度,以及经过偏序限制得到的试题-知识点相关矩阵。能力向量是对学生在这t个时间段的长期动态诊断结果,可以帮助学生对于过去这段时间的学习状态做详细的总结,同时制定下阶段的针对性学习策略。

步骤13、根据知识点掌握程度以及经过偏序限制后的试题-知识点相关性矩阵对某一学生下一时间段的知识点掌握程度以及所做试题上的得分进行预测。

能力向量包含了在第t个时间段内,学生i对知识点1~k的掌握程度则第t+1个时间段,学生i对知识点1~k的掌握程度的计算公式为:

其中,为第t+1个时间段,学生i对知识点k的掌握程度,k=1,2,...,k;表示第t个时间段学生i对知识点k的掌握程度,αi为学生i的个性化参数,表示经过δt+1的时间后,记忆残留的百分比,δt+1为第t个时间段到第t+1个时间段的时间间隔,表示第t+1个时间段内学生i在知识点k上所做的练习次数,表示第t+1个时间段内,练习次数对学习率的影响;

第t+1时间段,学生i在所做试题上的得分预测公式为:

其中,为学生i在第t+1个时间段所做试题j上的答题结果。

本发明上述方案,针对学生历史答题信息,按照时间段进行划分,运用类似项目反应理论irt的形式结合教育学领域的先验知识(q矩阵)将学生的能力值对应到一场考试所考察的每一维知识点上;对于不同时间段之间的知识点掌握程度的变化,该方法引入教育学领域两大经典理论—遗忘曲线和学习曲线对学生不同时间段内的知识点维度进行建模,进而更加准确地诊断分析学生在不同时间段内知识点掌握程度的变化情况(遗忘较多还是学习进步较多),弥补了现有方法缺乏动态性和极强解释性的弊端。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1