一种基于知识图谱的个性化学习特征模型的建构方法与流程

文档序号:18214900发布日期:2019-07-19 22:34阅读:1652来源:国知局
一种基于知识图谱的个性化学习特征模型的建构方法与流程

本发明涉及本发明涉及计算机和教育技术领域,具体涉及一种基于知识图谱的个性化学习特征模型的建构方法。



背景技术:

个性化特征是个性化学习的基础,是教学效率提升的一个重要依据。基于个性化学习特征构建学生模型的方法主要有:基于知识追踪的建模方法、基于认知诊断的建模方法、基于机器学习的建模方法等。

基于知识追踪(knowledgetracing,kt)的建模方法,最初由corbett和anderson提出,他们把学生对知识点掌握情况看作隐变量,基于学生对习题作答的对错结果来推测隐变量的概率分布。kt模型的优势在于能够在各个知识点上对学生的个性化特征进行建模。pardos则通过加入对习题的猜测和犯错参数,提出kt-idem模型;通过加入知识掌握程度转换概率,yudelson提出个性化贝叶斯kt模型(individualizedbayesiankt)。虽然kt在挖掘学生个性化方面发挥了较大作用,但kt系列方法较少考虑习题与知识点之间的关系,且侧重于概率推理,较少注重认知理论基础,与此对应,学者们提出了基于认知诊断的建模方法。

基于认知诊断的建模方法,结合心理学和计算机科学的认知诊断评价(cognitivediagnosisassessment,cda)方法,通过对学生认知状态进行诊断,考察学生的个体差异和认知水平,例如利用习题与知识点关联关系以及学生答题得分数据对学生进行建模,得到认知诊断模型(cognitivediagnosismodel,cdm)。根据模型所表征学生能力的数目,cdm分为单维和多维两类;根据cdm表征学生能力的数值类型,cdm又分为连续和离散两类。常见的是单维连续型和多维离散型。

目前主要有两类认知诊断模型:项目反应理论(itemresponsetheory,irt)和dina模型(deterministicinputs,noisy“and”gatemodel,dina)。irt属于单维连续cdm,即用一维的向量描述学生的能力,其前提假设是学生做题的得分服从独立同分布。在经典irt基础上,tatsuoka引入诊断属性,提出了规则空间诊断模型;结合学生犯错率逐渐降低的特点,anzanello等提出了基于学习率的学习曲线理论。根据学习率是否具有个性化特点,又分为学习因子分析模型和表现因子分析模型。根据irt模型的知识维度,又分为单维irt和多维irt模型。在irt模型模型上,wu等提出“知识-猜测”叠加反应模型(knowledgeplusgamingresponsemodel,kpgrm),有效地提高了得分预测效果。朱天宇等提出了基于概率矩阵分解的认知诊断习题推荐算法,该算法基于学生习题得分矩阵和习题知识点关联矩阵,预测学生得分从而实现习题推荐。

dina属于多维离散型cdm。dina把习题知识点关联矩阵作为先验知识,将学生对知识点的掌握情况描述为一个多维向量。针对dina的离散特点,wu等提出了模糊认知诊断框架(fuzzycognitivediagnosisframework,fuzzycdf),从而将诊断得到的学生认知状态细化为0和1之间的连续值,以期实现诊断结果具有更强的可扩展性、抗噪性和可解释性。王超等针对dina在处理大规模数据时收敛速度慢的问题,结合最大期望(expectationmaximization,em)算法的数据划分特性及收敛性,提出增量dina模型和最大熵dina模型。dina的不足主要包括习题知识点关联矩阵的稀疏性及对专家知识的依赖性,而机器学习方法则对专家的依赖较少。

基于机器学习的建模方法中,一种常用的方法是采用低秩映射重构模型,即把学生的特征从高维的题目空间映射到低秩空间,如知识点空间等。因此,一些基于矩阵分解的机器学习方法被用来构建学生的个性化学习特征模型,如mnih提出利用概率矩阵分解(probabilisticmatrixfactorization,pmf),将原始得分矩阵分解为学生能力矩阵和题目考查的知识点矩阵;基于pmf,ma等给出了对得分矩阵和题目相似度矩阵同时分解,并共享一个子矩阵的方法;考虑学生能力变化趋势,thai等加入时间因子,利用张量(tensor)分解技术进行建模;chen等进一步在模型中融入了学习因素及遗忘曲线。另外,分类方法也常用于学生建模,通常的做法是首先挖掘出典型的学生模板,然后将每个学生投影到这些典型的模板上。

随着深度学习的快速普及,人们开始研究基于深度学习的建模方法。当前,深度学习技术在不同的领域中取得了丰硕的成果,比如语音识别、图像识别、自然语言处理等。在教育领域的应用,如huang等利用深度学习对习题参数进行估计。斯坦福大学的piech等提出的dkt(deepknowledgetracing)模型,利用循环神经网络(recurrentneuralnetwork,rnn)的长短时记忆网络(longshort-termmemory,lstm)模型,对学生的答题记录进行建模,以预测学生得分。黄昌勤利用时序特征数据适应性的lstm网络构建学习者情感模型。另外,为了自动构建题目与知识点间关系,zhang等提出一种动态“键值对”记忆网络,用于学生的得分预测任务。

然而,上述基于认知诊断及机器学习对学生个性化认知分析方法,通常只考虑了与认知相关的较少几个因素。



技术实现要素:

本发明的目的在于提供一种基于知识图谱的个性化学习特征模型的建构方法,通过综合利用知识图谱、图论、马尔可夫链、布鲁姆认知层次理论等方法,以有效定位学生的个性化学习特征,提高定位学生个性化特征的准确性。

为实现上述发明目的,本发明的技术方案具体如下:

一种基于知识图谱的个性化学习特征模型的建构方法,包括以下步骤:

s1:构建面向课程的知识图谱,其中实体对应于知识点与学习资源;采用有向无环图刻画知识点实体之间的关系;利用布鲁姆认知层次刻画学习资源实体之间的关系;

s2:构建学生个性化认知模型,采用迁移学习以解决单个学生个性化信息稀缺的问题;采用主动学习以解决选择数据的价值评价问题;利用马尔可夫链理论构建动态演化的学生个性化认知模型。

进一步的,所述步骤s1具体包括:构建面向课程的知识图谱,其中实体对应于知识点与学习资源,知识点间的关系采用学习的前后顺序;学习资源与知识点间的关系采用属于关系;学习资源之间的关系采用层次关系;采用有向无环图表示知识网络空间,每个结点代表一个知识点;知识点之间存在的前驱后继关系,体现知识点的前后依赖关系或教学讲授的前后关系;与知识点对应的学习资源作为知识点的属性,关联到知识网络中的知识点上;学习资源的组织采用层次组织法,其中,层次采用布鲁姆认知层次理论,包括识记、理解、运用、分析、综合和评价六个层次。

进一步的,所述构建学生个性化认知模型具体包括,知识网络空间中学生静态个性化的定量描述体现为:在知识网络空间存在一个分界面,在分界面之前的是学生已经完全掌握的知识点,分界面之后为学生尚未完全掌握的知识点;在学习资源空间中存在层次分界面,该分界面以上的是学生已经达到的认知层次,以下的则是学生尚未达到的认知层次;知识网络空间与学习资源空间中学生个性化动态认知,包括两个动态性:第一个动态性是在知识点层面上向前推进的动态;第二个动态性是在学习资源层面逐层深入的动态。

进一步的,所述采用迁移学习以解决单个学生个性化信息稀缺的问题具体包括:采用迁移学习解决单个学生个性化信息稀缺的问题,利用迁移学习进行信息补偿,该补偿过程包括人机交互过程,以获取关于学生个性化学习特征的信息,同时基于群体智慧的大数据技术,借助已有的学生学习过程数据,在对学生进行聚类的基础上,离线建立学生个性化信息库,通过目标学生的部分数据与大数据信息库中的数据进行比对匹配,实现对不完备信息的近似补充,以实现信息补偿。

进一步的,所述采用主动学习以解决选择数据的价值评价问题具体包括:采用主动学习以解决选择数据的价值评价问题,从未标记的学习资源中选择价值最大的学习资源,借助学生个性化认知模型库及个性化特征大数据,基于最大熵准则,在知识图谱中定位对目标学生建模最有价值的实体。

进一步的,所述利用马尔可夫链理论构建动态演化的学生个性化认知模型具体包括:针对目标学生,把其动态学习过程表示为在知识点和学习资源中向前推进的过程,且推进只依赖于相邻前驱实体,马尔可夫链特征是状态空间有限马氏链,其状态转移概率矩阵依赖于知识图谱的结构和学生的个性化学习过程

与现有技术相比,本发明的有益效果:

本发明的一种基于知识图谱的个性化学习特征模型的建构方法,通过知识图谱中给出了知识点之间关系的组织方法,以及知识点与学习资源关系的组织方法;学生的学习动态过程用知识图谱进行定位;不同学生在知识图谱中的定位不同,从而其定位反映了学生的个性化特征;该模型能有效描述学生的个性化特征,可以实现定量描述学生个性化,从而为提高学习效率和提高教学效果提供定量决策支持。

附图说明

图1本发明实施例的知识网络空间(采用有向无环图表示知识点之间关系的网络);

图2本发明实施例的知识点空间与学习资源空间及其关系,其中,a是某知识点对应的学习资源空间,b是知识网络空间与学习资源空间;

图3本发明实施例的学习过程的两个动态性;

图4本发明实施例的个性化学习特征的定量描述,其中,a是在学习资源空间中的动态个性化,b是在知识网络空间中的动态个性化;

图5本发明实施例的对学生建模的过程,是机器不断获取其个性化信息的过程;

图6本发明实施例的基于迁移学习的个性化认知模型快速构建;

图7本发明实施例的基于主动学习的个性化认知模型快速构建。

具体实施方式:

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

一种基于知识图谱的个性化学习特征模型的建构方法,知识图谱构建过程中,主要针对两类实体:知识点与学习资源。知识点间的关系主要关注其学习的前后顺序;学习资源与知识点间的关系主要关注其“属于”关系;学习资源之间的关系主要关注其层次关系。为便于讨论,我们把知识点及其关系组成的空间,称为知识网络空间;把学习资源及其关系组成的空间,称为学习资源空间。

采用有向无环图表示知识网络空间,如图1所示。图中每个结点代表一个知识点。知识点之间存在前驱后继的关系,这种关系体现了知识点的前后依赖关系或教学讲授的前后关系。

与知识点对应的习题等学习资源,作为知识点的属性,关联到了知识网络中的知识点上,如图2所示。这些学习资源的组织采用层次组织法,其中,层次采用布鲁姆认知层次理论,即识记、理解、运用、分析、综合和评价六个层次。

知识网络空间中学生静态个性化的定量描述体现为:在知识网络空间存在一个分界面,如图2(b)中知识点之间的虚线。在分界面之前的是学生已经完全掌握的知识点,分界面之后包含学生尚未完全掌握的知识点;在学习资源空间中存在类似的层次分界面,如图2(a)中的虚线,该分界面以上的是学生已经达到的认知层次,以下的则是学生尚未达到的认知层次。

知识网络空间与学习资源空间中学生个性化动态认知,体现在其学习过程的两个动态性:第一个动态性是在知识点层面上向前推进的动态,如图3上半部分羽式箭头表示的方向;第二个动态性是在学习资源层面逐层深入的动态,如图3下半部分箭头表示的方向。

动态个性化特征的定量刻画如图4所示,图中(a)在知识网络空间中用知识点分界面描述了学生个性化特征,即划分了t时刻以及t+δt时刻学生已掌握知识点和未掌握的知识点;图中(b)则给出了t时刻以及t+δt时刻,学生对知识点掌握的层次变化情况。

从信息传递的角度看,对学生个性化建模的过程,是机器不断获取学生个性化信息的过程。用iu表示用户的个性化信息量,im(t,u)表示机器在t时刻获取的关于学生个性化的信息量,则如图5所示。机器尚未获取的关于用户的个性化信息量可以表示为:

δim,u(t)=iu-im(t,u)

在个性化动态认知模型构建过程中,借助大数据及两种机器学习方法:迁移学习和主动学习,实现稀疏信息补偿与信息价值评价。

从信息利用的角度看,这部分研究内容是针对图5中im(t,u)太小问题展开的,图6给出了基于迁移学习的信息补偿框架。该图的上半部分是人机交互过程,出于减轻学生课业负担的目标,机器获取的关于学生个性化学习特征的信息较少,即图中im(t,u)太小,或δim,u(t)这一信息缺口太大,尤其当信息不完备时,建立的学生个性化认知模型是不准确的。为此,借助图中下半部分所示的基于群体智慧的大数据技术。借助已有的学生学习过程数据,在对学生进行聚类的基础上,已经离线建立了学生个性化信息库,通过目标学生的部分数据与大数据信息库中的数据进行比对匹配,实现对不完备信息的近似补充,从而实现信息补偿的目的。

类似地,图7给出了个性化认知模型构建过程中,基于主动学习获取数据价值评价的框架。图中,s表示进化计算的搜索空间,是所有已标记和未标记数据组成的集合。如前所述,机器获取的关于学生个性化学习特征的信息较少,即图中已标记数据量太小,而未标记的数据量较大。如何从未标记的学习资源中选择合适的或价值最大的,就是这里使用主动学习方法的目的。为此,借助图中下半部分所示的学生个性化认知模型库及个性化特征大数据,基于最大熵准则,实现在知识图谱中定位对目标学生建模最有价值的实体的目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1