基于贝叶斯知识跟踪模型的智能教学系统的制作方法

文档序号：17342997发布日期：2019-04-09 19:47阅读：330来源：国知局

本发明涉及基于贝叶斯知识跟踪模型的智能教学系统，属于在线教育技术领域。

背景技术：

目前，基于贝叶斯知识跟踪模型,主要是对题目单知识点进行训练建模，无法进行题目多知识点的训练建模，而且输入训练的评分值只能为0或者1两种状态。另外实际的题目往往包含很多知识点，且题目类型包括了选择题，填空和论述题，然而目前只能对训练选择题进行0和1两种状态的评分，无法对训练的论述题和填空题进行非0和1两种状态的评分。

技术实现要素：

本发明所要解决的技术问题在于：提供基于贝叶斯知识跟踪模型的智能教学系统，它解决了以目前的技术来讲，无法进行题目多知识点的训练建模，且目前只能对训练的选择题进行0和1两种状态的评分，无法对训练的论述题和填空题进行非0和1两种状态评分的问题。

本发明所要解决的技术问题采取以下技术方案来实现：

基于贝叶斯知识跟踪模型的智能教学系统，包括教学内容知识点提取标注模块、贝叶斯模型参数训练模块、教学内容知识点掌握程度判决模块和教学内容自动推荐模块，

所述教学内容知识点提取标注模块，包括教学内容预处理、教学内容分词标注、选择候选课程知识点、候选课程知识点相似度和权重计算，提取知识点进行审核标注；

所述贝叶斯模型参数训练模块，包括输入训练数据模块、训练计算模块；

所述教学内容知识点掌握程度判决模块，包括预测掌握知识点模块、判决其是否掌握该知识点模块；

所述教学内容自动推荐模块，包括教学内容自动推荐模块。

作为优选实例，所述教学内容预处理，包括主要将教学内容进行分类处理，选取教学文件、教学内容、习题库，将所有内容转换为统一的纯文本文件格式，便于计算机后续识别处理；

所述教学内容分词标注，通过辅助软件工具将教学内容进行分词和词性标注，加入教育领域和课程领域的词典，精确的排列区分教学内容；

所述选择候选课程知识点，包括：利用词频算法计算特征值，通过统计每个候选课程知识点的属性来对知识点间关系的提取，每个候选课程知识点的属性包括所在文档的位置、所在段落的位置、所在句子的位置；

所述选择候选课程知识点还包括在同一句子中的其它候选知识点，即知识点之间的相关性；

所述候选课程知识点相似度和权重计算，包括通过知识点间的相似度计算，其相似度计算公式如下：

其中xi和yj表示文档中的词频向量。余弦值1表示他们指向是完全相同的，0通常表示他们之间是独立的；

知识点权重计算，其权重计算公式如下：

kf(k,d)表示在教学内容文档中出现知识点k的频率，n表示教学内容包括多少篇文档，df(k)表示多少教学文档中包含了知识点k；

所述提取知识点进行审核标注，包括基于综合测量值，经过专家评价来确定最终课程知识点和教学内容。

作为优选实例，所述输入训练数据模块包括输入数据特征参数模块和模型特征参数提取模块，所述输入数据特征参数模块包括每个知识点的初始掌握程度p(l0)、学生从不会到会的转换概率p(t)、学生在不会的状态下仍然猜对的概率p(g)，学生在会的状态下仍然做错的概率p(s)；所述模型特征参数提取模块包括根据学生对知识点的初始掌握程度的差异性来提取不同的p(l0)，即将学生进行分类训练来提取特征参数；不同的知识点在难度上有差别，因此对各个知识点基于难度系数分别提取一套参数方法；

所述训练计算模块，包括自动训练模块，其中包括教学内容题目收集，初始参数设置，知识点分类，多知识点训练；首先系统将预先收集教学内容题目和知识点分类，设置初始参数，利用最大期望算法对模型的特征参数进行估计，通过学生完成题目的正确率来自动更新模型参数，进行实时训练计算模型。

作为优选实例，所述预测掌握知识点模块，包括知识点掌握程度计算，判决标准；

所述的知识点掌握程度计算，基于输入数据特征参数模块得出学生答对题目的概率公式如下：

p(correctn)＝p(ln)*(1-p(s))+(1-p(ln))*p(g)

学生答错题目的概率公式如下：

p(incorrectn)＝p(ln)*p(s)+(1-p(ln))*(1-p(g))

知识点掌握程度计算公式如下：

其中score为答题情况，范围在0到1之间，p(ln)为根据学习时间增加，对知识点的理解，公式如下：

所述判决其是否掌握该知识点模块，包括教学内容知识点掌握程度判决模块，所述教学内容知识点掌握程度判决模块包括判决标准，包括答题速度、题目困难度、历史做题情况、题目知识点之间的相关性。

作为优选实例，所述教学内容自动推荐模块包括：教学内容存储，教学内容分发，教学内容显示；

所述的教学内容存储，包括主要将教程、题目、知识点存储在服务器数据库；

所述的教学内容分发，包括当学生完成课程答题时，基于知识点掌握判决模块反馈的数据，系统将从数据库筛选适合该学生的内容与题目，直接通过网络发送给学生终端；

所述的教学内容显示，包括当学生接收到服务器发送的数据，终端自动显示动画视频教学内容。

基于贝叶斯知识跟踪模型的智能教学系统而提出的使用步骤：

1)、对题目知识点进行标注，每道题目可以包括多个知识点，一般有相应的系统算法和专家并行推进；

2)、将标记好的题目和知识点录入系统数据库，进行预处理，同一道题目的知识点的相关性系数大，不同题目之间的知识点相关性系数小；

3)、收集学生对题目的答题情况作为训练数据，答题状态值在(0到1之间，包括0完全答错，1完全答对)；

4)、设置贝叶斯模型的参数的初始值，包括每个知识的点初始掌握程度，初始猜度值，初始做错值，初始转换值；

5)、将题目的答题数据批量输入系统进行训练，得出每个知识的点掌握分布概率、知识点做错概率分布、知识点猜对概率分布；

6)、利用训练的概率分布，结合知识点之间的相关性、学生答题速度，来预测学生对当前题目知识点的掌握情况；

7)、基于预测知识点的掌握情况和知识点之间的相关性，推送学习内容和题目，以巩固学习的知识点。

本发明的有益效果是：本发明实时训练学生答题数据，对多种题目类型答题值进行训练，训练的题目包括了多知识点，利用题目多知识点相关性，和训练的模型更加准确的预测学生对知识点掌握程度。

附图说明

图1是教学内容知识点提取标注模块分析框图；

图2是贝叶斯模型框图；

图3是支持多知识点贝叶斯模型特征参数自动训练框图；

图4是知识追踪框图；

图5是本发明基于贝叶斯知识跟踪模型的智能教学系统框图。

具体实施方式

为了充分公开本发明的内容，在说明本发明的具体实施例之前，首先说明标准贝叶斯跟踪模型的原理:

贝叶斯知识跟踪模型的基本原理框图如图2所示，bkt将学生所需要学习的知识系统划分成若干个知识点，学生的知识状况被表示为一组二元变量，每个二元变量表示其中一个知识点是否被掌握，即学生处于“知道这个知识点”和“不知道这个知识点”两种状态之一，这是一种将学生的知识状态作为一套隐含变量的表示方式，通过学生回答问题的正确性来更新隐含变量的概率分布。

下面结合附图对本发明于实际应用中实施例一进行详细的描述；

如图5所述，本发明基于贝叶斯知识跟踪模型的智能教学系统一实施例，整个系统包括教学内容知识点提取标注模块500，学习做题模块501，贝叶斯模型参数训练模块502，教学内容知识点掌握程度判决模块503，教学内容自动推荐504；

教学内容知识点提取标注模块500，如图1所示，包括教学内容预处理，选择候选课程知识点、候选课程知识点相似度和权重计算、提取知识点进行审核标注；

教学内容预处理，主要将输入教学内容进行分类处理，选取教学文件、教学内容、习题库，将各种格式内容转换为统一的纯文本文件格式，便于计算机后续识别处理；

教学内容分词标注，通过辅助软件工具将教学内容进行分词和词性标注，加入教育领域和课程领域的词典，精确的排列区分教学内容；

选择候选课程知识点，利用词频算法计算特征值如公式(1)，通过统计每个候选课程知识点的属性来对知识点间关系的提取，属性包括，所在文档的位置，所在段落的位置，所在句子的位置，同一句子中的包括其它候选知识点；

其中通过词频-反词频方法来获取教学内容分词的特征值，其计算公式如下：

tf-idf＝tf*idf

(1)

公式(1)tf表示词频指的是某一个给定的词语在该文件中出现的频率，其计算公式如下：

公式(2)中分子表示的是该词在某一文档中出现的次数，分母表示在该文档中所有关键词出现的次数之和。

公式(1)中idf表示逆向词频，指的是某个词汇普遍性的度量，其计算公式如下：

公式(3)中分子表示文档集中文档的个数，分母表示包含当前关键词的文档的个数。

因此某一特定文件内的高词语频率，以及该词语在整个文件集合中的低文件频率，可以产生出高权重的tf-idf，所以，tf-idf倾向于过滤常见的词语，保留重要的词语；

候选课程知识点相似度和权重计算，包括通过知识点间的相似度计算，其相似度计算公式(4)如下：

其中xi和yj表示文档中的词频向量。余弦值1表示他们指向是完全相同的，0通常表示他们之间是独立的；

知识点权重计算，其权重计算公式如下：

kf(k,d)表示在教学内容文档中出现知识点k的频率，n表示教学内容包括多少篇文档，df(k)表示多少教学文档中包含了知识点k；

提取知识点进行审核标注，包括基于综合测量值，经过专家评价来确定最终课程知识点和教学内容。

学习做题模块501，将提取的教学内容知识点输入服务器后台，经过服务器后台程序对知识点进行筛选、排序，映射到对应的教学课程中，程序前端页面对每个知识点展现不同的内容，其中包括阅读文字、收听音频、观看视频，最后推送学习内容的题目供学习者完成；

贝叶斯模型参数训练模块502，包括输入训练数据模块、训练计算模块，输入训练数据模块，包括输入数据特征参数模块和模型特征参数提取模块，输入数据特征参数模块包括每个知识点的初始掌握程度p(l0)、学生从不会到会的转换概率p(t)、学生在不会的状态下仍然猜对的概率p(g)，学生在会的状态下仍然做错的概率p(s)；额外增加题目难度系数，从而使得模型能够分析各个题目的难度，提高预测的准确率，在模型中，不同的问题各自训练自己的p(g)和p(s)，p(g)高、p(s)低的题目被认为是容易的，而p(g)低、p(s)高的题目被认为是困难的。在模型中，增加一个问题节点item，训练不同问题下的猜对概率和犯错概率。p(l0)计算公式(6)如下所示；

我们可以通过学生对第一次学习机会的知识平均值来进行估计。

p(t)学生从不会到会的转移概率如公式(7)所示：

p(g)学生在不会的状态下仍然猜对的概率如公式(8)所示：

p(s)学生在会的状态下仍然做错的概率如公式(9)所示：

其中ki表示对问题i知识点的掌握情况，ci表示对问题i答题正确情况；模型特征参数提取模块包括根据学生对知识点的初始掌握程度的差异性来提取不同的p(l0)，即将学生进行分类训练来提取特征参数；不同的知识点在难度上有差别，因此对各个知识点基于难度系数分别提取一套参数方法；

训练计算模块，包括自动训练模块，如图3所示，设置模型训练的初始特征参数p(l0),p(t),p(s),p(g)，将做题模块501的答题情况数据进行分类，去除重复数据集，利用最大期望算法对模型的特征参数进行估计，其中在e-step，需要使用向前-向后算法做精确推理，向前变量公式(10)如下：

αt(i)＝p(o1,o2,...,ot,qt＝si|θ)

(10)

在给定模型下，观察序列为o1,o2,...,ot和t时刻隐藏状态为si的联合概率。向后变量公式(11)如下：

βt(i)＝p(ot+1,ot+2,...|qt＝si,θ)

(11)

在给定模型下，t时刻隐藏状态为si并且后续观察序列为ot+1,ot+2,...的概率。两个变量合在一起表示在给定观察序列下，t时刻隐藏状态为i的概率如公式(12)所示：

在给定观察序列下，t时刻从隐藏状态i转移到j的概率如公式(13)所示：

利用获取的隐藏状态和转换状态来更新知识点的特征参数，似然值计算公式(14)所示，将本次计算的似然值与前一次计算的似然值的差值小于给定的

阀值时，当前的训练结束，否则继续进行迭代更新特征参数；

教学内容知识点掌握程度判决模块503，包括：知识点掌握程度计算，判决标准；

知识点掌握程度计算，如图4所示，表示知识点追踪路径，基于模型参数得出学生答对题目的概率公式(15)如下：

p(correctn)＝p(ln)*(1-p(s))+(1-p(ln))*p(g)

(15)

学生答错题目的概率公式(16)如下：

p(incorrectn)＝p(ln)*p(s)+(1-p(ln))*(1-p(g))

(16)

知识点掌握程度计算公式如下：

其中score为答题情况，范围在0到1之间，p(ln)为随着学习时间增加，

对知识点的理解，公式如下：

判决其是否掌握该知识点模块，包括教学内容知识点掌握程度判决模块，教学内容知识点掌握程度判决模块包括判决标准，包括答题速度、题目困难度、历史做题情况、题目知识点之间的相关性，判决标准，包括答题速度、题目困难度、历史做题情况、题目知识点之间的相关性都会影响对知识点的掌握程度的判决；

教学内容自动推荐模块504，包括：教学内容存储，教学内容分发，教学内容显示；

教学内容存储，主要将教程，题目，知识点存储在服务器数据库；

教学内容分发，当学生完成课程答题时，基于知识点掌握判决模块反馈的数据，系统将从数据库筛选适合该学生的内容与题目，直接通过网络发送给学生终端；

教学内容显示，当学生接收到服务器发送的数据，终端自动显示动画视频教学内容。

本智能教学系统使用步骤：

1)对题目知识点进行标注，每道题目可以包括多个知识点，一般有相应的系统算法和专家并行推进；

2)将标记好的题目和知识点录入系统数据库，进行预处理，同一道题目的知识点的相关性系数大，不同题目之间的知识点相关性系数小；

3)收集学生对题目的答题情况作为训练数据，答题状态值在(0到1之间，包括0完全答错，1完全答对)；

4)、设置贝叶斯模型的参数的初始值，包括每个知识的点初始掌握程度，初始猜度值，初始做错值，初始转换值；

5)、将题目的答题数据批量输入系统进行训练，得出每个知识的点掌握分布概率、知识点做错概率分布、知识点猜对概率分布；

本智能教学系统工作原理：

输入训练数据，数组值包括题目id，题目对应多知识点id，用户id，题目答题状态值(包括0～1之间)，利用隐马尔科夫模型来训练知识点掌握分布概率、知识点做错概率分布、知识点猜对概率分布，最后利用训练模型的概率分布来预测学生对知识点的掌握程度。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘冬冬;郝飞;卢家义
技术所有人：上海健坤教育科技有限公司
我是此专利的发明人

上一篇：不同生长期竹子肥料氮磷钾养分精准配施方法与流程
上一篇：一种太阳能对流式挂面干燥装置的制作方法