一种基于机器学习、大数据挖掘的智能课程评分系统的制作方法

文档序号:15802037发布日期:2018-11-02 21:30阅读:731来源:国知局

本发明涉及机器学习和大数据挖掘,具体地说,是一种利用计算机根据学习系统中的学习大数据,依靠大数据中学习数据的标签分类、学员学习效果(以考试为主)、学员学习数据(以课程学习时长、测验分数等为主)进行机器学习,从而获取课程与学习目标关联度并提供评分的智能系统。

背景技术

目前传统的学习系统采用由课程提供方提供相关标签(如该课程属于哪个分类、哪个级别、对特定学习人群的帮助度大小等),而学习系统则根据该类课程的浏览量、热度、在线课后测试的完成情况来对课程进行评分评级等工作。

目前学习系统对于课程基于统计的评分评级工作,并不能很好地体现课程本身的价值,有的课程可能因为内容或外观比较吸引人而引来较多的浏览和关注度,但其对学习者真正的提升可能不多;而有些干货课程内容价值高,但因为某些客观原因如组织方式平淡等,得不到应有的评级。



技术实现要素:

本发明的目的正是为了克服上述现状存在的缺陷和不足而提供一种创新的、结合数据挖掘及人工智能的课程评级方式。

本发明最重要的创新点在于:采用机器学习对实际学习效果和课程学习情况进行深度挖掘获得课程的评级评分,而不是传统的根据课程学习表象和统计结果。这样的机器学习工具应用在学习系统中,能摈弃人的主观影响,更本真的得到课程的实际效果。

本发明是这样实现的:

为解决以上技术问题,本发明应用了机器学习中的关联规则分析算法对学习系统数据进行机器学习。

在这里我们采用apriori算法对数据进行学习。apriori算法首先创建频繁项集高效发现的函数,然后从频繁项集中抽取出关联规则。频繁项集:经常出现在一块的物品的集合,关联规则:暗示两种物品之间可能存在很强的关系。怎么定量评估上面的概念,分别使用支持度、可信度量化。支持度:数据集中包含该项集的记录所占的比利;一条规则p->h的可信度定义为support(p|h)/support(p)。

拓展到学习系统即是:设定一个机器学习时间段,将所有学员起始时间段内的考试结果中带一定标签(如销售类试题)题目的综合正确率(可用四分位、中位数等方式综合)以及结束时间段的综合正确率进行汇总分类,得到学习效果分类数据后,与这些学员在学习时间段内的在线课程学习情况组合,然后使用apriori算法进行关联规则学习分析,得到课程对学习效果的支持度。

具体工作流程如下:

第一步,设定机器学习时间段、学员试题标签设定、学员正确率提升区间分类。

第二步,设定需进行评级的课程集,设定支持度最小可信度要求。

第三步,开始机器学习。

第四步,最终得到每门课程对各类学习效果的支持度,按效果的权重给出对课程的评级。

本发明的优点:

可以以尽可能真实的面貌体现一门课程的价值,减少对一些肤浅的热门课程的误判,还原课程学习的真实价值,并能发掘一些热度和价值背离的高质量课程,督促其在保证课程质量同时提升学习体验,更好地利用学习系统的学习大数据,从而从各个方面提升学习系统的使用价值。

具体实施方式

下面详细描述本发明的实施例,所述实施例仅用于解释本发明,而不能理解为对本发明的限制。

实施例

设定机器学习时间段、学员试题标签设定、学员正确率提升区间分类。设定需进行评级的课程集,设定支持度最小可信度要求。开始机器学习。最终得到每门课程对各类学习效果的支持度,按效果的权重给出对课程的评级评分。

我们采用apriori算法对数据进行学习。apriori算法首先创建频繁项集高效发现的函数,然后从频繁项集中抽取出关联规则。频繁项集:经常出现在一块的物品的集合,关联规则:暗示两种物品之间可能存在很强的关系。怎么定量评估上面的概念,分别使用支持度、可信度量化。支持度:数据集中包含该项集的记录所占的比利;一条规则p->h的可信度定义为support(p|h)/support(p)。

拓展到学习系统即是:设定一个机器学习时间段,将所有学员起始时间段内的考试结果中带一定标签(如销售类试题)题目的综合正确率(可用四分位、中位数等方式综合)以及结束时间段的综合正确率进行汇总分类,得到学习效果分类数据后,与这些学员在学习时间段内的在线课程学习情况组合,然后使用apriori算法进行关联规则学习分析,得到课程对学习效果的支持度。

具体工作流程如下:

第一步,设定机器学习时间段、学员试题标签设定、学员正确率提升区间分类。

第二步,设定需进行评级的课程集,设定支持度最小可信度要求。

第三步,开始机器学习。

第四步,最终得到每门课程对各类学习效果的支持度,按效果的权重给出对课程的评级。

作为另一种优选,所述评价方法可以具体为:a、确定评价指标集合为ah:ah={ah1,ah2,…,ahn},其中,ahi(i=1,2,…,n)表示第i个评价指标,n表示评价指标的数目;b、确定指标评语集合为aq,aq={aq1,aq2,…,aqr},其中,aqk(k=1,2,…,r)表示评价指标可能被判定的评语,r表示评语的种类,k越大,表示对指标的评语越好;所述指标处理模块包括第一定量指标处理子模块、第二评语子模块和第三权重确定子模块,所述第一定量指标处理子模块用于对定量指标进行处理,所述第二评语子模块用于确定评价指标被判定为评语aqk(k=1,2,…,r)的概率,所述第三权重确定子模块用于确定评价指标的权值。

所述第一定量指标处理子模块用于对定量指标进行处理:设有定量指标的指标值向量为bz:bz=[x1,x2,…,xm],xj(j=1,2,…,m)表示第j个定量评价指标的指标值,m表示定量评价指标的数目,采用以下方式对定量评价指标进行处理:

在式子里,ywj为第j个定量评价指标的指标值进行处理后的值,i1表示效益型指标集合,指标值越大表示评价对象越好,i2表示成本型指标集合,指标值越小表示评价对象越好。

所述第二评语子模块用于确定评价指标被判定为评语aqk(k=1,2,…,r)的概率:对于定性评价指标,由专家直接确定指标被判定为评语aqk(k=1,2,…,r)的概率,对于定量评价指标,由专家根据处理后的指标值确定指标被判定为评语aqk(k=1,2,…,r)的概率;将定性评价指标和定量评价指标的结果进行综合,得到评价指标被判定为评语aqk的概率矩阵af;af=[afik]n×r,cfik表示评价指标ahi被判定为评语aqk的概率;

所述第三权重确定子模块用于确定评价指标的权值:确定评价指标ahi的权重fvi,根据各评价指标权重确定权重向量fv:fv=[fv1,fv2,…,fvn]。

需要说明的是,以上所述仅为本发明的优选具体的实施例,若依本发明的构想所作变动,其产生的功能作用,仍未超出说明书所涵盖的精神时,均应在本发明的范围内。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1