一种基于大数据的错题分类分析及提升方法与流程

文档序号:37751772发布日期:2024-04-25 10:38阅读:6来源:国知局
一种基于大数据的错题分类分析及提升方法与流程

本发明涉及学生学习数据处理领域,具体地讲,涉及一种基于大数据的错题分类分析及提升方法。


背景技术:

1、错题分类分析是对学生学习过程及学习成绩的分析。对学生在某一个单元时间内或某一项学习活动中的学习结果进行分析,以帮助学生提高学习成绩,帮助学生进步。

2、如果能够提供一种错题分类分析方法,实现对学生错题错误原因进行分类归纳,计算出学生错误权重,施加针对性训练,将有助于提高学生学习成绩。


技术实现思路

1、本发明要解决的技术问题是提供一种基于大数据的错题分类分析及提升方法,有利于提高学生学习成绩。

2、本发明采用如下技术方案实现发明目的:

3、一种基于大数据的错题分类分析及提升方法,其特征在于,包括以下步骤:

4、步骤一:通过学情服务器,通过朴素贝叶斯分类算法对错题错误原因进行分类归纳,包括知识性错误及非知识性错误;

5、朴素贝叶斯分类算法的实现过程分为一下几个步骤:

6、1)对样本集的每一个数据的n个属性a1,a2...an,使用n维特征向量x={x1,x2,...,xn}来对数据进行表示;

7、2)假设现存在m个类c1,c2,...cm,以及一个未知类别的样本x;

8、p(ci|x)表示的是在x的条件下,ci发生的可能性;

9、在x的条件下,使得ci发生的可能性最大,即当p(ci|x)为最大时,那么就认为x可以被分配到ci这个类别,这时称ci为最大后验假设,其中p(ci|x)可以由前文的公式计算得出:

10、

11、而对于p(x|ci),由于有着类条件独立性的假定,则认为:

12、

13、3)通过在所述步骤2)中的分析,当对x进行分类时,需要计算每一个类ci的p(x|ci)p(ci),那么在类c1,c2,...cm中,使得p(x|ci)p(ci)最大的那个类ci就是待分类样本x最终被分配到的那个类;

14、步骤二:通过学情服务器,通过因子分析法对相同错误在整体错误原因占比权重、错误题型在得分占比权重及错误题型横向在所有学生中占比权重进行分析总结;

15、①根据朴素贝叶斯分类算法对错题库进行了分类,得到了每一种类别的总体数量m1,m2,...m8,计算出每种错误占所有错误的比重:

16、p1=m1/(m1+m2+m3+...m8)

17、根据上述公式,可以计算出每种错误原因在整体错误中的占比;

18、②根据朴素贝叶斯分类算法,得到的所有错题的分数,计算出其在整体分数中所占的比重:

19、r错误=错误分数/整体分数

20、③根据朴素贝叶斯分类算法,得到的所有错题的整体数量以及分数,可以计算出其在所有学生中的比重:

21、r学生错误=学生错误数量/(学生错误数量+学生正确数量);

22、步骤三:学生通过学生端,进行多次考试或练习,学情服务器计算学生在不同错误提升分数的比率,不同错误针对性学习后效果的改进;

23、(1)错题的总类型为8类,每次考试,基于第一算法统计出所有的错题分数ga,以及每一类的错题的分数ga1,ga2,...ga8;

24、(2)下一次考试的统计结果为,所有的错题分数gb,以及每一类的错题的分数gb1,gb2,...gb8;

25、(3)计算每一类错误题型,学生分数的提升比率:

26、r=(ga-gb)/ga

27、根据上述公式,代入不同次考试的不同错误对应的分数,即可计算得到学生不同错误提升分数的比率r1,r2,...r8,以及总的错误提升比率r;

28、(4)重复所述步骤(2)及所述(3),就可得出不同次,甚至是多次学生考试错误的分数提升情况,以便针对不同的提升率进行不同的改进手段。

29、作为本技术方案的进一步限定,还包括步骤四:学情服务器通过计算学生针对不同方向进行学习后改进的速度,然后根据达标的成绩和其他学生平行分析判断不同针对性学习提升成绩的效率,计算出最优的针对性学习的时间划分。

30、作为本技术方案的进一步限定,为了对不同的错误进行针对性的练习以及学习时间、精力的投入情况,需要对不同的错误提升的速度进行量化计算:

31、(一)不同错题的总类型为8类,在每次考试中,基于第一算法统计出所有的错题分数ga,以及每一类的错题的分数ga1,ga2,...ga8;

32、(二)根据学生的实际情况,对每种错误的容忍程度,即每种错误的达标成绩进行确定,不同的错误的容忍度记为t1,t2,...t8,表示不同错误容许失分的标准,也就是不同错误的失分情况在t值以下,就表示正常的,说明这部分是达标;

33、(三)计算不同错误的提升速度v,第一次的每种错误的分数是最多的,因为没有经过本发明的针对性练习以及提升,第一次为起始记为ga1,ga2,...ga8,最后的达标成绩记为t1,t2,...t8,达标成绩所用的次数n1,n2,...n8,

34、v=(ga-t)/n

35、根据上述公式,可以计算出不同错误的提升速度v1,v2,...v8;

36、(四)比较不同错误的提升速度v,对其进行排序,就可以得出不同错误提升所应花费的时间以及精力,资源的投入,对提升快的错误可以少些时间,对提升慢的错误,说明是比较弱,需要较大时间的投入,以便有针对性的改变。

37、作为本技术方案的进一步限定,所述步骤一具体步骤如下:

38、步骤一一:数据准备;数据清理、相关分析和属性子集选择、数据变换和归约;

39、步骤一二:数据挖掘;使用朴素贝叶斯分类算法对数据进行挖掘;

40、步骤一三:模式评估阶段。

41、作为本技术方案的进一步限定,当数据挖掘阶段结束时,所产生的数据模式不一定都是有用的,因此设置某种模式兴趣度的度量,例如设置置信度或者规则的支持度,根据这些标准发现用户真正感兴趣的有用的数据模式;

42、评价标准主要有精确率p、召回率r和f1值,a表示属于某类别的文本且预测结果也是属于某类别的,d表示不属于某类别的文本预测结果为属于某类别,c表示属于某类别的文本预测结果显示不属于某类别;

43、

44、

45、

46、作为本技术方案的进一步限定,所述知识性错误包括知识点缺陷、知识系统缺陷及知识框架不完整,所述非知识性错误包括马虎粗心、错误操作、计算错误、做题不专注及蒙答案。

47、作为本技术方案的进一步限定,错题模块,将该学习段的该类题目分类,根据错题总的错误率判定难度,选择先易后难或者均匀分布的模式供学生练习。

48、作为本技术方案的进一步限定,学情服务器分别给出该错题班级错误率及全体使用本系统的总错误率,判定该知识点是否存在总的空缺,推送给教师端进行班级级别总的加强学习。

49、一种学情服务器,其特征在于,包括:

50、数据库,用于存储计算机程序及学情大数据分析系统;

51、处理器,用于执行所述计算机程序及学情大数据分析系统,以实现如权利要求1至9任意一项所述学情大数据分析系统。

52、与现有技术相比,本发明的优点和积极效果是:

53、1、现有的教育包括智能化的学习均是针对正确答案,针对学生是否合格,正确率多少,进行讲解分析,本系统专门针对错误的原因进行总结归纳,从横向纵向多个方向多种算法综合评判学生欠缺的点。

54、2、本发明基于hadoop框架下实现改进的多项式朴素贝叶斯算法,对大量的错题数据总结整理,形成一个庞大的错题数据库,对其进行数据挖掘,提取出隐藏在其中对用户有用而且感兴趣的知识以及信息,即就是得到错题数据的分类情况。

55、3、本装置。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1