一种基于认知诊断和集成学习的学生成绩预测方法

文档序号:37809975发布日期:2024-04-30 17:19阅读:8来源:国知局
一种基于认知诊断和集成学习的学生成绩预测方法

本发明涉及智慧教育,具体为一种基于认知诊断和集成学习的学生成绩预测方法。


背景技术:

1、通过认知诊断和集成学习的方法,利用在线学习平台的学生数据和答题数据能够预测出学生的学生认知能力模式和在某特定试卷中的小题得分和总分,对于提升学生的学习质量和教师的教学效果有着巨大帮助,大部分研究者会通过收集学习者的相关数据来预测学习者的期中成绩或期末成绩,然而大部分的成绩预测只是学生的总分成绩,并没有预测学生的认知能力情况和在试卷中的小题得分情况。


技术实现思路

1、针对现有的技术不足,本发明的目的是提供一种基于认知诊断和集成学习的学生成绩预测的方法,解决了现有技术中存在的对学习者的成绩预测中仅仅考虑了学生成绩总分的预测的不足。

2、为实现上述目的,本发明提供如下技术方案:一种基于认知诊断和集成学习的学生成绩预测方法,包括如下步骤:

3、步骤1:采集学习者的学习数据,包括静态数据和动态数据,所述静态数据包括学习者基本信息,所述动态数据包括学习者在平台上的交互数据、测试数据;

4、步骤2:对步骤1采集的学习者的学习数据进行处理;

5、步骤3:划定学生的认知能力属性,根据科目课程标准、教学大纲、布鲁姆的认知目标分类以及专业教师确定学生的认知能力属性;

6、步骤4:收集学生的习题作答数据;

7、步骤5:通过评价指标deviance、aic、bic进行选择认知诊断模型、评价指数的数值越小模型表现越好;

8、步骤6:通过步骤5的评价指标和步骤4所收集的答题数据选择认知诊断模型,采用flexcdms平台进行模型与数据的拟合,在测验拟合指标一栏中进行拟合,分别得到每个认知诊断模型的相关评价指标的结果,通过评价指标的评价从中选择最优模型;

9、步骤7:通过步骤6选择的认知诊断模型确定学生的认知结构;

10、步骤8:对步骤7所确定的学生认知结构再结合步骤1的数据构建完整的学生认知模式成绩数据集;

11、步骤9:分类预测模型以准确率为主,精确率、召回率、f1值为辅的形式来确定;

12、步骤10:根据步骤9的评价指标将选择集成模型进行预测学生的认知结构;

13、步骤11:根据步骤10所预测的认知结构和选择认知诊断模型预测学生的各小题得分和总分;

14、作为一种优选方案,所述步骤1中的学习者基本信息包括以下小类:姓名、学号、专业、班级、院系;

15、所述步骤1中的学习者在平台上的交互数据包括以下小类:线上得分、在线时长、登录次数、评论次数;

16、所述步骤1中的学习者的测试数据包括以下小类:测试成绩、作业成绩、学习成绩、考试成绩、线下得分。

17、作为一种优选方案,所述步骤2具体为:

18、步骤2.1,数据清洗:对步骤1采集的学习者数据根据每个变量的合理取值范围和内在关系,检查所拿到的学习者数据是否符合要求,如果发现超出正常范围、逻辑上不合理或者相互矛盾的数据,对其进行核对和纠正;如果学习者的某些数据是缺失值,将以均值进行填充;

19、步骤2.2,将清洗的数据整合在一起;

20、步骤2.3,将学习者数据中的字符型数据转换为数值型数;

21、步骤2.4,将学习者数据进行归一化;

22、各列属性取值处于不同的数量级,需要对数据进行归一化,将数据都归一化到[0,1]范围之间。

23、数据归一化按照如下公式计算:

24、

25、其中x′表示归一化后的数值,x表示为原本的数据值,min表示数据特征量中的最小值,max表示数据特征量中的最大值。

26、作一种优选方案,所述步骤4具体为:

27、步骤4.1,由专业教师以及相关学科师范生或专业人士,根据步骤3的认知能力属性建立q矩阵,编制有效习题,并验证习题的有效性;

28、步骤4.2,将学生的作答习题数据答对记为1,答错记为0,进行数据收集;

29、作为一种优选方案,所述步骤5具体为:

30、步骤5.1,根据认知诊断模型的不同类型,选择不同的评价指标进行比较,选择deviance、aic、bic具体指标计算方式如下计算:

31、aic=2w-2ln(lmax)

32、

33、其中,w为模型估计参数的个数,lmax为模型的极大似然函数值,为当前模型的极大似然函数值,n是观察数据样本容量,k是需要自由估计的参数数目。

34、进一步的,采用最具有代表性的认知诊断模型:dina、dino、gdina、rrum,根据评价指标选择最佳模型对学生进行认知模式预测。

35、作为一种优选方案,所述步骤7具体为:

36、根据步骤6所确定的认知诊断模型,使用flexcdms平台确定学生的认知能力掌握模式,在二级评分cdms栏目中选择最大后验概率确定学生的认知能力掌握模式。

37、作为一种优选方案,所述步骤8具体为:

38、将步骤7所确定的学生认知能力属性模式,与在步骤1所述的数据根据对应的信息进行合并数据集,建立完整的学生认知模式成绩数据集。

39、作为一种优选方案,所述步骤9具体为:

40、步骤9.1,确定混淆矩阵;

41、所述混淆矩阵中包括真实类别和预测类别以及真实类别和预测类别的比较结果,所述真实类别是学习者期中和期末的学习成绩的及格情况,所述预测类别是指通过测试集预测得到的学习成绩的及格情况,所述真实类别和预测类别的比较结果包括:

42、若真实类别为及格且预测类别为及格则表示被正确地划分为正例,计被正确地划分为正例的个数为tp;

43、若真实类别为及格且预测类别为不及格则表示被错误地划分为负例,计被错误地划分为负例的个数为fn;

44、若真实类别为不及格且预测类别为及格则表示被错误地划分为正例,计被错误地划分为正例的个数fp;

45、若真实类别为不及格且预测类别为不及格则表示被正确地划分为负例,及被正确地划分为负例的个数为tn;

46、用p指真实类别中及格总数;n指真实类别中不及格的总数;p’指预测类别中及格总数,n’指预测类别中不及格总数;

47、步骤9.2,根据步骤9.1得到的混淆矩阵,计算预测的准确率、精确率和召回率,f1值,具体为:

48、准确率:

49、精确率:

50、召回率:

51、f1值:

52、进一步的,采用最具有代表性的且表现效果较好的集成模型:xgboost、gdbt、随机森林、lightgbm进行分类预测。

53、作为一种优选方案,所述步骤10具体为:

54、步骤10.1,,使用机器学习中的10折交叉验证及sklearn库中的gridsearchcv技术,以及在训练过程中分别采用不同比例的测试数据来进行验证,分别在测试数据集比例为0.2、0.25、0.3中进行验证,以此获取模型的最佳参数和保证预测的准确率以及避免模型的过拟合;

55、步骤10.2,根据所述步骤9的评价指标进行最优模型选择并进行预测学生认知结构。

56、作为一种优选方案,所述步骤11具体为:

57、根据步骤6所确定的认知诊断模型,使用flexcdms,在二级评分cdms下,根据模式反应概率,将大于0.6的概率为判定为答对该题,小于0.6概率的答错该题,进行最终预测学生的小题得分和总分。

58、与现有技术相比,本发明的有益效果是:

59、本发明通过认知诊断模型,诊断出学生的认知结构,构建出完整的学生认知模式成绩数据集,并且通过评价指标的比较,选择最佳认知诊断模型,然后选择不同集成模型利用数据预测学生的认知结构,并根据评价指标选择最佳的集成模型,最后根据学生的认知结构模式使用最佳认知诊断模型预测出学生在某特定试卷中的小题得分、总分,实现了对学生成绩更加准确和全面的预测,根据预测结果从而有效的提高学生的学习成绩和教学效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1