一种基于深度矩阵分解的学生成绩预测方法与流程

文档序号:21644632发布日期:2020-07-29 02:58阅读:574来源:国知局
一种基于深度矩阵分解的学生成绩预测方法与流程

(一)技术领域

本发明涉及机器学习、推荐算法及数据挖掘等技术领域,具体是涉及一种基于深度矩阵分解的学生成绩预测方法。

(二)

背景技术:

在大数据时代,海量教育数据已经成为学校、教师等与教育学习相关领域的关键资源之一。人们需要通过数据挖掘发现隐藏在教育数据中的知识信息。随之教育数据挖掘成为一个新兴的跨学科领域,它使用数据挖掘技术从教育数据中分析并提取隐藏的知识,以解决教学实践中的问题。在教育数据挖掘中,学生成绩预测是教育管理的一个重要问题,通过预测学生的成绩,及时帮助有学习困难的学生,同时为教学管理者、老师等提供教学建议和理论支持。

为了实现学生学生成绩预测,发明专利“一种基于bp神经网络模型的学生学业成绩预测方法及系统”,公开号为cn106157204a,主要利用学生临近两个学期的学业成绩和入学学业成绩数据,针对在学生学业成绩预测时存在的技术问题,实现对学生学业成绩的智能预测,但是提取的特征粒度较粗,其预测结果缺乏可解释性。发明专利“一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统”,公开号为cn106127634a,主要是针对数据库中存储的学生的学习数据,进行数据转换,得到规范化的学生学习状况数据表;针对规范化的学生学习状况数据表,通过服务器中的计算单元计算不同类别中各属性的条件概率及不同类别的先验概率;将待预测的学生数据进行数据转换后输入至训练好的朴素贝叶斯模型进行学生数据分类预测,但朴素贝叶斯算法需知道先验概率,且先验概率很多时候取决于假设,且该算法对输入数据的表达形式很敏感。本发明描述的“一种基于深度矩阵分解的学生成绩预测方法”将利用本科生某一门专业课程每个章节的测试成绩、每个章节的课堂作业成绩、课程最终成绩作为输入数据,通过矩阵分解将输入数据分解成学生特征、项目特征,然后通过全连接神经网络学习,将简单的特征组合成更加复杂的特征,本发明设计了一个注意力网络来构建学生、项目的特征向量。得到学生潜在特征向量和项目潜在特征向量后计算余弦相似度得到预测成绩,以此提高预测结果的准确度和可解释性。

(三)

技术实现要素:

为解决现有技术存在的不足,本发明公开了一种基于深度矩阵分解的学生成绩预测方法,本发明利用本科生某一专业课程的历史成绩数据,通过一种基于注意力机制的神经网络结构的矩阵分解模型,提高学生成绩预测的准确性以及结果的可解释性。

为实现上述目的,本发明的具体方案如下:

一种基于深度矩阵分解的学生成绩预测方法,包括以下步骤:

步骤一:获取学生历史成绩数据(仅考虑积极参与课程学习的学生即每次测试、作业都有评分成绩)。由于采集的原始数据不能直接用于后续的计算,需要对采集到的原始数据进行预处理。在预处理数据后,得到规范化的数据;

步骤二:根据每位学生已获得的历史成绩数值,构建学生-项目之间的评分矩阵,得到训练数据集;

步骤三:将训练数据通过矩阵分解得到学生特征向量、项目特征向量,然后将两个特征向量作为带有注意力机制的全连接神经网络的输入,来构建和训练成绩预测模型;

步骤四:将测试数据集的数据进行数据转换、规范化处理后,输入至训练好的深度矩阵分解模型进行学生最终成绩预测。

进一步的,所述步骤一中,学生历史成绩数据包括学生某一专业课程的章节测验成绩、每个章节课后作业成绩、课程期末成绩,其存储在课程教学数据管理数据库中,通过任课教师可以将数据直接导出。

进一步的,所述学生的历史成绩数据直接从数据库导出由于各部分记录格式不统一、存在缺失值、异常值等问题,对数据要进行数据清洗、数据转换等预处理操作,最终得到规范化数据。

进一步的,所述步骤二中,对得到的规范化的学生成绩数据的各属性值进行编码,学生各阶段成绩处理为1-5的评分制,具体过程包括:

(1)遍历规范化的学生历史成绩数据表,从中统计课程各部分成绩的属性值的个数,输出n;

(2)遍历规范化的学生历史成绩数据表,从中统计学生的属性值的个数,输出m;

(3)对各部分成绩进行转换处理,按照1-5评分制对学生成绩数据进行存储,得到一个m×n评分矩阵,矩阵的每行表示的是每个学生所有的课程成绩记录,矩阵的每列表示的是每一次测验所有学生的成绩。

进一步的,所述步骤三中,矩阵分解评分矩阵得到潜在学生特征向量、潜在项目特征向量,得到的两个特征向量即两个小矩阵,其满足两个矩阵的乘积能够复原评分矩阵。

进一步的,在步骤三中,利用训练数据集数据构建成绩预测模型,确定全连接神经网络具有四层,即输入层、两层隐含层和输出层,并在两层隐含层中加入注意力机制,全连接神经网络的各参数值得设置方法如下:

(1)确定全连接神经网络输入层神经元个数,设定输入层神经元个数为规范化的学生历史成绩数据中学生个数、项目个数长度;

(2)确定全连接神经网络隐含层神经元个数;

(3)确定全连接神经网络各层的激活函数;

(4)确定注意力机制的类型;

(5)确定全连接神经网络的训练方法;

(6)确定全连接神经网络的训练要求精度;

(7)确定全连接神经网络的学习率。

进一步的,所述步骤四中,测试数据集进行预处理操作得到规范化数据,相应的构建评分矩阵,将评分矩阵中最后一列为学生的期末成绩,将最后一列中的部分数据进行处理将其表示为“0”,“0”所表示的部分为将要进行预测的部分。

进一步的,将处理好的测试数据输入到构建的成绩预测模型中得到学生期末的预测成绩。

本发明的有益效果:

1.本发明提出基于深度矩阵分解的学生成绩预测方法,可预测学生的未来的学业成绩,以便于及时帮助有学习困难的学生,同时为教学管理者、老师等提供教学建议和理论支持。

2.本发明通过学生的历史学业成绩来描述学生样本,其样本数据可由课程的学习记录获取,其数据来源简便且精确,便于在高校广泛推广。

3.本发明针对一门课程的最终成绩进行预测,利用课程中每个章节的历史成绩数据,相对来说提取的特征粒度较小,对于预测结果的准确度会相对较高。

4.本发明利用矩阵分解和深度学习相结合的模型,深度学习技术能够弥补矩阵分解方法存在的数据稀疏、冷启动等问题,将简单的特征构建为更加复杂的特征,实现更加准确地学生成绩预测。

5.本发明在全连接神经网络模型中加入了注意力机制,注意力机制可以快速提取稀疏数据的重要特征,让模型更加专注于重要的信息。

6.本发明采用的基于深度矩阵分解的学生成绩预测模型,所述模型用于实现学生成绩的精确预测,可靠性高。

(四)附图说明

图1为本发明的模型框架图。

图2为学生成绩预测建模整体流程图。

图3为采集的原始数据图。

图4为矩阵分解实现成绩预测示意图。

图5为学生成绩评分矩阵。

图6为加入注意力机制的全连接神经网络结构示意图。

(四)具体实施方式

为使本发明的目的、技术方案和优点更加清楚,以下结合具体实例,并参照附图,对本发明进一步详细阐述。

本发明以基于深度矩阵分解的学生成绩预测为实例描述本发明方法具体实施过程。本发明的模型框架如图1所示,学生成绩预测的整体流程如图2所示。

结合示意图说明具体步骤:

步骤一:获取学生某一专业课程历史成绩记录(例如:本科生导论课程第一章节、第二章节......第八章节的测试成绩、课堂作业成绩,课程期末成绩),并进行预处理,清洗掉无用的数据得到规范化数据;

步骤二:将步骤一采集的数据构建为学生-项目成绩矩阵,切分数据得到训练数据集和测试数据集;

步骤三:训练集数据用于训练预测模型,将训练数据通过矩阵分解得到学生特征向量、项目特征向量,然后将两个特征向量作为带有注意力机制的全连接神经网络的输入,来构建和训练成绩预测模型;

步骤四:根据步骤三所获得的基于深度矩阵分解的成绩预测模型,将测试数据输入预测学生课程最终成绩。

利用本发明,可以根据学生的阶段学习情况,预测学生的课程最终成绩取得情况,能够便于任课教师加强对学生的教育管理,对学习有困难的学生及时提供帮助。

其中,步骤一中学生历史成绩可以直接在该课程任课教师存储在数据库的数据中获取,授课过程中,任课教师都会有一个学生成绩的记录表,如图3所示。由于成绩记录形式不一致,需要对数据进行预处理,将数据格式统一并清洗掉无用数据,将数据规范化操作。如将分数分为五个等级1-5分,将百分之的分数以及等级制的分数全部按比例转换为1-5的评分。

矩阵分解就是把原来的大矩阵,近似的分解成小矩阵的乘积,在实际推荐计算时不再使用大矩阵,而是使用分解得到的两个小矩阵。具体来说就是,假设学生课程的成绩矩阵g是m乘n维,即一共有m个学生,n个课程通过一套算法转化为两个矩阵s和c,矩阵s的维度是m乘k,矩阵c的维度是n乘k。对这两个矩阵的要求就是通过公式可以复原矩阵。图4为矩阵分解方法实现学生成绩预测示意图。步骤二中将步骤一处理好的数据构建评分矩阵,成绩预测利用矩阵分解方法即对交互矩阵中未知的部分进行评分,我们假设采集的数据来源于积极参与课程的学生,每个章节都有一个测试分数,现在我们对一部分学生的期末成绩置为0,并不表示该学生未参与考试或参与考试评分为0,在这里0表示矩阵中未知的部分,即将要预测的部分。根据公式(1)构建评分矩阵:

步骤三中将步骤二构建的评分矩阵如图5所示,通过矩阵分解得到学生特征向量ui,项目特征向量vj,将两个特征向量作为带有注意力机制的全连接神经网络模型输入。如图6所示。relu作为激活函数用在神经网络的各层,其实现函数为f(x)=max(0,x),将两个特征向量通过注意力层,让模型更加专注于重要的信息根据公式(2)计算每个元素的注意力分布:

其中w表示权重矩阵。

根据公式(2)计算的注意力分布在根据公式(3)对每个输入元素进行加权得到全连接神经网络的输入:

通过全连接神经网络将经过注意力层的学生特征向量、项目特征向量映射到低维空间得到潜在学生特征向量、项目特征向量,由公式(4)得到:

预测成绩由公式(5)得到:

由公式(6)来计算损失函数,以此得到更好的预测模型:

其中r为1-5评分中最高评分5。

步骤四依据步骤三中得到的预测模型,将测试数据集进行处理,放入模型进行预测,最后通过均方根误差对预测结果进行评估,具体见公式(7):

当然,以上所述实例仅是本发明的较优实施例,本发明并非局限于上述实施例和实施例方法。相关技术领域的从业者可在本发明的技术思路许可的范围内进行不同的细节调整和实施,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1