一种基于BP神经网络模型的学生学业成绩预测方法及系统与流程

文档序号:11832691阅读:9793来源:国知局
一种基于BP神经网络模型的学生学业成绩预测方法及系统与流程

本发明涉及教育技术、计算机应用学科领域,具体涉及一种基于BP神经网络模型的学生学业成绩预测方法及系统。



背景技术:

目前,我国高等教育发展迅速,其中普通高等院校的数量已达到2500多所。近年来,生源的持续下降,给普通高等院校带来了巨大的生存危机。如何提高学生培养质量,提高学生的就业竞争能力,成为诸多高校亟需解决的一个问题。学生的学业成绩作为学生培养质量的一个重要核心指标,倍受高校管理者的关注。

我国高等院校通常由团委辅导员(班主任)负责学生的日常管理、由教师负责学生的课程理论和专业技能教学。辅导员和教师之间往往缺乏有效的沟通交流,这会导致一部分同学因疏于管教而误入歧途,因学业成绩不佳而被迫延期毕业或退学。学生的学业成绩往往受到多方面的影响,包括学生以往成绩、学习能力、教师指导状况等诸多因素。如果能够根据学生的历史学业成绩和各方面的综合表现及素质情况,对学生的未来学业成绩进行预测;并根据学业成绩的预测结果,对可能出现问题的学生及时加强管理教育、督促其认真学习,以避免其出现无法通过学业考试的后果,这将大大方便辅导员对于学生的教育管理,对于提高学生的培养质量将起到重要作用。

尽管目前各类教学管理系统在高等院校中已非常普遍,能够对学生的学习成绩进行有效的管理。但是,对学生的学业成绩进行预测分析的研究工作仍非常少见,亦未见到广泛实施。

1、现有的教学管理系统,仅侧重于对于学生学习成绩数据的管理,而忽视了对学生其它行为数据的管理。对学生数据的收集并不完整,也难以对学生进行全面分析评价。

2、对于学生成绩数据,目前仅仅是将学生成绩录入到教学管理系统;教学管理系统存储的均是学生成绩的历史数据。对学生的现有的能力进行评价仅仅是通过对学生成绩的历史数据分析得到,未采用相应的数据处理模型,无法实现对学生学业成绩的智能预测。

本发明专利正是针对这些在学生学业成绩的预测时存在的技术问题,将数据挖掘技术应用于学业成绩的预测,实现一种基于BP神经网络模型的学生学业成绩预测方法及系统,力求能够推动这一研究的发展。



技术实现要素:

为解决现有技术存在的不足,本发明公开了一种基于BP神经网络模型的学生学业成绩预测方法及系统,本发明通过采用相应的数据获取及分析技术实现对学生学业成绩的智能预测。

为实现上述目的,本发明的具体方案如下:

一种基于BP神经网络模型的学生学业成绩预测方法,包括以下步骤:

步骤一:获取学生的学习数据,并将获取的数据传输至第一服务器的数据库中;

步骤二:针对数据库中存储的学生的学习数据,进行数据转换,得到规范化的学生学习状况数据表;

步骤三:对规范化的学生学习状况数据表的各属性值进行正交编码,构建BP神经网络的训练数据集,基于该训练数据集进行BP神经网络的成绩预测模型的构建和训练;

步骤四:将待预测的学生数据进行数据转换、规范化、正交编码及归一化处理后输入至训练好的基于BP神经网络的成绩预测模型进行学业成绩分类预测,获得学生学业成绩预测结果并通过显示单元进行显示。

进一步的,所述步骤一中,所述学生的学习数据包括学生的学业成绩信息,其中学业成绩为教学管理系统数据库服务器中存储的信息,教学管理系统数据库服务器与第一服务器进行通信,将学生的学业成绩传输至第一服务器中。

进一步的,所述学业成绩信息包括学生邻近两个学期的学业成绩和入学学业成绩,其中前一学期的学业成绩情况和入学学业成绩情况,将作为学生个体的历史学业成绩属性;后一学期的学业成绩情况将作为学生学业成绩的分类结果。

进一步的,所述步骤一中,所述学生的学习数据还包括学习行为信息,学习行为信息的获取通过数据采集终端,数据采集终端可为计算机或可移动智能设备。

进一步的,所述学习行为信息具体包括学习时间、网上娱乐时间、图书馆使用频率及借阅图书类型等。

进一步的,学生学业成绩的具体获取时,利用学生的学号为检索词从教学管理系统数据库服务器中提取出该学生成绩数据和其所在班级的班级成绩表。

进一步的,在第一服务器中对学生数据转换,根据学生信息数据所在的区间,将得到的连续型数据分段转换为等级数据。

进一步的,对于学业成绩信息,包括学生邻近两个学期的学业成绩和入学学业成绩情况,此数据需要进行转换处理,具体处理流程:

获得班级成绩表,根据学生的考试科目数量,计算出学生的平均成绩,并按学生的平均成绩排序,输出班级名次表;并输出班级学生总数;

根据班级名次表和学生成绩数据,查询学生的名次,并输出。

根据学生名次和班级学生总数,判断学生名次在班级中的总体位置。

如果属于前20%,则输出学生学业成绩等级为A;如果位于20%之后、40%之前,则输出学生学业成绩等级为B;如果位于40%之后、60%之前,则输出学生学业成绩等级为C;如果位于60%之后、80%之前,则输出学生学业成绩等级为D;如果位于后20%,则输出学生学业成绩等级为E。

进一步的,在步骤三中,对得到的规范化的学生学习状况数据表中的各属性值进行正交编码的具体过程包括:

遍历规范化的学生学习状况数据表,从中统计某一属性的属性值的个数,输出N;

对当前属性的属性值使用N个二进制位进行正交编码,并输出正交编码。

进一步的,在步骤三中,构建BP神经网络的训练数据集的具体过程包括:

逐条从规范化的学生学习状况数据表中取学生记录;

对学生记录的各属性的属性值的正交编码进行合并,构成一条正交编码的学生记录;

对正交编码中设定字段所对应的正交编码位进行归一化处理,其余字段所对应的正交编码位不变,得到归一化处理的学生记录,构建归一化处理的训练数据集。

进一步的,在步骤三中,构建基于BP神经网络的成绩预测模型,确定BP神经网络具有三层,即输入层、隐层和输出层,BP神经网络的各参数值的设置方法如下:

(1)确定BP神经网络输入层神经元个数,设定输入层神经元个数为规范化的学生学习状况数据表中设定字段对应属性的正交编码值的长度;

(2)确定BP神经网络输出层神经元个数,设定输出层神经元个数为规范化的学生学习状况数据表中其余字段属性的正交编码值的长度;

(3)确定BP神经网络隐层神经元个数;

(4)确定BP神经网络各层的激活函数;

(5)确定BP神经网络训练方法;

(6)确定BP神经网络的训练要求精度;

(7)确定BP神经网络的学习率。

一种基于BP神经网络模型的学生学业成绩预测系统,包括:

数据获取模块:获取学生的学习数据,并将获取的数据传输至第一服务器的数据库中;

数据转换模块:针对数据库中存储的学生的学习数据,进行数据转换,得到规范化的学生学习状况数据表;

基于BP神经网络的成绩预测模型建立模块:针对规范化的学生学习状况数据表的各属性值进行正交编码,构建BP神经网络的训练数据集,基于该训练数据集进行BP神经网络的成绩预测模型的构建和训练;

学生学业预测模块:将待预测的学生数据进行数据转换、规范化、正交编码及归一化处理后输入至训练好的基于BP神经网络的成绩预测模型进行学业成绩分类预测,获得学生学业成绩预测结果并通过显示单元进行显示。

本发明的有益效果:

1、本发明提出基于BP神经网络的成绩预测模型的学生学业成绩预测方法及系统,可预测学生的未来的学业成绩,以便于高等院校加强对学生的教育管理。

2、本发明通过学生的历史学业成绩和学习行为信息等14个属性来描述学生样本,其样本数据可由学校的教学管理系统和数据采集终端获取,其数据来源简便且精确,便于在高等院校广泛推广。

3、本发明针对获取的数据进行数据转换,得到规范的学生学习状况数据表,根据学生信息数据的所在的区间,将其分段转换为等级数据,以减少属性值的数量,便于后续模型建立时数据的利用。

4、本发明将获得的学生的数据信息均存储至第一服务器的数据库中,以便后续数据的调用及处理方便,且保证数据的安全性及稳定性。

5、目前高等院校辅导员的学生管理任务繁重,难以顾及到每个学生,本发明将能够有效地为辅导员预测出学业即将出现问题的学生,这对于加强辅导员工作的针对性,提高高等院校的学生培养质量将起到有益的作用。

6.本发明采用的基于BP神经网络的成绩预测模型,所述模型用于实现学生成绩的精确预测,可靠性高。

附图说明

图1本发明的整体预测流程图;

图2本发明的学生学业成绩的具体获取流程图;

图3本发明的学业成绩信息数据进行转换处理具体处理流程图;

图4本发明规范化的学生学习状况数据表中的各属性值,进行正交编码的具体流程图;

图5本发明的构建BP神经网络的训练数据集的具体流程图。

具体实施方式:

下面结合附图对本发明进行详细说明:

如图1所示,本发明的基于BP神经网络模型的学生学业成绩预测方法包括以下主要步骤:

步骤一:对学生数据进行收集,包括学生的学业成绩和学习行为信息;

步骤二:对学生数据进行转换处理,得到规范的学生学习状况数据表;

步骤三:由规范的学生学习状况数据表,训练基于BP神经网络的学生学业成绩预测模型;

步骤四:根据步骤三所获得的基于BP神经网络的成绩预测模型,预测学生的学业成绩类别。

利用本发明,可以根据学生的日常学习状况,预测学生的未来的学业成绩,能够便于高等院校加强对学生的教育管理。

其中,步骤一中,学生的学业成绩可由教学管理系统数据库直接导出,其它学习行为信息等或者通过对学生开展调查问卷而得(也可借助于网络发放电子调查问卷)或者采用数据采集终端获取,优选的选用数据采集终端的方式获取,数据采集终端为计算机终端或者可移动设备,以学号作为学生的ID,每个学生均有且只有一个学号,每个学号下存在相应的一条数据记录,因为这样获取的数据能够便面调查问卷可能存在的造假而导致的失真数据的问题。

当通过网络发放电子调查问卷获取数据时,电子调查问卷与学生的学号一一对应,将每个学生所填写的内容进行统一汇总并处理。

对于其它学习行为信息可以包括:学生学习时间、按时上课情况、网上娱乐时间、图书馆使用频率、借阅图书类型、时间管理能力、学习能力、课外活动、教师指导情况、家庭指导情况、专业兴趣。

例如,学生学习时间开始时,计算机开始计时,学生学习时间结束时,计算机计时结束,继而得到该学生的学习时间;

按时上课情况,通过指纹识别的方式,每个学生在上课时进行指纹识别,没有进行指纹识别的学生则为缺课,通过这种方式获取学生的按时上课情况。

网上娱乐时间的获取与学生学习时间的获取方式类似。

图书馆使用频率、借阅图书类型可以通过学校的图书管理系统中的数据库服务器中获取,将图书管理系统中的数据库服务器中存储的数据传输至计算机中。

时间管理能力、学习能力、课外活动、教师指导情况、家庭指导情况、专业兴趣等数据可以综合个人自我评价和教师、同学的他人评价而确定。

各类学生信息的属性如表1所示。

表1

对于学业成绩信息,收集学生邻近两个学期的学业成绩和入学学业成绩情况,其中前一学期的学业成绩情况和入学学业成绩情况,将作为学生个体的历史学业成绩属性;后一学期的学业成绩情况将作为学生学业成绩的分类结果。各种学生学业成绩的具体获取步骤均如图2所示。根据学生的学号和学校的学生成绩数据库,从中提取出学生成绩数据和其所在班级的班级成绩表。

步骤二中,对于学业成绩信息,包括学生邻近两个学期的学业成绩和入学学业成绩情况,此数据需要进行转换处理。具体处理流程如图3所示。

对获得的班级成绩表,根据学生的考试科目数量,计算出学生的平均成绩,并按学生的平均成绩排序,输出班级名次表;并输出班级学生总数。

根据班级名次表和学生成绩数据,查询学生的名次,并输出。

根据学生名次和班级学生总数,判断学生名次在班级中的总体位置。如果属于前20%,则输出学生学业成绩等级为A;如果位于20%之后、40%之前,则输出学生学业成绩等级为B;如果位于40%之后、60%之前,则输出学生学业成绩等级为C;如果位于60%之后、80%之前,则输出学生学业成绩等级为D;如果位于后20%,则输出学生学业成绩等级为E。

将其它学习行为信息、转换后的学业成绩信息组合在一起,得到学生学习状况数据表。

在本实施例中,假定得到如表2所示的学生学习状况数据表。

表2

步骤三中,由规范的学生学习状况数据表,训练基于BP神经网络的学生学业成绩预测模型。

本发明将表2中的字段“后一学期的学业成绩情况”记作R14;将表2中的其它13个字段,依次记作R1~R13

步骤3.1:对由步骤二所得的规范的学习状况数据表中的各属性值,进行正交编码。

步骤3.1的具体实施流程如图4所示。

遍历学生学习状况数据表,从中统计某一属性的属性值的个数,输出N。

对当前属性的属性值使用N个二进制位进行正交编码,并输出正交编码。

在本实施例中,对于“学习时间”属性,当统计某一属性的属性值的个数时,可得其属性值分别为“>5”、“5”、“4”、“3”、“<3”,共5个属性值,故N为5。当使用N个二进制位对各属性值进行编码时,采用5个二进制位对5个属性值分别进行编码。属性值“>5”、“5”、“4”、“3”、“<3”将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”,这5个二进制编码向量显然都是正交的。

同理,对于“按时上课情况”属性,根据上述图4所述流程可得,其属性值分别为“A”、“B”、“C”、“D”、“E”,共5个属性值;将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”。

对于“网上娱乐时间”属性,根据上述图4所述流程可得,其属性值分别为“<1”、“1”、“2”、“3”、“>3”,共5个属性值;将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”。

对于“图书馆使用频率”属性,根据上述图4所述流程可得,其属性值分别为“>4”、“4”、“3”、“2”、“<2”,共5个属性值;将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”。

对于“借阅图书类型”属性,根据上述图4所述流程可得,其属性值分别为“专业书籍”、“杂志”、“小说”、“其它”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“时间管理能力”属性,其属性值分别为“极好”、“较好”、“一般”、“差”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“学习能力”属性,根据上述图4所述流程可得,其属性值分别为“极好”、“较好”、“一般”、“差”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“课外活动”属性,根据上述图4所述流程可得,其属性值分别为“极好”、“较好”、“一般”、“差”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“教师指导情况”属性,根据上述图4所述流程可得,其属性值分别为“极好”、“较好”、“一般”、“差”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“家庭指导情况”属性,根据上述图4所述流程可得,其属性值分别为“极好”、“较好”、“一般”、“差”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“专业兴趣”属性,根据上述图4所述流程可得,其属性值分别为“好”、“有”、“一般”、“无”,共4个属性值;将分别被编码为“1 0 0 0”、“0 1 0 0”、“0 0 1 0”、“0 0 0 1”。

对于“前一学期的学业成绩情况”属性,根据上述图4所述流程可得,其属性值分别为“A”、“B”、“C”、“D”、“E”,共5个属性值;将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”。

对于“入学学业成绩情况”属性,根据上述图4所述流程可得,其属性值分别为“A”、“B”、“C”、“D”、“E”,共5个属性值;将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”。

对于“后一学期学业成绩情况”属性,根据上述图4所述流程可得,其属性值分别为“A”、“B”、“C”、“D”、“E”,共5个属性值;将分别被编码为“1 0 0 0 0”、“0 1 0 0 0”、“0 0 1 0 0”、“0 0 0 1 0”、“0 0 0 0 1”。

步骤3.2:构建BP神经网络的训练数据集。

步骤3.2的具体实施流程如图5所示。

负责逐条从学生学习状况数据库中取学生记录。该学生记录经处理后,将作为一条训练样本。所取的样本的数量可根据实际情况自由设定。

对学生记录的各属性的属性值的正交编码进行合并,构成一条正交编码的学生记录。

对正交编码中R1~R13所对应的正交编码位进行归一化处理,R14所对应的不变,得到归一化处理的学生记录,构建归一化处理的训练数据集。训练数据集中各记录的前58维将作为神经网络的58维输入,后5维将作为神经网络的5维目标输出。

在本实施例中,以表2中的第一条记录为例,说明步骤3.2的具体方法。

取出表2的第一条记录,即:4、A、1、>4、专业书籍、极好、极好、一般、极好、一般、好、A、B、A。

根据使用N个二进制位对各属性值进行编码所得的各属性值的正交编码,如属性值4对应“0 0 0 1 0”、属性值A对应“1 0 0 0 0”等,可得当前记录所对应的正交编码为:0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0,共63个二进制位,其中属性R1~R13对应前58个二进制位,属性R14对应第59~63个二进制位。

对正交编码中R1~R13所对应的正交编码位(即前58个二进制位)进行归一化处理,R14所对应的不变,得到归一化处理的学生数据集。其中前58个二进制位的最大值均为1,最小值均为0,在归一化处理后,最大值1仍为1,最小值0将转变为-1。可得当前记录归一化处理后的形式为:-1 -1 1 -1 -1 1 -1 -1 -1 -1 -1 1 -1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 -1 1 -1 -1 -1 1 -1 -1 -1 -1 -1 1 -1 1 -1 -1 -1 -1 -1 1 -1 1 -1 -1 -1 1 -1 -1 -1 -1 -1 1 -1 -1 -1 1 0 0 0 0。其中,前58维将作为神经网络的58维输入,后5维将作为神经网络的5维目标输出。

步骤3.3:构建基于BP神经网络的成绩预测模型。

确定BP神经网络具有三层,即输入层、隐层和输出层。BP神经网络的各参数值的设置方法如下:

(1)确定BP神经网络输入层神经元个数。设定输入层神经元个数为R1~R13属性的正交编码值的长度,即58个。

(2)确定BP神经网络输出层神经元个数。设定输出层神经元个数为R14属性的正交编码值的长度,即5个。

(3)确定BP神经网络隐层神经元个数。确定隐层节点数的最基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐层节点数。在此根据经验,将隐层神经元个数设为3个。

(4)确定BP神经网络各层的激活函数。在输入层、隐层、输出层分别使用对数S形转移函数logsig、对数S形转移函数logsig、线性函数purelin。

(5)确定BP神经网络训练方法。使用Levenberg-Marquardt算法。

(6)确定BP神经网络的训练要求精度。训练要求精度设置为0.01。

(7)确定BP神经网络的学习率。学习率设置为0.01。

在本实施例中,在步骤3.2所获得的训练数据集上,采用Matlab的神经网络函数newff来完成基于BP神经网络的成绩预测模型的构建和训练。在训练过程中,除了以上说明的7个参数外,其它参数使用Matlab神经网络的缺省参数。经实验,对于本实施例中的小规模训练数据集,BP神经网络可取得100%的正确率。

步骤四、根据步骤三所获得的基于BP神经网络的成绩预测模型,预测学生的学业成绩类别。

具体实施步骤如下所述。

步骤4.1:将待预测的学生样本进行数据转换、规范化、正交编码及归一化处理。

在本实施例中,由步骤4.1,假定根据步骤二对学生样本X的数据进行转换处理后,其学习时间、按时上课情况、网上娱乐时间、图书馆使用频率、借阅图书类型、时间管理能力、学习能力、课外活动、教师指导情况、家庭指导情况、专业兴趣、前一学期的学业成绩情况、入学学业成绩情况分别为:3、C、2、<2、小说、差、一般、差、差、一般、一般、E、D。其正交编码为:0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0,归一化处理可得:-1 -1 -1 1 -1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 -1 -1 -1 -1 1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 -1 1 -1 -1 1 -1 -1 -1 1 -1 -1 -1 -1 -1 1 -1 -1 -1 1 -1。

步骤4.2:利用步骤三所获得的基于BP神经网络的成绩预测模型,预测学生样本的学业成绩类别。

在本实施例中,由步骤4.2,利用步骤3.3所构建的基于BP神经网络的成绩预测模型对学生X的后一学期的学业成绩类别进行预测,可得神经网络的输出值为[0.0508-0.0572 0.3938 0.1865 0.4261]’,其中“’”表示矩阵转置。取最大值对应的类别作为预测结果,可得神经网络的输出对应的学生学业成绩为“E”类。

根据该学生样本的学业预测成绩,其学业成绩属于“E”类,即名次排名将在80%之后,显然应对该同学加强教育管理。辅导员可根据该预测结果,及时对该学生予以干预,对其批评教育,纠正其不良学习习惯,端正其学习态度,以避免该生的学业成绩出现严重问题。

需要说明的是,本申请中的基于BP神经网络的成绩预测模型的学生学业成绩预测方法及系统均是基于现有的计算机、服务器等硬件产品的基础上进行的,所得到的预测结果可以通过相应的显示单元进行显示。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1