基于大数据环境下的成绩预测方法及系统与流程

文档序号:17467048发布日期:2019-04-20 05:34阅读:483来源:国知局
基于大数据环境下的成绩预测方法及系统与流程

本发明涉及成绩预测领域,尤其涉及基于大数据环境下的成绩预测方法及系统。



背景技术:

随着信息化教育到来,通过大数据和云计算等技术来改善传统教育方式,逐渐成为新的发展趋势。由于当今仍处于较为单一的封闭传统教育阶段,高校管理方对学生成绩数据的管理还停留在对数据库中成绩数据简单查询阶段,所以不能体现大数据带来的价值与收益。

目前,已有较多的专家和学者针对学业成绩预测做了相关研究:2010年,武彤等人应用决策树算法建立学生成绩预测分析模型及分类规则,找出影响学生成绩因素以有效地辅助教学管理工作;2012年,王凯成等人利用microsoftsqlserver提供的数据挖掘功能分析学生历史成绩数据,预测学生的平均学分绩点,帮助老师提前采取措施避免发生学生绩点不达标的情况;2014年,张林红等人分析学生早餐习惯与成绩的关联规则,发现早餐就餐次数多、时间早的学生成绩明显高于就餐次数少、时间晚的规律;2018年,周庆等人基于一卡通数据与课程分类的关联性预测学生是否存在及格风险。以上研究都是预测成绩的影响因素与学生的学分绩点,并未根据历届以及在校各级学生的课程成绩数据对在校各级学生的具体课程成绩进行有效的预测,无法提供针对性的指导意见。



技术实现要素:

本发明所要解决的技术问题在于,提供基于大数据环境下的成绩预测方法及系统,能够根据历届以及在校各级学生的课程成绩数据对在校各级学生的具体课程成绩进行有效的预测,给予学生与教师实际的针对性指导意见。

为了解决上述技术问题,本发明提供了基于大数据环境下的成绩预测方法,包括;获取成绩系统数据;将数据根据不同年级划分为往届数据集与本届数据集;在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的预测科目并选择作为其变量的其他科目成绩;统计满足预测要求的预测科目对应的数据集,并根据选择出的变量利用最小二乘法拟合线性模型,得出符合成绩预测条件的预测模型;往预测模型中输入本届数据集中对应特征变量的科目成绩,生成预测科目的成绩。

优选地,所述基于大数据环境下的成绩预测方法还包括:对获取的数据清洗处理。

优选地,所述基于大数据环境下的成绩预测方法还包括:对清洗处理后的数据标准化处理。

优选地,所述基于大数据环境下的成绩预测方法还包括:将往届数据集与本届数据集分别按专业划分为专业年级数据集。

优选地,所述基于大数据环境下的成绩预测方法还包括:对预测成绩较低的科目进行预警标识。

本发明还提供了基于大数据环境下的成绩预测系统,包括:获取模块,用于获取成绩系统数据;年级划分模块,用于将数据划分为往届数据集与本届数据集;变量选择模块,用于选择构建预测模型的变量;模型构建模块,用于构建符合成绩预测条件的预测模型;成绩预测模块,用于输入作为变量的科目成绩并生成预测科目的成绩。

优选地,所述基于大数据环境下的成绩预测系统还包括:清洗模块,用于对获取的数据清洗处理。

优选地,所述基于大数据环境下的成绩预测系统还包括:标准化模块,用于对清洗处理后的数据标准化处理。

优选地,所述基于大数据环境下的成绩预测系统还包括:专业划分模块,用于将往届数据集与本届数据集分别按专业划分为专业年级数据集。

优选地,所述基于大数据环境下的成绩预测系统还包括:预警模块,用于对预测成绩较低的科目进行预警标识。

实施本发明的有益效果在于:

充分利用学校成绩系统中的往届学生成绩数据与本届学生成绩数据,构建成绩预测模型,从而达到预测学生成绩的目的,提前发现易挂科学生群体及其易挂科课程,给予学生与教师实际的针对性指导意见,可以极大提高教学管理辅助工作效率。

附图说明

图1是本发明提供的基于大数据环境下的成绩预测方法第一实施例流程图;

图2是本发明提供的基于大数据环境下的成绩预测方法第二实施例流程图;

图3是本发明提供的基于大数据环境下的成绩预测方法第三实施例流程图。

图4是本发明提供的基于大数据环境下的成绩预测方法第四实施例流程图;

图5是本发明提供的基于大数据环境下的成绩预测方法第五实施例流程图;

图6是本发明提供的基于大数据环境下的成绩预测系统示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。仅此声明,本发明在文中出现或即将出现的上、下、左、右、前、后、内、外等方位用词,仅以本发明的附图为基准,其并不是对本发明的具体限定。

如图1所示,本发明提供的基于大数据环境下的成绩预测方法第一实施例,包括:

s101,获取成绩系统数据,获取学校学生成绩系统数据,包括学生基本信息、考试基本信息及课程基本信息;

s102,将数据根据不同年级划分为往届数据集与本届数据集,

往届数据集作为构建预测模型的基本数据来源,本届学生的成绩数据作为输入预测模型的变量,从而达到预测本届学生成绩的目的;

s103,在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的目标科目并选择作为其变量的其他科目成绩;

s104,统计满足预测要求的预测科目对应的数据集,并根据选择出的变量利用最小二乘法拟合线性模型,得出符合成绩预测条件的预测模型,

本发明采用的预测科目对应的数据集至少包含10个训练样本,对满足训练要求的数据集进行训练集和测试集的划分,通过训练集利用最小二乘法拟合线性模型,得出预测模型,预测模型的好坏由回归分析结果的贴近程度决定,通过测试集对预测模型进行测试,输出回归分析预测结果,对模型进行评估,判断模型是否能用于预测。

s105,往预测模型中输入本届数据集中对应特征变量的科目成绩,生成预测科目的成绩。

本发明基于大数据环境下的成绩预测方法,基于往届学生的成绩数据构建预测模型,通过往预测模型输入本届学生相关科目成绩,生成本届学生的预测科目成绩。例如,要预测本届学生c科目的成绩,可以通过往届学生的成绩数据构建预测模型,预测模型中,a科目与b科目为预测科目c成绩的相关变量,本届学生的a科目与b科目的成绩是已知的,把a科目与b科目的成绩代入预测模型中,就会得出本届学生c科目的预测成绩。本发明通过构建每个科目成绩的预测模型,就能对学生的具体科目成绩进行有效的预测,给予学生与教师实际的针对性指导意见。

如图2所示,本发明提供的基于大数据环境下的成绩预测方法第二实施例,包括:

s201,获取成绩系统数据,获取学校学生成绩系统数据,包括学生基本信息、考试基本信息及课程基本信息;

s202,对获取的数据清洗处理,

包括缺失值处理与异常值处理等,当数据集中出现缺失值时,会造成意义不明,可能被理解成数据未记录、原始数据错误、等待填入更多信息等多种意义,当数据集中出现异常值时,即在数据集中存在不合理的值,又称离群点,会对后面的数据分析产生不利的影响,因而,在对数据进行分析之前,需对数据进行清洗处理,能够降低预测模型的误差率。

s203,将数据根据不同年级划分为往届数据集与本届数据集,

s204,在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的预测科目并选择作为其变量的其他科目成绩,

s205,统计满足预测要求的预测科目对应的数据集,并根据选择出的变量利用最小二乘法拟合线性模型,得出符合成绩预测条件的预测模型,

s206,往预测模型中输入本届数据集中对应特征变量的科目成绩,生成预测科目的成绩。

如图3所示,本发明提供的基于大数据环境下的成绩预测方法第三实施例,包括:

s301,获取成绩系统数据,获取学校学生成绩系统数据,包括学生基本信息、考试基本信息及课程基本信息;

s302,对获取的数据清洗处理;

s303,对清洗处理后的数据标准化处理,

在数据分析之前,我们通常需要先将数据标准化,利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。通过对清洗处理后的数据标准化处理,能够为后面分析数据,构建预测模型提供良好的基础。

s304,将数据根据不同年级划分为往届数据集与本届数据集,将往届数据集与本届数据集分别按专业划分为专业年级数据集;

s305,在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的预测科目并选择作为其变量的其他科目成绩;

s306,统计满足预测要求的预测科目对应的数据集,并根据选择出的变量利用最小二乘法拟合线性模型,得出符合成绩预测条件的预测模型;

s307,往预测模型中输入本届数据集中对应特征变量的科目成绩,生成预测科目的成绩。

如图4所示,本发明提供的基于大数据环境下的成绩预测方法第四实施例,包括:

s401,获取成绩系统数据;

s402,对获取的数据清洗处理,

s403,对清洗处理后的数据标准化处理;

s404,将数据根据不同年级划分为往届数据集与本届数据集,将往届数据集与本届数据集分别按专业划分为专业年级数据集,

往届数据集作为构建预测模型的基本数据来源,本届学生的成绩数据作为输入预测模型的变量,从而达到预测本届学生成绩的目的,然而,对于不同专业的学生,课程虽然一样,但要求掌握的程度不同、考试内容不一样、阅卷老师的严格程度不同,这些因素都会影响学生卷面成绩,当分析对象涉及不同专业的时候,不能拿该专业的学生的成绩去预测其他专业学生的成绩,故应将往届数据集与本届数据集分别按专业划分为专业年级数据集,例如,17级生物医学工程专业数据集;

s405,在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的预测科目并选择作为其变量的其他科目成绩;

s406统计满足预测要求的预测科目对应的数据集,并根据选择出的变量利用最小二乘法拟合线性模型,得出符合成绩预测条件的预测模型;

s407,往预测模型中输入本届数据集中对应特征变量的科目成绩,生成预测科目的成绩。

如图5所示,本发明提供的基于大数据环境下的成绩预测方法第五实施例,包括:

s501,获取成绩系统数据;

s502,对获取的数据清洗处理;

s503,对清洗处理后的数据标准化处理;

s504,将数据根据不同年级划分为往届数据集与本届数据集,将往届数据集与本届数据集分别按专业划分为专业年级数据集;

s505,在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的预测科目并选择作为其变量的其他科目成绩;

s506,统计满足预测要求的预测科目对应的数据集,并根据选择出的变量利用最小二乘法拟合线性模型,得出符合成绩预测条件的预测模型;

s507,往预测模型中输入本届数据集中对应特征变量的科目成绩,生成预测科目的成绩;

s508,对预测成绩较低的科目进行预警标识,

为了将学业需要预警的学生辨识出来,对学生各门预测成绩较低的科目进行标识,并对学生所有教学科目的成绩进行一个汇总,通过置信区间,可以计算各学科得分低于60分的概率,得出挂科风险;对学生进行标签等级预警,提醒挂科学生群体需要注意自身学习状态,重视学业发展。

如图6所示,本发明提供的基于大数据环境下的成绩预测系统,包括:获取模块1,用于获取成绩系统数据获取学校学生成绩系统数据,包括学生基本信息、考试基本信息及课程基本信息;年级划分模块2,用于将数据划分为往届数据集与本届数据集,往届数据集作为构建预测模型的基本数据来源,本届学生的成绩数据作为输入预测模型的变量,从而达到预测本届学生成绩的目的;变量选择模块3,用于选择构建预测模型的变量,在往届数据集中,选取目标科目成绩与其他科目成绩进行相关性检验,并计算出其他科目成绩的贡献显著性,根据相关性与贡献显著性确定满足预测要求的预测科目并选择作为其变量的其他科目成绩;模型构建模块4,用于构建符合成绩预测条件的预测模型;成绩预测模块5,用于输入作为变量的科目成绩并生成预测科目的成绩。

本发明提供的基于大数据环境下的成绩预测系统,通过获取模块1获取成绩系统数据获取学校学生成绩系统数据,通过年级划分模块2将数据划分为往届数据集与本届数据集,通过变量选择模块3选择构建预测模型的变量,通过模型构建模块4构建符合成绩预测条件的预测模型,通过成绩预测模块5输入作为变量的科目成绩并生成预测科目的成绩。所述成绩预测系统,充分利用学校成绩系统中的往届学生成绩数据与本届学生成绩数据,构建成绩预测模型,从而达到预测学生成绩的目的,提前发现易挂科学生群体及其易挂科课程,给予学生与教师实际的针对性指导意见,可以极大提高教学管理辅助工作效率。

优选地,所述基于大数据环境下的成绩预测系统还包括:清洗模块6,用于对获取的数据清洗处理。所述清洗模块6能够净化数据,降低后续的数据分析误差。

进一步地,所述基于大数据环境下的成绩预测系统还包括:标准化模块7,用于对清洗处理后的数据标准化处理。通过对清洗处理后的数据标准化处理,能够为后面数据整理划分提供统一标准,为构建预测模型提供良好的基础。

更佳地,所述基于大数据环境下的成绩预测系统还包括:专业划分模块8,用于将往届数据集与本届数据集分别按专业划分为专业年级数据集,所述专业划分模块8将不同专业的学生成绩数据归类划分,对于不同专业的学生,课程虽然一样,但要求掌握的程度不同、考试内容不一样、阅卷老师的严格程度不同,这些因素都会影响学生卷面成绩,当分析对象涉及不同专业的时候,不能拿该专业的学生的成绩去预测其他专业学生的成绩,故应将往届数据集与本届数据集分别按专业划分为专业年级数据集。

较优地,所述基于大数据环境下的成绩预测系统还包括:预警模块9,用于对预测成绩较低的科目进行预警标识。为了将学业需要预警的学生辨识出来,对学生各门预测成绩较低的科目进行标识,并对学生所有教学科目的成绩进行一个汇总,通过置信区间,可以计算各学科得分低于60分的概率,得出挂科风险;对学生进行标签等级预警,提醒挂科学生群体需要注意自身学习状态,重视学业发展。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1