一种基于数据挖掘算法的学业预警方法、系统及存储介质与流程

文档序号:22891146发布日期:2020-11-10 18:16阅读:134来源:国知局
一种基于数据挖掘算法的学业预警方法、系统及存储介质与流程

本发明涉及数据挖掘技术领域,尤其涉及基于数据挖掘算法的学业预警方法、系统及存储介质。



背景技术:

目前,学校通过信息化手段进行教学质量分析的信息主要源于学校具有各类信息化管理系统,例如教务系统、毕业设计管理系统、图书馆管理系统、实验室预约系统等,包含学生成绩、毕业论文详情、图书馆进出及借阅记录、实验室使用登记等信息;其次是其它学生们的各类基本资料、社团活动、英语四六级成绩、计算机等级成绩、就业统计等数据。

以上数据虽然都是可以在不同的维度体现出学生在校的表现和学校教育质量,但是由于数据的保管单位不同,且数据管理标准与存储格式不统一,数据难以共享共用,形成一个个“数据孤岛”,难以发挥出数据本身应有的价值。



技术实现要素:

鉴于以上所述现有技术的不足,本发明的目的在于:提供一种基于数据挖掘算法的学业预警方法,能够充分挖掘校园大数据,打通数据孤岛,进而从不同维度综合分析每一个学生的学业情况,以便于教师给出个性化的教学指导意见。

为实现上述发明目的,本发明提供以下技术方案:

一种基于数据挖掘算法的学业预警方法,其包括以下步骤:

s1:对校园大数据进行数据清洗,将所述校园大数据转化为同一数据格式;再对数据清理后的校园大数据进行分类,并添加相应分类标签;

s2:对具有不同分类标签的数据进行主成分分析,得到多个与成绩相关的特征因子;

s3:将得到的特征因子输入至预先训练好的成绩预测模型中,预测出各个学生的成绩;其中,所述成绩预测模型通过将所述多个与成绩相关的特征因子作为输入,将成绩作为输出,并利用基于学生的历史校园大数据而提取出的特征因子训练而成;

s4:若有学生的成绩低于预警值,则标记该学生为学业预警。

根据一种具体的实施方式,本发明基于数据挖掘算法的学业预警方法中,步骤s1还包括:将所有的校园大数据存储至同一数据库中,并对每个学生的校园大数据添加相应的身份标签。

根据一种具体的实施方式,本发明基于数据挖掘算法的学业预警方法中,标记该学生为学业预警的方式为:将该学生对应的身份标签标记为学业预警状态。

进一步地,若有学生对应的身份标签被标记为学业预警状态,则将该学生对应的所述多个与成绩相关的特征因子中的与教学资源利用相关的特征因子输入至预先成绩与教学资源关联分析模型中,得到该学生教学资源利用数据对成绩的影响程度信息。

根据一种具体的实施方式,本发明基于数据挖掘算法的学业预警方法还包括:将各个学生预测出的成绩和教学资源利用数据对成绩的影响程度信息进行图形化处理,用以进行图形化展示。

根据一种具体的实施方式,本发明基于数据挖掘算法的学业预警方法中,步骤s2还包括:对经主成分分析得到的特征因子进行数据验证,筛选出所述多个与成绩相关的特征因子。

本发明在具体实施的一方面,还提供一种基于数据挖掘算法的学业预警系统,其包括:

数据采集模块,用于从存储校园大数据的各个系统中采集相应的校园大数据;

数据清洗模块,用于对校园大数据进行数据清洗,将所述校园大数据转化为同一数据格式;

数据分类模块,用于对数据清理后的校园大数据进行分类,并添加相应分类标签;

主成分分析模块,用于对具有不同分类标签的数据进行主成分分析,得到多个与成绩相关的特征因子;

成绩预测模型模块,用于运行成绩预测模型,并根据输入的特征因子,预测出各个学生的成绩;其中,所述成绩预测模型通过将所述多个与成绩相关的特征因子作为输入,将成绩作为输出,并利用基于学生的历史校园大数据而提取出的特征因子训练而成;

学业预警标记模块,用于判断每个学生的成绩是否低于预警值;若低于所述预警值,则标记该学生为学业预警。

根据一种具体的实施方式,本发明基于数据挖掘算法的学业预警系统还包括:成绩与教学资源关联分析模型模块,用于运行成绩与教学资源关联分析模型,并根据输入的所述多个与成绩相关的特征因子中的与教学资源利用相关的特征因子,预测得到相应学生教学资源利用数据对成绩的影响程度信息。

本发明在具体实施的一方面,还提供一种可读存储介质,其上存储有一个或多个程序,该一个或多个程序被一个或多个处理器执行时实现本发明基于数据挖掘算法的学业预警方法。

与现有技术相比,本发明的有益效果:

本发明基于数据挖掘算法的学业预警方法,通过对校园大数据进行数据清洗,将校园大数据转化为同一数据格式;再对数据清理后的校园大数据进行分类,并添加相应分类标签;然后,对具有不同分类标签的数据进行主成分分析,得到多个与成绩相关的特征因子;再接着将得到的特征因子输入至预先训练好的成绩预测模型中,预测出各个学生的成绩;最后,判断出若有学生的成绩低于预警值,则标记该学生为学业预警。因此,本发明通过数据清洗和主成分分析,充分挖掘校园大数据,打通数据孤岛,进而从不同维度综合分析每一个学生的学业情况,以便于教师给出个性化的教学指导意见。

附图说明

图1为本发明方法的流程图;

图2为本发明系统的结构示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。

如图1所示,本发明基于数据挖掘算法的学业预警方法,其包括以下步骤::

s1:对校园大数据进行数据清洗,将所述校园大数据转化为同一数据格式;再对数据清理后的校园大数据进行分类,并添加相应分类标签。

具体的,在将所有的校园大数据存储至同一数据库中之后,并对每个学生的校园大数据添加相应的身份标签,从而方便后续针对性地研究每个学生的校园大数据对其成绩的影响。由于校园大数据分散在教务系统、毕业设计管理系统、图书馆管理系统、实验室预约系统等校园信息化系统中,不同系统之间数据格式和规范都不一致,通过数据清洗将校园大数据中不完整的数据、错误的数据、重复的数据进行剔除,同时,将校园大数据转换为统一的数据格式,此外,为了保证数据的维度,将不完整的数据可根据其它相关数据进行手动补全。经过数据清洗后的数据,需要进行分类,并调价相应的分类标签,便于后续的数据分析。

s2:对具有不同分类标签的数据进行主成分分析,得到多个与成绩相关的特征因子;具体的,对于学生各科目的考试成绩、图书馆借阅记录(次数与频率)、实验室预约记录(次数、频率、时长)等具有不同分类标签的数据,通过主成分分析算法提取出数学基础因子、英语基础因子、勤奋因子、文献阅读能力因子、编程能力因子、实验动手能力因子、合作沟通能力因子等,这些特征因子能够全方位地表示一个学生的能力,以及不同课程对不同因子的贡献度,例如“数学基础因子”很大程度取决于学生的高等数学、线性代数等问题,“实验动手能力因子”是一些实验课成绩和实验室预约系统中的实验室使用记录相关。当然,为了减小成绩预测模型的训练难度,需要对经主成分分析得到的特征因子进行数据验证,筛选出多个与成绩相关的特征因子,比如选出对成绩影响程度较高的特征因子。

s3:将得到的特征因子输入至预先训练好的成绩预测模型中,预测出各个学生的成绩;其中,成绩预测模型通过将步骤s2中筛选出的多个与成绩相关的特征因子作为输入,将成绩作为输出,并利用基于学生的历史校园大数据训练而成,能够实现通过低年级基础课程的成绩,预测高年级时专业课的成绩。其中,本发明的成绩预测模型基于神经网络算法或者knn算法构建而成。

s4:若有学生的成绩低于预警值,则标记该学生为学业预警。具体的,标记该学生为学业预警的方式为:将该学生对应的身份标签标记为学业预警状态。通过上述方案,当预测出的学生成绩低于预警值,则可由任课老师进行提前干预教学,从而降低该学生在实际考试中出现不达标的几率。

在实施时,若有学生对应的身份标签被标记为学业预警状态,则将该学生对应的所述多个与成绩相关的特征因子中的与教学资源利用相关的特征因子输入至预先成绩与教学资源关联分析模型中,得到该学生教学资源利用数据对成绩的影响程度信息。如此,结合该学生教学资源利用数据对成绩的影响程度信息,任课教师可更合理地规划教学指导。其中,本发明的成绩与教学资源关联分析模型基于关联分析算法或因子分析算法构建而成。

而且,本发明基于数据挖掘算法的学业预警方法还将各个学生预测出的成绩和教学资源利用数据对成绩的影响程度信息进行图形化处理,用以进行图形化展示。如此,任课教师可根据各个学生学业表现等数据,提供个性化教学规划指导。

如图2所示,本发明在具体实施的一方面,还提供一种基于数据挖掘算法的学业预警系统,其包括:

数据采集模块,用于从存储校园大数据的各个系统中采集相应的校园大数据;具体的,针对教务系统、毕业设计管理系统、图书馆管理系统、实验室预约系统等校园信息化系统开发相应的数据接口,数据采集模块通过统一开发的数据接口,从存储校园大数据的各个系统中采集相应的校园大数据。

数据清洗模块,用于对校园大数据进行数据清洗,将所述校园大数据转化为同一数据格式;

数据分类模块,用于对数据清理后的校园大数据进行分类,并添加相应分类标签;

主成分分析模块,用于对具有不同分类标签的数据进行主成分分析,得到多个与成绩相关的特征因子;

成绩预测模型模块,用于运行成绩预测模型,并根据输入的特征因子,预测出各个学生的成绩;其中,所述成绩预测模型通过将所述多个与成绩相关的特征因子作为输入,将成绩作为输出,并利用基于学生的历史校园大数据而提取出的特征因子训练而成;

学业预警标记模块,用于判断每个学生的成绩是否低于预警值;若低于所述预警值,则标记该学生为学业预警。

进一步地,本发明基于数据挖掘算法的学业预警系统还包括:成绩与教学资源关联分析模型模块,用于运行成绩与教学资源关联分析模型,并根据输入的所述多个与成绩相关的特征因子中的与教学资源利用相关的特征因子,预测得到相应学生教学资源利用数据对成绩的影响程度信息。

本发明在具体实施的一方面,还提供一种可读存储介质,其上存储有一个或多个程序,其特征在于,该一个或多个程序被一个或多个处理器执行时实现本发明基于数据挖掘算法的学业预警方法。

应该理解到,本发明所揭露的系统,可通过其它的方式实现。例如所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,模块之间的通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1