一种基于神经网络的大学生心理行为异动监测预警方法与流程

文档序号:16688038发布日期:2019-01-22 18:31阅读:570来源:国知局
一种基于神经网络的大学生心理行为异动监测预警方法与流程

本发明涉及一种监测预警方法,尤其涉及一种大学生心理行为异动监测预警方法,属于大数据应用领域。



背景技术:

据世界卫生组织报告,抑郁症在全世界发病率约11%,已成为危害人类健康的第四大疾病,到2020年可能成为仅次于心脏病的第二大疾病。在我国,抑郁症发病率高达7%,而且由于发现不及时与认识不足,治疗率仅为20%。因抑郁导致的自杀死亡事件频发。高校学生作为社会生活中活跃而敏感的特殊群体,处于生理、心理都经历着巨大变化的青年时期,心理健康问题较其他人群更为突出,2014年加州大学伯克利分校的学生心理健康研究报告指出生物科学研究生中有43%-46%的人感到抑郁,2015年亚利桑那大学的报告指出大多数博士生承受了“高于平均水平”的压力,并将学校及教育相关事情列入压力最重要的来源。

目前,高校学生的心理健康服务还停留在“被动”模式,主要通过传统问卷发放方式或学生向心理健康咨询中心咨询或到医院就诊发现心理异动个体。但由于人力物力所限,长期以来心理学研究者无法获取覆盖研究对象全体的数据,也不便对个体心理健康状态变化进行跟踪研究,难以对心理行为异动个体进行及时主动干预。

随着传感器、高速网络、移动互联、云计算、人工智能等技术的发展,以此为依托的大数据技术对心理学这一古老而复杂领域的研究也逐步展开。

专利“一种基于互联网云端数据库的心理健康评估方法”(编号:cn201610808888.0)中提出了一种基于互联网云端数据库的心理健康评估方法。方法中,云端数据库用于存储已知的样本中心理测试量表的因子得分;利用rbf神经网络算法建立心理健康评估模型。rbf神经网络模型对新个体心理健康状态进行评估后,将评估结果上传至云端。优点是将rbf神经网络和互联网云端数据库存储技术结合应用于心理健康评估当中,提高了效率和准确度,缺点是该方法还是基于传统的心理测试表结果,无法对对心理健康状态进行追踪研究。

专利“一种心理健康状态评估方法”(编号:cn201210576344.8)中,中科院心理研究所朱廷劭等提出了一种利用机器学习进行心理健康状态评估的方法。该评估方法的实现步骤为:首先,基于已知样本中个体网络行为特征和人口统计学特征,建立和训练基于网络行为特征的心理健康状态评估模型;其次获取新个体的网络行为特征和人口统计学特征;最好,根据上述建立的评估模型,得到该新个体的心理健康状态。优点是消除了主观因素对心理健康状态评估的影响,缺点是行为数据来源单一、挖掘不够彻底,心理健康状态评估的准确度无法保证。

综上所述,虽然基于大数据技术的心理健康研究得到了一些关注,但是已有的努力和研究还没有建立起描述人类心理-行为的理论模型,存在数据来源单一、理论分析不到位、研究内容不全面、数据挖掘不彻底等问题,从本质上看还是停留在心理健康状态的静态评估阶段。

目前尚未发现使用教育大数据和机器学习算法建立心理行为异动监测预警模型的专利。



技术实现要素:

本发明的目的是克服上述现有系统存在的缺陷而提供一种数据全面、准确度高、动态性能好、客观、科学的大学生心理行为异动监测预警方法。

为实现上述目的,本发明采取以下技术方案,具体步骤如下:

一种基于神经网络的大学生心理行为异动监测预警方法,其特征在于,包括如下步骤:

s1、获取学生在校心理行为数据;通过实时/准实时方式将来自各信息系统,如学校教务系统、一卡通系统、学工系统、图书馆系统、出入控制系统等中与心理行为相关的表同步至本预警系统。

s2、对来自上述信息系统的相关表的字段进行分析,选择出所需的字段并提取至单一一张表中。对该表数据进行数据预处理,如填补缺失值、归一化、数据规约等;获取学生的心理测试自评表;通过所述心理测试自评表的结果,对学生进行心理健康状态标签标记,将患有轻度、中度、重度学生归为一类,无抑郁归为另一类;

s3、使用pca算法对上述特征进行降维,在获得学生心理行为数据和提取出主要特征分量后,利用神经网络算法,建立和训练心理行为异动监测预警模型;

s4、获取新的学生多信息源数据,根据所述的心理行为异动监测预警模型进行预测,得到新的学生个体的心理健康状态。

其中,s1中与心理行为相关的表为本科生基本信息表、研究生基本信息表、一卡通消费表、图书馆借阅表、图书馆出入记录表、成绩表、课程表、奖学金表等。

所述步骤s1中,所述的学生心理行为数据包括学生性别、学生获奖情况、学生处罚情况、学生学业情况、学生一卡通消费情况、学生进出宿舍门禁情况、学生进出图书馆情况、学生借书情况、学生三餐情况、学生社交情况。

其中,所述学生获奖情况包括获得奖学金次数和金额。

其中,所述学生处罚情况包括学生处罚次数和等级。

其中,所述学生学业情况包括学生各学科优秀率、良好率、及格率、不及格率、优秀门数、良好门数、及格门数、不及格门数。

其中,所述学生一卡通消费情况包括消费总额、周消费总额、周平均消费金额。

其中,所述学生进出宿舍门禁情况是一天每个小时的刷门禁次数。

其中,所述学生进出图书馆情况包括进入图书馆的次数。

其中,所述学生借书情况包括学期借书总量、总共借书次数、每种类型的借阅分布

其中,所述学生三餐情况包括早餐、午餐、晚餐用餐的比率、方差和平均值,通过所述的三个值可以看出学生是否在学校就餐。

其中,所述的学生社交情况,通过所述的学生三餐情况,将在5分钟内一起刷卡吃饭的学生认为是一次发生一次社交行为,找到与指定学生社交次数最高的5个学生的一起刷卡次数作为学生的社交特征。

其中,所述步骤s2中,所述的数据预处理算法包括下列步骤:

step2.1:对来自多信息源的数据进行数据清理,通过填写缺失值、光滑噪声数据、识别或删除离群点解决数据的不一致性;

step2.2:进行数据集成,将来源于多个数据源针对同一个体的所有数据集合起来并采取措施避免数据集成时的冗余,如有必要,还可以再次进行step2.1;

step2.3:进行数据规约,对数据集进行简化表示。

所述步骤s2中,所述的学生心理测试自评表为beck抑郁自评测表、sas焦虑自评测表,sds抑郁自评测表,按照一定的权重比相加,得到最终的抑郁评定等级。

所述步骤s3中,所述的pca算法又称主成分分析技术或主分量分析,旨在利用降维的思想,在保证数据本质的前提下将数据的维数降低。该pca算法,是一种较为常见的降维算法。

所述步骤s3中,所述的神经网络算法为多层感知机,结构为经典的m-p神经元结构,激活函数为logistic函数,优化器为lbfgs。该网络为全连接神经网络,输入为使用pca降维后的学生特征数据,输出为二分类评估结果,即抑郁或不抑郁。

附图说明

图1为实施例的心理行为异动监测预警方法的流程图;

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

为了便于理解,首先简要介绍本发明所依据的科学原理。

大数据技术的发展和进步正在从深度和广度上改变人类社会的方方面面,在科学领域催生了继实验科学、归纳总结、计算机仿真之后的“第四范式”-基于大数据的科学研究范式。在此背景之下,科学家们尝试运用数据科学的方法解释经济崩溃、金融泡沫等以往认为是“上帝之舞”的事情。例如社会物理学研究者们通过全方位收集人类生活中各个方面的数据面包屑分析人类行为规律;人类行为动力学家使用定量化时空统计分析和建模尝试深层次理解舆情及疾病传播原理,优化交通规划、信息推荐等。

进一步在心理测量学中,对学生的心理健康状态评估都是通过学生个体的心理行为表征进行间接测量。个体的外显行为表现都是被其心理状态支配和影响,行为的差异可以检测出心理状况的差异,所以可以借助心理行为表征数据对学生的心理健康进行科学、准确的评估。

进一步在现代信息技术快速发展的支撑下,不仅可以全时全跟踪记录个体的所有外部表现,而且无论是现实社会还是虚拟社会,都可以使用电子数据实现全程无缝记录,此外,大数据存储管理和云计算也为心理健康评估提供了数据高效存储和分析的服务。

基于上述原理,根据本发明的一个实施例,如图1所示为实施例的心理行为异动监测预警方法流程图,包括如下步骤:

s1:获取学生的多信息源数据。

具体的,将储存在学校信息平台的学生基本信息进行采集,所述的学校信息平台记录了学生在校的基本学习生活情况,包括学校教务系统、一卡通系统、学工系统、图书馆系统、出入控制系统等。

s2:对数据进行数据预处理,从中提取出与心理行为相关的特征。

具体的,将上述的关系数据做数据预处理操作,对其数据清理,其目的是将来自信息平台的多种数据进行缺失值处理、光滑噪声数据、识别或者删除离群点,解决数据的不一致性问题,缺失值处理可通过忽略元组、人工填写缺失值、使用属性的中心度量填写缺失值等方式,噪声可通过分箱、回归、离群点分析等方法去除;数据集成,其目的是合并来自多个数据存储的数据,有助于减少数据集中的冗余和不一致,有助于提高其后挖掘过程的准确性和速度,在数据集成过程中,可通过相关分析消除冗余数据;数据规约,其目的是用来得到数据集的规约表示,缩小数据的大小,但仍接近保持原始数据的完整性。根据此数据预处理集成框架,实现虚拟空间和实体空间的心理表征数据融合。

具体的,预处理后的数据应包括性别、学生获奖情况、学生处罚情况、学生学业情况、学生一卡通消费情况、学生进出宿舍门禁情况、学生进出图书馆情况、学生借书情况、学生三餐情况、学生社交情况。

s3:对步骤s2预处理后的数据进行组合、降维,利用降维后的数据训练神经网络。

具体的,首先将训练数据按列排列,得出x=[x1,x2,…,xn],其中n为训练数据集个数,并且将结论存储在向量y中,y=[y1,y2,…,yn],yi∈{0,1},其中0代表无抑郁,1代表有抑郁。

具体的,将训练数据进行十折交叉验证,取其中90%作为训练集用来训练网络,10%作为验证集,验证并优化网络结构。

具体的,首先对训练集进行pca降维,保留k%的数据能量(k为需要进一步优化的量)并进行白化处理,得到降维后的训练集x′及变换矩阵m;

进一步的,将验证数据集向矩阵m投影,获取验证集的特征向量q。

进一步的,将x′按批量送入所述全连接多层感知器神经网络分类器,并以验证集q分类结果的f1值为优化函数进行网络迭代,调试最有效果的隐层层数、降维维度、网络参数衰减权重、提早停止迭代次数、批量训练数据量等参数,从而得到最优神经网络模型w。

具体的f1定义为:

其中tp为抑郁判定为抑郁的数量,fp不抑郁判定为抑郁的数量,fn为抑郁判定为不抑郁的数量。

s4、对于未知学生,执行s1-s2步骤,获取该学生特征向量s,并向s3所述m矩阵投影,得到降维后特征x′。

进一步的,将所述的新获取的学生心理行为特征x′输入到所述的神经网络模型w中,得到预测结果y,y∈{0,1}。

基于大数据技术,本实施所获得的心理行为异动监测预警方法具有分析结果准确、客观,分析过程高效,覆盖面广的优点。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1