一种高校学生外出签到综合管理方法及系统

文档序号:36267584发布日期:2023-12-06 14:32阅读:33来源:国知局
一种高校学生外出签到综合管理方法及系统

本发明涉及数据管理,具体涉及一种高校学生外出签到综合管理方法及系统。


背景技术:

1、当前教育环境下,学生安全及管理是高校十分关注的问题,许多学校正在寻找更有效、更精准的方法来跟踪和管理学生的校外活动;传统的学生管理方式,如人工点名、签到表等在一定程度上能够满足需求,但它们也有明显的局限性,比如耗时、易出错、无法实时追踪等,难以对学生的健康状况和出行进行更严密的监控;而通过构建高校学生外出签到系统,大量的签到数据会占用大量的存储空间,导致存储空间紧张,进而使得数据处理和查询速度下降;同时,长期存储未经整理或压缩的原始签到数据,可能会带来数据冗余和信息检索效率低下的问题。

2、由于学生外出签到数据仅是时间的变化,并且时间的格式具有很强的规律性,因此在压缩过程中会出现很大的存储空间冗余;同时由于时间的格式变化是规律的,因此现有技术中采用预测编码的方法对学生外出签到数据进行压缩;传统的预测编码压缩方法使用arima预测模型进行压缩,然而在预测模型的构建过程中,自相关系数决定着预测模型的预测效果好坏,若自相关系数设置不合理,会使得压缩效率大大降低,进而影响对学生外出签到数据的管理效率。


技术实现思路

1、本发明提供一种高校学生外出签到综合管理方法及系统,以解决现有的大量学生签到数据造成数据冗余而影响数据综合管理效率的问题,所采用的技术方案具体如下:

2、第一方面,本发明一个实施例提供了一种高校学生外出签到综合管理方法,该方法包括以下步骤:

3、采集不同时间尺度的若干学生外出的若干签到数据,以及多个维度的环境数据;所述签到数据包括不同时间尺度下每个单位时间长度统计的签到次数,并记录每次签到的地点;

4、根据不同学生的签到数据,获取学生之间的相似距离,聚类得到若干学生类别;根据相同学生类别不同时间尺度的签到数据,获取每个学生类别的最优时间尺度;

5、根据每个学生所属学生类别最优时间尺度下,签到数据在不同周期长度下得到的数据段,以及多个维度的环境数据,对每个学生每个周期长度获取优选程度并得到最优周期长度;

6、根据最优周期长度获取每个学生的自适应自相关系数并构建预测模型,对每个学生的签到数据进行预测编码压缩。

7、进一步的,所述学生之间的相似距离,具体的获取方法为:

8、根据每个学生在不同时间尺度的签到数据及签到的地点,获取每个时间尺度下每个学生在每个其签到过的地点的签到频率及签到间隔因子;第个学生与第个学生的相似距离的计算方法为:

9、;

10、其中,表示第个学生与第个学生签到过的地点的数量;表示时间尺度的数量;表示第个时间尺度下第个学生在第个地点的签到频率,表示第个时间尺度下第个学生在第个地点的签到频率;表示第个时间尺度下第个学生在第个地点的签到间隔因子;表示第个时间尺度下第个学生在第个地点的签到间隔因子。

11、进一步的,所述每个时间尺度下每个学生在每个其签到过的地点的签到频率及签到间隔因子,具体的获取方法为:

12、对于任意一个学生与任意一个该学生签到过的地点,获取该学生在该地点的若干次签到,获取每次签到在不同时间尺度对应的时刻,对于任意一个时间尺度,计算该学生在该地点的签到次数与该时间尺度的单位时间长度的比值,记为该时间尺度下该学生在该地点的签到频率;

13、对该时间尺度下该地点的相邻两次签到计算时间间隔,得到若干时间间隔,获取每个时间间隔与该时间尺度的单位时间长度的比值,记为该时间尺度下该学生在该地点的若干签到间隔,对所有签到间隔计算方差,记为该时间尺度下该学生在该地点的签到间隔因子。

14、进一步的,所述每个学生类别的最优时间尺度,具体的获取方法为:

15、根据每个学生在不同时间尺度的签到数据,获取每个学生在每个时间尺度的若干ica分量及签到规律程度;对于第个学生类别,第个时间尺度对该学生类别的最优程度的计算方法为:

16、;

17、其中,表示第个学生类别中学生数量,表示第个学生类别中第个学生在第个时间尺度的签到规律程度,表示包括第个时间尺度的时间尺度组合的数量,表示包括第个时间尺度的第个时间尺度组合中两个时间尺度长度的差值绝对值,表示时间尺度长度的最大值,表示包括第个时间尺度的第个时间尺度组合中,第个学生类别中第个学生在两个时间尺度下的ica分量之间的dtw距离最大值;表示以自然常数为底数的指数函数;所述时间尺度组合由任意两个时间尺度作为一个组合得到;

18、获取每个时间尺度对该学生类别的最优程度,将最优程度最大值对应的时间尺度,作为该学生类别的最优时间尺度。

19、进一步的,所述每个学生在每个时间尺度的若干ica分量及签到规律程度,具体的获取方法为:

20、对于任意一个学生类别中任意一个学生,对该学生每个时间尺度下的签到数据按照时序分别得到签到数据序列,对签到数据序列进行ica分解,得到每个时间尺度下的若干ica分量;

21、对于该学生任意一个时间尺度下的签到数据序列,以相邻下一个时间尺度的单位时间长度对该签到数据序列进行划分,得到该时间尺度下的若干序列段,对任意两个序列段计算皮尔逊相关系数,将所有皮尔逊相关系数的绝对值的均值,记为该学生在该时间尺度的签到规律程度。

22、进一步的,所述对每个学生每个周期长度获取优选程度并得到最优周期长度,包括的具体方法为:

23、对于任意一个学生,获取该学生所属学生类别的最优时间尺度,根据最优时间尺度的单位时间长度,得到该学生的若干周期长度;获取该学生在最优时间尺度的签到数据序列,对于任意一个周期长度,通过该周期长度将签到数据序列划分为若干段,记为该周期长度的若干数据段;获取该学生在最优时间尺度下每个周期长度的若干数据段;

24、根据最优时间尺度下不同周期长度的数据段、多个维度的环境数据,获取每个周期长度的优选程度;将优选程度最大值对应的周期长度,作为该学生的最优周期长度。

25、进一步的,所述每个周期长度的优选程度,具体的获取方法为:

26、根据每个学生在所属学生类别的最优时间尺度下的签到数据,以及多个维度的环境数据,获取每个学生的签到数据在每个维度对应的环境数据,以及每个维度的关联系数;

27、对于任意一个学生,对于该学生在最优时间尺度的任意一个周期长度下的若干数据段,对每个数据段中签到数据计算极差,记为每个数据段的极差;对每个数据段获取在每个维度的环境数据段,对相同维度任意两个环境数据段计算皮尔逊相关系数;对于第个数据段,除第个数据段之外第个数据段与第个数据段的基准系数的计算方法为:

28、;

29、其中,表示环境数据的维度的数量,表示该学生第个维度的关联系数,表示除第个数据段之外第个数据段及之前所有数据段对应的若干环境数据段中,任意两个环境数据段的皮尔逊相关系数的变异系数;表示除第个数据段之外第个数据段及之前所有数据段中,数据段的极差的最大值;为超参数;

30、获取除第个数据段之外每个数据段与第个数据段的基准系数,将所有基准系数的最小值,作为第个数据段的规律系数;获取该学生在该周期长度下每个数据段的规律系数,将所有规律系数的均值,作为该周期长度的优选程度。

31、进一步的,所述每个学生的签到数据在每个维度对应的环境数据,以及每个维度的关联系数,具体的计算方法为:

32、对于任意一个学生,对于该学生的任意一个维度的环境数据,获取该学生在最优时间尺度下每个签到数据对应的环境数据;该学生第个维度的环境数据与签到数据的关联性的计算方法为:

33、;

34、其中,表示该学生在最优时间尺度下签到数据的数量,表示该学生第个签到数据与相邻前一个签到数据的斜率,表示该学生第个签到数据在第个维度对应的环境数据与相邻前一个签到数据在第个维度对应的环境数据的斜率,表示求绝对值,表示以自然常数为底数的指数函数;

35、获取该学生每个维度的环境数据与签到数据的关联性,对关联性进行softmax归一化,得到的结果作为每个维度的关联系数。

36、进一步的,所述根据最优周期长度获取每个学生的自适应自相关系数并构建预测模型,包括的具体方法为:

37、对于任意一个学生,用于对该学生的签到数据进行预测编码压缩的自适应自相关系数的计算方法为:

38、;

39、其中,表示该学生的最优周期长度,表示该学生采集到的签到数据的总时间长度,为自相关系数的超参数;根据该学生的自相关系数,对该学生的所有签到数据构建arima预测模型。

40、第二方面,本发明另一个实施例提供了一种高校学生外出签到综合管理系统,该系统包括:

41、学生签到数据采集模块,用于采集不同时间尺度的若干学生外出的若干签到数据,以及多个维度的环境数据;

42、签到数据处理分析模块,用于根据不同学生的签到数据,获取学生之间的相似距离,聚类得到若干学生类别;根据相同学生类别不同时间尺度的签到数据,获取每个学生类别的最优时间尺度;

43、根据每个学生所属学生类别最优时间尺度下,签到数据在不同周期长度下得到的数据段,以及多个维度的环境数据,对每个学生每个周期长度获取优选程度并得到最优周期长度;

44、签到数据压缩管理模块,用于根据最优周期长度获取每个学生的自适应自相关系数并构建预测模型,对每个学生的签到数据进行预测编码压缩。

45、本发明的有益效果是:本发明通过对高校学生外出的签到数据获取自适应自相关系数,构建准确的arima预测模型并进行预测编码压缩;其中通过对所有学生的签到数据进行学生的聚类,并根据聚类结果获取不同时间尺度的最优程度来获取每个学生类别的最优时间尺度;通过学生签到数据来量化学生之间的相似距离得到学生类别,并根据相同学生类别中学生的签到数据之间相似的变化特征,以及不同时间尺度代替表征的能力,得到最优时间尺度,通过具有较强规律性的最优时间尺度进行后续的最优周期长度获取;在最优时间尺度中通过分析不同维度的环境数据变化,并结合原本签到数据的变化,获取最优周期长度,最终得到自相关系数;避免了传统的arima预测模型在编码压缩过程中,由于自相关系数设置不合理,导致数据压缩过程中预测效果不理想,造成了在存储数据偏差时较为不规律,进而使得压缩效率不高的缺点,提高了压缩效果,实现对高校学生外出的签到数据的压缩管理。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1