基于行为序列编码的在线资源学习行为分析与预测方法

文档序号:36509850发布日期:2023-12-29 07:16阅读:31来源:国知局
基于行为序列编码的在线资源学习行为分析与预测方法

本发明涉及在线资源学习行为分析与预测领域,尤其是涉及一种基于行为序列编码的在线资源学习行为分析与预测方法。


背景技术:

1、通过分析学生在资源平台上的学习行为及演化规律,有助于了解学生学习的行为模式,为资源平台建设及资源更新提供指导建议。相比线下学习行为分析能够考虑音频、视频、生理等多模态数据,在线资源学习行为仅能通过点击流事件挖掘学生学习规律。

2、目前,在线资源学习行为分析与预测存在的困难主要包括:1)点击事件对应的行为难以有效定义;2)在线资源学习行为的模式难以有效划分;3)在线资源学习行为模式的演化难以有效预测。


技术实现思路

1、针对学生群体开展在线资源学习行为演化规律不明晰、行为模式难以预测的问题,本发明提出了一种基于行为序列编码的在线资源学习行为分析与预测方法,能够有效提高学生在线开展资源学习行为预测的准确率。

2、本发明的目的是通过如下技术措施来实现的。

3、一种基于行为序列编码的在线资源学习行为分析与预测方法,包括以下步骤:

4、步骤1,对学生在资源平台开展在线学习的各类行为进行编码,追踪学生在线上学习空间中的学习轨迹,并采用线性数据结构描述学生的学习行为序列;

5、步骤2,从资源平台访问的日志数据中提取了12个维度的指标刻画学生的学习行为,反映学生的学习积极性、学习专注度、学习兴趣和学习效能等,得到学生的时间特征序列后,利用秩相关系数rs度量指标维度之间的相关性,对时间特征序列进行降维;

6、步骤3,根据用户行为特征进行群体分类,确定拟合度更高的聚类数量,分析不同用户群体的倾向性;

7、步骤4,统计单位周期内的用户群体分类,建立arimax时间序列模型,预测学生群体分类演化趋势。

8、在上述技术方案中,所述步骤1包括以下子步骤,

9、步骤1.1,利对学生在资源平台上的操作行为进行分解,具体分解为where、what、how和status四部分,“where”即用户访问平台的哪个页面或是哪个模块,具体包括导航栏、搜索框、分类列表、课程列表或视频等;“what”即用户在平台页面元素上面进行什么操作,具体元素内容包括链接、按钮或进度条等;“how”即用户在平台上怎样进行操作,具体操作行为包括点击、拖拽等行为;“status”即用户观看视频的状态或页面访问状态,具体包括离开,开始、结束、暂停、快进等;

10、步骤1.2,基于上述编码规则,将每个学生的一次操作行为转化为一条行为轨迹数据,例如:学生a点击了导航栏,可用“navigation_link_click”表示。每个学生的一系列操作行为转化为一组行为序列数据。例如:学生a点击导航栏后进入课程列表页面,再通过课程列表访问了某一个课程,并点击开始按钮进行在线学习,可用“navigation_link_click,course_link_click,video_button_click_start”表示。若学生关闭页面窗口或是切换页面,则生成一条“page_leave”行为数据。

11、在上述技术方案中,所述步骤2包括以下子步骤,

12、步骤2.1,从资源平台访问的日志数据中提取12个维度指标刻画学生的学习行为,分别为:c01平台访问次数、c02离线次数、c03在线时长、c04页面最长停留时长、c05访问栏目个数、c06学习学科门数、c07课程学习数量、c08课程访问次数、c09视频观看次数、c10课后学习次数、c11行为序列长度、c12 ip地址变更次数,其中c01和c02用于反映学习积极性、c03和c04用于反映学习专注度、c05至c09共5个指标用于反映学习兴趣和学习偏好、c10用于反映学生自主学习能力、c11用于反映学生在平台活跃度、c12用于反映学生学习环境变更情况;

13、步骤2.2,按照定义的12维度指标,首先构建包含时间序列特征的学生行为特征序列={用户id,访问日期,[c01,…,c12]},再利用秩相关系数rs度量指标维度之间的统计相关性,根据指标之间相关系数的大小进行指标筛选。其中,秩相关系数rs计算公式为:

14、

15、通过比较两组变量中任意两个变量之间的秩值差异衡量它们之间的相关性,秩相关系数值越大,表示两组变量之间的关系越紧密。对任意两个变量相关性按照从小到大顺序编秩,ri代表xi的秩次,qi代表yi的秩次,ri-qi为xi、yi的秩次之差,xi=yi=[c01,…,c12]。秩相关系数取值区间为[1,-1],rs为正时表示正相关,rs为负时表示负相关,从中剔除相关系数值较大(>0.5)的特征维度,保留差异性较大的特征维度。

16、在上述技术方案中,所述步骤3包括以下子步骤,

17、步骤3.1,数据标准化,将每位学生筛选后维度的数据组成新的特征向量,对该特征向量进行归一化处理,得到长度为1的单位向量;

18、步骤3.2,利用k-means模型进行聚类分析,采用一个统计周期内(一个月/一季度/一学年)内所有学生数据进行聚类,聚类数量分别设置为3、4、5、6、7、8,按照聚类后最大类的半径从大到小进行排序,排序最后对应的k值为最终的聚类数量。

19、在上述技术方案中,所述步骤4包括以下子步骤,

20、步骤4.1,根据确定的k值,对两个统计周期内(一个月/一季度/一学年)内所有学生数据进行聚类,得到两组学生分类时间序列,利用adf模型对每一组时间序列的平稳性进行检验,其中一组学生分类时间序列作为训练集,另一组学生分类时间序列作为测试集;

21、步骤4.2,建立arimax(p,i,q)时间序列模型,利用训练集和测试集进行多轮迭代,对比测试集中分类的预测值与实际值的差异,遍历寻找合适的p、q值,得到学生群体分类演化模型。

22、与现有技术相比,本发明的有益效果如下:

23、1.本发明方法对在线资源学习行为进行统一编码,有助于构建长时序的在线资源学习行为编码序列;

24、2.本发明方法将在线资源学习行为编码转化为在线资源学习行为序列,通过秩相关性分析对在线资源学习行为进行特征降维,有效提高了在线资源学习行为模式的分类精度;

25、3.本发明方法将在线资源学习行为预测问题转化为多元时间序列预测问题,将前一周期的学习行为模式作为因变量预测下一周期的学习行为模式。



技术特征:

1.基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于:所述“对学生在资源平台开展在线学习的各类行为进行编码,追踪学生在线上学习空间中的学习轨迹,并采用线性数据结构描述学生的学习行为序列”包括以下子步骤,

3.根据权利要求1所述的基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于:所述“从资源平台访问的日志数据中提取12个维度指标刻画学生的学习行为,反映学生的学习积极性、学习专注度、学习兴趣和学习效能,得到学生的时间特征序列后,利用秩相关系数rs度量指标维度之间的相关性,对时间特征序列进行降维”包括以下子步骤,

4.根据权利要求1所述的基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于:所述“根据用户行为时间特征序列进行群体分类,确定拟合度更高的聚类数量,分析不同用户群体的倾向性”包括以下子步骤,

5.根据权利要求1所述的基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于:所述“统计单位周期内的用户群体分类,建立arimax时间序列模型,预测学生群体分类演化趋势”包括以下子步骤,


技术总结
本发明涉及在线资源学习行为分析与预测领域,提供一种基于行为序列编码的在线资源学习行为分析与预测方法。本发明方法对在线资源学习行为进行统一编码,有助于构建长时序的在线资源学习行为编码序列;本发明方法将在线资源学习行为编码转化为在线资源学习行为序列,通过秩相关性分析对在线资源学习行为进行特征降维,有效提高了在线资源学习行为模式的分类精度;本发明方法将在线资源学习行为预测问题转化为多元时间序列预测问题,将前一周期的学习行为模式作为因变量预测下一周期的学习行为模式。

技术研发人员:吴砥,陈旭,王凯利
受保护的技术使用者:华中师范大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1