一种基于注意力机制的学习风格识别方法及系统

文档序号:27779994发布日期:2021-12-04 10:12阅读:221来源:国知局
一种基于注意力机制的学习风格识别方法及系统

1.本发明属于在线学习行为分析领域,更具体地,涉及一种基于注意力机制的学习风格识别方法及系统。


背景技术:

2.基于在线学习行为分析的自动识别方法主要是通过数据挖掘算法分析学习者的在线学习行为或者通过简单规则计算学习者的学习行为,从而自动识别学习者的学习风格。
3.基于数据挖掘算法的自动识别主要是在收集学习者在平台上的网络行为数据的基础上,利用数据挖掘等相关方法对数据进行分析,来预测或识别学习者的学习风格。如nabila bousbia等基于学习者浏览路径和交互方式等学习路径和资源数据,来识别学习者学习风格;villaverde等使用神经网络方法预测网络学习者的学习风格;华中师范大学李素珍等通过文献研究等方法确定了网络学习行为与学习偏好之间的关系,并构建了网络学习风格与偏好的挖掘模型。由于影响网络学习特征的因素有很多,基于网络学习行为自动识别学习风格存在“冷启动”的问题。因而近几年学者开始将自动识别学习风格与问卷获取学习风格相结合的方法来预测学习者的学习风格。姜强、赵蔚等通过让学习者填写felder&soloman学习风格量表,来获取学习者的学习风格。然后基于文献研究法得到贝叶斯网络算法的条件概率表,然后计算学习者的学习风格。吴青等使用学习风格量表获取网络学习者学习风格数据用于初始化分类模型,然后利用分类模型评估网络学习行为并预测其学习风格也利用了混合测量法与预测网络学习者的学习风格。刘自慧等采集学习管理系统上学习者的网络学习行为数据后利用smo算法预测学习者的学习风格,然后与量表显性测量结果进行对比,为自适应学习提供了理论支撑。
4.基于估算规则的自动识别方法主要是利用问卷调查得到学习者的学习风格,而后通过采集与量化学习者的在线学习行为数据,利用估算规则计算学习者的学习风格,最后将估算结果与问卷调查调查结果进行对别,得到准确率。sabine grad在学习管理系统上跟踪学习者的在线学习并采集行为数据。然后根据文献研究法,提出行为数据标注规则并量化和标注行为数据。基于felder

silverman学习风格模型,利用估算规则方法与贝叶斯网络方法与计算学习者的学习风格,最后基于问卷结果分析两种方法的准确率,研究结果发现基于估算规则方法的学习风格自动识别的准确率更高。姜强等在sabine graf研究的基础上,基于felder

silverman学习风格模型通过问卷获取学习者的学习风格。然后跟踪学生一周的所有行为模式并采集数据,根据以往研究与其在线平台的特点构建行为数据标注规则并量化数据。最后利用估算规则去修正通过问卷得到的学习者的学习风格,使得修正后的学习风格模型更具真实性。
5.当前大部分的研究者主要通过量表主观测量结合客观分析学习者的在线学习行为相结合的方法进行学习风格自动识别,然而这些识别方法对于学习行为与学习风格之间的关系并未深入研究,同时现有的方法都是浅层的数据挖掘方法,无法处理大规模的行为
数据,这严重约束了现有算法的适用范围。同时这些算法并未考虑学习行为当时的情景和动机,这样导致识别的学习风格不够精准。


技术实现要素:

6.针对现有技术的缺陷,本发明的目的在于提供一种基于注意力机制的学习风格识别方法及系统,旨在解决现有学习风格识别不够精准的问题。
7.为实现上述目的,第一方面,本发明提供了一种基于注意力机制的学习风格识别方法,包括如下步骤:
8.确定学习者的学习特征;所述学习特征包括:学习者社会属性特征、学习资源特征、学习者行为链特征以及学习者专注度特征;
9.基于所述学习者的学习特征构建学习者的学习行为链空间;所述学习行为链空间用于描述学习者在每个时间点的学习行为,所述每个时间点学习行为包括:每个时间点学习何种学习资源和表现何种专注度;
10.将学习者在每个时间点的学习行为按照时间顺序串接得到学习者的学习行为序列;
11.将所述学习者的学习行为序列输入到训练好的引入注意力机制的gru网络,以识别学习者的学习风格;所述引入注意力机制的gru网络用于基于学习者行为序列识别学习者的学习风格。
12.在一个可选的示例中,所述学习者行为链特征通过如下方式确定:
13.基于学习者的多模态学习行为数据确定学习者的学习行为链特征;所述学习者的多模态学习行为数据包括:学习者学习行为的音频数据、学习者学习行为的视频数据以及学习者向计算机输入的点击动作,基于所述多模态学习行为数据可以剔除学习者的无效学习行为;所述学习行为链特征指学习者在什么时间点学习什么资源以及学习具体动作如何,从而精准描述学习者具体学习过程。
14.在一个可选的示例中,所述学习者社会属性特征包括:学习者年龄、性别以及学段;
15.所述学习资源特征包括:学习资源的领域、类型、资源编号以及资源边通道信息;
16.所述学习者专注度特征是由专注度识别方法获取的学习者在学习过程中体现出来的专注度序列。
17.在一个可选的示例中,所述基于所述学习者的学习特征构建学习者的学习行为链空间,具体为:
18.将学习者行为链位置信息嵌入到学习者行为特征对应的向量中,并结合学习资源特征和学习者专注度特征确定学习行为链空间,并将学习者社会属性特征作为静态量整体嵌入所述学习行为链空间内。
19.在一个可选的示例中,所述引入注意力机制的gru网络中引入注意力机制是为了自动关注到学习行为序列中对学习风格识别贡献更大的数据,以对所述数据分配更大的权重;
20.所述引入注意力机制的gru网络的训练过程如下:
21.将训练样本输入到引入注意力机制的gru网络;所述训练样本包括预先获取的多
个学习行为序列和每个学习行为序列对应的学习风格;
22.通过所述训练样本对引入注意力机制的gru网络进行训练,使得引入注意力机制的gru网络可以基于学习行为序列判断其对应的学习风格;所述学习风格包括:活跃型、沉思型、感悟型、直觉型、视觉型、言语型、序列型以及综合型。
23.第二方面,本发明提供了一种基于注意力机制的学习风格识别系统,包括:
24.学习特征确定单元,用于确定学习者的学习特征;所述学习特征包括:学习者社会属性特征、学习资源特征、学习者行为链特征以及学习者专注度特征;
25.行为链空间构建单元,用于基于所述学习者的学习特征构建学习者的学习行为链空间;所述学习行为链空间用于描述学习者在每个时间点的学习行为,所述每个时间点学习行为包括:每个时间点学习何种学习资源和表现何种专注度;
26.行为序列确定单元,用于将学习者在每个时间点的学习行为按照时间顺序串接得到学习者的学习行为序列;
27.学习风格识别单元,用于将所述学习者的学习行为序列输入到训练好的引入注意力机制的gru网络,以识别学习者的学习风格;所述引入注意力机制的gru网络用于基于学习者行为序列识别学习者的学习风格。
28.在一个可选的示例中,所述学习特征确定单元,基于学习者的多模态学习行为数据确定学习者的学习行为链特征;所述学习者的多模态学习行为数据包括:学习者学习行为的音频数据、学习者学习行为的视频数据以及学习者向计算机输入的点击动作,基于所述多模态学习行为数据可以剔除学习者的无效学习行为;所述学习行为链特征指学习者在什么时间点学习什么资源以及学习具体动作如何,从而精准描述学习者具体学习过程。
29.在一个可选的示例中,所述学习特征确定单元确定的学习者社会属性特征包括:学习者年龄、性别以及学段;确定的学习资源特征包括:学习资源的领域、类型、资源编号以及资源边通道信息;以及确定的学习者专注度特征是由专注度识别方法获取的学习者在学习过程中体现出来的专注度序列。
30.在一个可选的示例中,所述行为链空间构建单元,将学习者行为链位置信息嵌入到学习者行为特征对应的向量中,并结合学习资源特征和学习者专注度特征确定学习行为链空间,并将学习者社会属性特征作为静态量整体嵌入所述学习行为链空间内。
31.在一个可选的示例中,所述引入注意力机制的gru网络中引入注意力机制是为了自动关注到学习行为序列中对学习风格识别贡献更大的数据,以对所述数据分配更大的权重;
32.所述系统还包括:网络训练单元,用于将训练样本输入到引入注意力机制的gru网络;所述训练样本包括预先获取的多个学习行为序列和每个学习行为序列对应的学习风格;通过所述训练样本对引入注意力机制的gru网络进行训练,使得引入注意力机制的gru网络可以基于学习行为序列判断其对应的学习风格;所述学习风格包括:活跃型、沉思型、感悟型、直觉型、视觉型、言语型、序列型以及综合型。
33.总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
34.本发明提供一种基于注意力机制的学习风格识别方法及系统,创新性的将数据驱动的学习风格量化引入学习者模型中,形成了以多模态学习行为、学习者社会属性、学习资
源以及学习者专注度等边通道信息为主要元素的学习行为语义空间,利用丰富的状态信息有效提升了学习行为表征能力;同时利用注意力机制的gru增强关联序列的权重挖掘学习行为序列长距离依赖关系,可以有效解决当前学习行为瞬时转移到数月前的学习内容上的长依赖问题。最后,提出正负样本对的思路,这样可以实现正负样本同时训练,这样提升模型的拟合能力以及泛化能力,从而有效提升学习风格模型的识别能力,提高精准度。
附图说明
35.图1为本发明实施例提供的基于注意力机制的学习风格识别方法流程图;
36.图2为本发明实施例提供的学习者行为嵌入向量示意图;
37.图3为本发明实施例提供的学习者行为序列示意图;
38.图4为本发明实施例提供的基于注意力机制的深度学习风格识别框架示意图;
39.图5为本发明实施例提供的基于注意力机制的学习风格识别系统架构图。
具体实施方式
40.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
41.学习风格由学习者特有的认知、情感和生理行为构成,它是反映学习者如何感知信息、如何与学习环境相互作用并对之做出反映的相对稳定的学习方式,学习风格的识别对于学习者个性化学习具有重要的意义。针对传统学习者风格研究方法存在主观性强或特征提取不够深入等缺陷,本发明提出一种基于注意机制的深度学习风格识别方法。由于学习风格是学习者与领域概念资源的稳定交互方式,因此该方法除了将学习者行为链作为重要的特征,同时将学习者社会属性、学习资源以及学习者专注度等边通道信息一同嵌入构建了学习行为语义空间,提升了学习行为表征能力。
42.由于学习行为是依据学习风格的外显表现,存在当前学习行为瞬时转移到数月前的学习内容上的情况,因此存在长距离的依赖的问题,因此需要将学习风格以及当时的学习投入度等特征融合到学习行为中,同时引入时序挖掘算法实现对学习行为依赖关系的识别,从而实现学习风格的精准识别。
43.因此本发明构建基于注意机制的gru模型,将学习行为特征作为序列作为输入,实现对学习者学习行为序列中依赖关系的提取,同时利用注意力机制增强关联序列的权重,有效解决长距离依赖关系的提取,并将输出的学习风格隐态向量进行有效降维,最后利用四分类模型实现对学生信息处理加工(活跃型、沉思型)、信息感知(感悟型、直觉型)、信息输入(视觉型、言语型)、信息理解(序列型、综合型))四个维度上的风格的感知。
44.学习风格由学习者特有的认知、情感和生理行为构成,它是反映学习者如何感知信息、如何与学习环境相互作用并对之做出反映的相对稳定的学习方式,学习风格的识别对于学习者个性化学习具有重要的意义。
45.针对传统学习者风格研究方法存在主观性强或特征提取不够深入等缺陷,本发明提出一种基于注意机制的深度学习风格识别方法,首先根据felder和soloman(1996)的ils(index of learning styles)模型及专家的经验建立学习风格模型和学习风格指标,并将
这些指标与不同的学习风格联系起来。然后通过基于注意机制的gru(gate recurrent unit)模型实现对学习者学习行为依赖关系的学习,并基于行为序列模式挖掘学习者风格。该模型主要包括学习主客体的特征表示、基于gru的学习行为依赖特征提取层,最后是mlp(multilayer perceptron)感知与分类层。
46.图1为本发明实施例提供的基于注意力机制的学习风格识别方法流程图;如图1所示,包括如下步骤:
47.s101,确定学习者的学习特征;所述学习特征包括:学习者社会属性特征、学习资源特征、学习者行为链特征以及学习者专注度特征;
48.s102,基于所述学习者的学习特征构建学习者的学习行为链空间;所述学习行为链空间用于描述学习者在每个时间点的学习行为,所述每个时间点学习行为包括:每个时间点学习何种学习资源和表现何种专注度;
49.s103,将学习者在每个时间点的学习行为按照时间顺序串接得到学习者的学习行为序列;
50.s104,将所述学习者的学习行为序列输入到训练好的引入注意力机制的gru网络,以识别学习者的学习风格;所述引入注意力机制的gru网络用于基于学习者行为序列识别学习者的学习风格。
51.在一个可选的示例中,所述学习者行为链特征通过如下方式确定:
52.基于学习者的多模态学习行为数据确定学习者的学习行为链特征;所述学习者的多模态学习行为数据包括:学习者学习行为的音频数据、学习者学习行为的视频数据以及学习者向计算机输入的点击动作,基于所述多模态学习行为数据可以剔除学习者的无效学习行为;所述学习行为链特征指学习者在什么时间点学习什么资源以及学习具体动作如何,从而精准描述学习者具体学习过程。
53.在一个可选的示例中,所述学习者社会属性特征包括:学习者年龄、性别以及学段;
54.所述学习资源特征包括:学习资源的领域、类型、资源编号以及资源边通道信息;
55.所述学习者专注度特征是由专注度识别方法获取的学习者在学习过程中体现出来的专注度序列。
56.在一个可选的示例中,所述基于所述学习者的学习特征构建学习者的学习行为链空间,具体为:
57.将学习者行为链位置信息嵌入到学习者行为特征对应的向量中,并结合学习资源特征和学习者专注度特征确定学习行为链空间,并将学习者社会属性特征作为静态量整体嵌入所述学习行为链空间内。
58.在一个可选的示例中,所述引入注意力机制的gru网络中引入注意力机制是为了自动关注到学习行为序列中对学习风格识别贡献更大的数据,以对所述数据分配更大的权重;
59.所述引入注意力机制的gru网络的训练过程如下:
60.将训练样本输入到引入注意力机制的gru网络;所述训练样本包括预先获取的多个学习行为序列和每个学习行为序列对应的学习风格;
61.通过所述训练样本对引入注意力机制的gru网络进行训练,使得引入注意力机制
的gru网络可以基于学习行为序列判断其对应的学习风格;所述学习风格包括:活跃型、沉思型、感悟型、直觉型、视觉型、言语型、序列型以及综合型。
62.在一个具体的实施例中,本发明方法的实现包括如下几个步骤:
63.1)学习者学习行为语义空间构建
64.学习者往往根据自己的兴趣和目标,以特有的学习路径来观看领域概念文本、音频、视频等相关资源,并完成课程的练习或试题。这些学习动作依照领域概念的展开次序,形成了每个学习者的独特轨迹序列。学习行为和课程内容(包括:领域概念的文本、图像、音频以及视频等)具有密切的相关性。同时,学习者的学习行为重要程度应该还与学习者学习过程中的专注度有着密切的关系。
65.因此,本发明学习者风格识别模型特征,主要包含学习者社会特征s,学习资源特征r、学习者行为链b,以及学习者专注度特征en。其中学习者社会属性特征包含学习者年龄age、性别gender、学段field等特征;学习资源特征r主要是学习资源的领域概念concept、资源的类型type、资源编号id、资源边通道信息(如作者author)等相关信息;学习者行为链特征b主要是学习者学习过程观看资源顺序,最后利用资源的特征之间的顺序形成行为链特征(如首先看了d视频,然后看了a文本、接着看了b图片等),如图1所示;学习者专注度特征en是由专注度识别方法获取的学习者在学习过程中体现出来的专注度序列。这四维特征可以表征为x
p
、x
r
、x
b
、x
en

66.具体地,基于学习者的多模态学习行为数据确定学习者的学习行为链特征;学习者的多模态学习行为数据包括:学习者学习行为的音频数据、学习者学习行为的视频数据以及学习者向计算机输入的点击动作,基于所述多模态学习行为数据可以剔除学习者的无效学习行为;所述学习行为链特征指学习者在什么时间学习什么资源以及学习具体动作如何,从而精准描述学习者具体学习过程。
67.特征向量转换及映射关系如下:
68.其中np为学习者规模,|s|表示单个学习者属性维度,向量经过one

hot编码及embeding转换为其中ne
p
为嵌入后的向量维度;
69.其中nr为学习资源的总规模,|r|为单个资源的特征维度,经过one

hot和embeding转换为ne
r
为嵌入后资源向量的维度;
70.其中b
t
是one

hot编码,表示的是用户的第t次行为,t表示用户历史行为总数,nr表示学习资源总量;当b
t
[jt]=1,表示对应的嵌入向量是资源向量r
jt
的嵌入向量经过特征嵌入后可表征为
[0071]
其中|en|为学习者专注度向量维度,经过one

hot编码及embeding转换为其中ne
en
为嵌入后专注度向量维度;
[0072]
为了考虑行为之间的长依赖问题,将行为的位置作为特征嵌入到行为向量中,即
将e
b
、e
en
、e
pos
进行联合嵌入构建学习行为点e'
b
=e
b
+e
en
+e
pos
,其中e
pos
为行为链位置,再将行为点依据时序关系进行关联,从而构建行为链,形成行为嵌入向量如图2所示,通过将每个时序的行为进行嵌入实现行为的向量化表达,得到学习行为链空间,提供一种新型的学习行为表征方法。
[0073]
具体地,将学习者行为链位置信息嵌入到学习者行为特征对应的向量中,并结合学习资源特征和学习者专注度特征确定学习行为链空间,并将学习者社会属性特征作为静态量整体嵌入所述学习行为链空间内。
[0074]
进一步地,基于学习行为链空间,将学习者在每个时间点的学习行为按照时间顺序串接得到学习者的学习行为序列,如图3所示。
[0075]
2)基于注意力机制的深度学习风格识别
[0076]
学习者行为往往与学习者的潜在兴趣以及学习者的学习风格有着密切的关系,因此,通过学习行为序列进行分析可以提取学习者内隐的学习风格状态,基于课程视频观看日志、习题回答的质量和频度、领域概念的完成质量等参数,运用统计推理的方法,得出能表征学生内在学习方式和效果的隐含变量,包括:学生对领域概念及课程信息学生信息处理加工(活跃型、沉思型)、信息感知(感悟型、直觉型)、信息输入(视觉型、言语型)、信息理解(序列型、综合型)等方面的信息处理方式。围绕每个领域概念的学习行为动作,都包含着丰富的可观察变量。同时由于学习的行为之间可能存在长关系依赖的问题,如学习者当前的学习行为,可能与两个月前未学完的资源有关,因此本发明引入注意力机制实现长距离依赖关系特征的提取。图4为本发明实施例提供的基于注意力机制的深度学习风格识别框架示意图;如图4所示,将用户的学习行为链以及用户的社会属性特征进行联合嵌入,并输入到gru网络中实现对学习行为序列之间关联关系的精准挖掘,同时针对gru中是利用后续的行为来训练前序的行为的输出无法提升模型的泛化能力的情况,利用后续的正样本训练模型,同时还采用用户没有点击的资源作为负样本,一同训练模型,提出正负样本对的思路,提升模型的拟合能力以及泛化能力。最后通过获取的行为特征进行4分类实现对学习风格的精准识别。
[0077]
通过gru网络抓取可观察学习行为序列的行为点以及行为之间的依赖特征,利用学习序列训练模型,实现模型对学习者行为的预判能力。具体过程如下:
[0078]
u
t
=σ(w
u
i
t
+u
u
h
t
‑1+b
u
),
[0079]
r
t
=σ(w
r
i
t
+u
r
h
t
‑1+b
r
),
[0080][0081][0082]
其中,σ是sigmoid激活函数,运算符代表元素的乘积,u
z
,u
u
,u
r
∈n
h
×
n
h
,n
h
是隐藏层大小,而n
i
则是输入层大小。i
t
是gru的输入,i
t
=e
b
[t]代表第t层学习者行为,h
t
是第t层的隐藏层状态。
[0083]
当前节点的输入依赖于之前的e'
b
以及之前隐态输出的线性组合,权重通过注意力机制学习获取。
[0084]
由于学习行为序列是连续的,在gru中是利用后续的行为来训练前序的行为的输出无法提升模型的泛化能力,因此为了更好的训练模型,除了利用后续的正样本训练模型,
同时还采用用户没有点击的资源作为负样本,一同训练模型。提出正负样本对的思路,{e'
b
,e'
b
},其中e'
b
为用户点击的资源,e'
b
为用户未点击的资源集合中随机抽样,这样可以实现正负样本同时训练,这样提升模型的拟合能力以及泛化能力。
[0085]
图5为本发明实施例提供的基于注意力机制的学习风格识别系统架构图,如图5所示,包括:
[0086]
学习特征确定单元510,用于确定学习者的学习特征;所述学习特征包括:学习者社会属性特征、学习资源特征、学习者行为链特征以及学习者专注度特征;
[0087]
行为链空间构建单元520,用于基于所述学习者的学习特征构建学习者的学习行为链空间;所述学习行为链空间用于描述学习者在每个时间点的学习行为,所述每个时间点学习行为包括:每个时间点学习何种学习资源和表现何种专注度;
[0088]
行为序列确定单元530,用于将学习者在每个时间点的学习行为按照时间顺序串接得到学习者的学习行为序列;
[0089]
学习风格识别单元540,用于将所述学习者的学习行为序列输入到训练好的引入注意力机制的gru网络,以识别学习者的学习风格;所述引入注意力机制的gru网络用于基于学习者行为序列识别学习者的学习风格。
[0090]
网络训练单元550,用于将训练样本输入到引入注意力机制的gru网络;所述训练样本包括预先获取的多个学习行为序列和每个学习行为序列对应的学习风格;通过所述训练样本对引入注意力机制的gru网络进行训练,使得引入注意力机制的gru网络可以基于学习行为序列判断其对应的学习风格;所述学习风格包括:活跃型、沉思型、感悟型、直觉型、视觉型、言语型、序列型以及综合型。
[0091]
具体地,图5中各个单元的实现可参见前述方法实施例中的介绍,在此不做赘述。
[0092]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1