一种融合多目标的教育资源个性化推荐系统及方法与流程

文档序号：19929972发布日期：2020-02-14 21:54阅读：280来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及教育系统技术领域，具体为一种融合多目标的教育资源个性化推荐系统及方法。

背景技术：

现代科技发展促成全球信息总量呈指数级增长，信息技术在促进教育公平的同时也为教育公平带来了巨大挑战。面对海量教育资源，学生快速获取优质个性化教育资源面临多方面难题。

一、教育资源的海量、静态和杂乱无章严重加大了学生搜集资源的时间和精力成本。

二、互联网技术的快速发展对学生的信息素养提出了更高的要求，导致信息素养高的学生可以在海量资源中搜集到优质资源，而对信息素养低的用户，则较为困难，加剧了教育的不公平。

三、非主流的优质教育资源往往因主流教育资源的频繁使用而被覆盖，造成严重的资源浪费，且不能满足用户的个性化学习需求。

国内在教育资源推荐系统方面的研究还不是很成熟，尚处在初步阶段。近年来，我国已制定了教育资源的规范体系，也出现了许多优秀的数字教育资源平台、远程教育网站、教学辅助系统。例如：国家教育资源公共服务平台、新东方在线、网易云课堂等。然而，大部分的教育教学系统或平台对个性化推荐技术的应用程度不高，推荐的效果差；有的甚至没有资源推荐子系统，而是对资源进行简单的统计，进行一种所谓的热门资源推荐。这种方式没有考虑用户个体的特殊性，从而给用户带来了较差的用户体验。

现有的推荐技术大多致力于利用深度网络架构对用户和项目的特征进行更全面更精细的表示，对用户和项目的交互进行更合理的建模，从而提高推荐结果的准确度。然而，针对越来越复杂的应用需求，让各在线服务平台对推荐系统性能提出了更高的要求。仅仅精准性对一个可用的推荐系统来说是远远不够的，推荐结果其他方面的因素，如多样性、新颖性、覆盖率等都在对推荐的质量、用户的体验产生直接影响。尤其，多样性是推荐系统实现个性化应用的必备因素。推荐结果的多样性是推荐系统中的一个离线指标，暂时缺失深度学习直接对用户的多样性倾向度进行表示和学习的研究。

技术实现要素：

(一)解决的技术问题

针对现有技术的不足，本发明将集成多任务目标学习的思想应用在教育资源的推荐系统中，实现教育资源的个性化推荐，将推荐的准确性和多样性作为网络的两个待学习的目标任务，采用两个不同的网络结构，分别专注推荐结果的准确性和多样性。设计一个统一的损失函数针对这两个训练目标进行同步优化，实现一个网络架构模型对两个推荐目标进行端到端的训练。本发明解决教育资源个性化推荐领域存在的关键技术问题：

(1)构建基于cnn的网络模型框架，针对学生教师用户和教育资源特征的外积交互特征进行表示学习，从推荐模型层面确保推荐结果的准确性；

(2)构建基于item-som的跨类型的教育资源分类模型，为用户提供跨类型教育资源的个性化推荐奠定基础；

(3)设计集成网络模型框架som-cnn，融合推荐结果的准确性和多样性多个目标，进行同步学习训练，实现对推荐的多样性进行端到端的建模，确保推荐结果满足个性化需求。

(二)技术方案

为实现上述目的，本发明提供如下技术方案：一种融合多目标的教育资源个性化推荐系统，包括推荐系统，所述推荐系统包括服务层、推荐层、策略层和数据层；

所述数据层包括用户显示和反馈的数据、用户兴趣模型和资源内容以及总体的资源内容；

所述策略层包括学习者用户的表示特征以及教育资源的表示特征；

所述推荐层包括som-cnn和item-som模型和根据所述som-cnn和item-som生成的推荐列表；

所述服务层包括面向不同用户的教育资源推荐服务。

优选的，所述数据层的数据主要包括：用户的显式反馈(评分、喜欢\不喜欢)或隐式反馈数据(浏览、点击等行为数据)、用户基础档案信息(性别、年龄、喜好等)和资源内容(文本、图像、视频等描述)数据、用户生成内容(社会化关系、标注、评论等辅助数据)。

优选的，所述策略层，使用深度学习的嵌入层(embeddinglayer)和全连接层，将用户和资源项目稀疏的one-hot编码特征转换为高阶密集的隐式特征。

优选的，所述推荐层，通过利用学习到的用户和资源隐表示，通过cnn对用户和资源隐表示特征的外积交互结果进行高阶特征提取，产生项目的推荐结果列表。

优选的，所述item-som模块资源项目聚类模型构建包括以下步骤，

step1：初始化item-som输出层的连接权重wij；

step2:构造item-som的输入样本特征，整个item-som网络结构的输入是教育资源项目的特征数据(项目属性，流行度，用户交互反馈)，这些特征数据经过item-som前几层的多层感知非线性映射到一组低维的特征向量x＝{xi:i＝1,…,d}；

step3：根据计算获胜输出节点；

step4：根据计算获胜输出节点的拓扑领域，σ(t)＝σ0exp(-t/τ)；

step5：更新item-som的权重：

δwj,i＝η(t)·tj,i(x)(t)·(xi-wij)(7)

式中，η(t)是一个依赖于迭代次数的学习率η(t)＝η0exp(-t/τ)，τ表示网络训练总的迭代次数，随着时间的推移σ(t)、η(t)都会减小，该更新适用于在重复迭代中的所有训练特征模式x，每个学习权重更新的效果是将获胜的神经元及其邻居的权向量wi向输入向量x移动；

step6:不断重复迭代step3-step5；

优选的，所述som-cnn推荐结果计算模型构建包括以下实施步骤，

step1：样本集的准备，模型训练的正样本是与用户有交互过的教育资源项目集合ru，模型训练的负样本集合是是从与用户u没有过行为交互过的教育资源中采样出一些项目作为负样本，采样时，保证每个用户的正负样本的平衡，由于本发明考虑多样性的因素，因此负样本采样时，同时考虑了不热门教育资源项目的数量。

step2：ru中m个正项目样本输入到item-som得到mu个类别，将mu作为用户u的推荐多样性倾向度的真实参考值；

step3：模型训练过程中，输入每一个用户u，及对应用户u交互的项目集ru，及未交互的项目集经过模型得到对应的预测得分其中i∈ru，m和n分别对应训练样本中ru和的项目数量；

step4:将和代入公式(3)计算准确性的损失值；

step5:根据和计算模型对用户u的一个top-k推荐列表ru(k)，ru(k)输入到item-som得到ku个类别，ku作为模型对用户u推荐多样性倾向度的预测值；为了使ku和mu具有可比性，本发明在训练模型的时候令该阶段的top-k推荐列表ru(k)项目集数量k＝m；

step6:mu和ku代入公式(4)计算多样性损失；

step7：根据公式(5)计算整个网络的损失值，循环迭代step3-step7进行反向传播，训练优化整个som-cnn模型。

(三)有益效果

与现有技术相比，本发明提供了一种融合多目标的教育资源个性化推荐系统及方法，具备以下有益效果：

(1)本发明通过som对待推荐的教育资源项目实施聚类模型训练，实现对用户推荐多样性倾向度进行建模。

(2)本发明在推荐策略层面，将推荐的多样性作为回归问题，利用集成网络实现对推荐结果的准确性和多样性同步优化。

(3)本发明通过添加全局池化层，支持用户和项目隐因子的任意维度，且减小网络规模，降低网络参数。

(4)本发明能实现向目标用户精准推荐符合其多样性偏好倾向度的教育资源列表。

(5)本发明能满足教育资源个性化推荐应用需求。

附图说明

图1为本发明提出的一种融合多目标的教育资源个性化推荐系统及方法的融合多目标的教育资源个性化推荐系统总体框架；

图2为本发明提出的一种融合多目标的教育资源个性化推荐系统及方法的融合准确性和多样性的推荐模型架构；

图3为本发明提出的一种融合多目标的教育资源个性化推荐系统及方法的基于som的推荐项目的聚类模型。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-3，本发明提出的教育资源个性化推荐系统将各类用户信息和资源内容属性等数据作为输入，利用深度学习网络模型学习到用户和教育资源项的隐表示，并基于这种隐表示为用户产生教育资源推荐，总体的系统框架如图1所示，包含数据层、策略层、推荐层和服务层，数据层的数据主要包括：用户的显式反馈(评分、喜欢\不喜欢)或隐式反馈数据(浏览、点击等行为数据)、用户基础档案信息(性别、年龄、喜好等)和资源内容(文本、图像、视频等描述)数据、用户生成内容(社会化关系、标注、评论等辅助数据)，在策略层，使用深度学习的嵌入层(embeddinglayer)和全连接层，将用户和资源项目稀疏的one-hot编码特征转换为高阶密集的隐式特征，在推荐层，通过利用学习到的用户和资源隐表示，通过cnn对用户和资源隐表示特征的外积交互结果进行高阶特征提取，产生项目的推荐结果列表，由于深度学习cnn模型兼容文本、图像、视频、音频多类型资源内容特征的提取，因此基于深度学习的教育信息资源推荐系统可提供多类型的个性化推荐服务，如面向学生学习的资源个性化推荐、面向教师个性化教学的资源推荐等服务，促进个性化教育的实现。

本发明设计基于cnn的深度网络模型架构的同时，设计基于som的自组织映射网络，通过一个预训练好的item-som模型对cnn产生的top-k项目推荐列表进行分类，从而获得一个多样性的预测值，通过多样性的预测值和参考值计算损失反向调整cnn推荐结果的计算模块，最终实现推荐结果的准确性和多样性的同步优化，在som-cnn模型中，将用户对教育资源项目的评分等反馈信息基础上，融合资源项目属性和标签等辅助信息作为输入数据，针对一个给定的用户u，定义ru为用户有评分交互反馈的正样本教育资源列表，为用户未有反馈的负样本教育资源列表，如图2所示，假定用户u和教育资源项目i的特征向量分别为和可以通过如下公式分别获取用户和教育资源项目的嵌入向量pu和qi，

其中p∈r^m×k和q∈r^n×k分别为用户和教育资源项目特征的嵌入矩阵，k、m、n分别表示嵌入层维度大小，用户特征数目和教育资源项目特征数目，从ru中的教育资源项目提取项目属性和标签等离散one-hot编码特征，作为item-som模块的输入，得到用户u的资源项目子集的类别数mu，假设所有教育资源项目样本集中的项目经过item-som模块聚类，得到总类别数为k，则定义fd(u)＝mu/k为用户u的多样性指标参考值，

在嵌入层之上，采用基于外积操作得到隐式特征交互矩阵，

隐藏层是一个cnn结构，目的是从特征交互矩阵中提取有用的信息，隐藏层的输出g＝fθ(e)，其中fθ是一个从矩阵到向量的映射，θ是整个cnn结构中的参数，为了减少cnn的参数学习，在cnn的最后一层，采用全局平均池化层(globalaveragepooling)，使得网络更灵活地支持任意维度的用户和项目隐因子特征，同时降低模型的复杂度，网络的最终根据计算预测得分，纵观模型架构，整个模型需要学习的参数有p,q,θ,w，

针对推荐的准确性，设计如下的成对损失，

表示用户u观测到的正例，bpr损失实质是将序列的分类或序列回归问题转化为序列排序问题，公式(3)通过实现模型学习到用户对教育资源项目i和教育资源项目j的最大得分差，从而学习到准确推荐的模型参数，除了考虑准确性，本发明设计如下损失函数，实现多样性目标参数的学习，

式中，mu是用户u交互过的项目ru经过item-som网络得到的总类别数,可视作用户多样性的真实参考值，ku为模型计算出对用户u的一个top-k推荐列表ru(k)，输入到item-som得到的类别数，ku作为模型对用户u推荐多样性的预测值，采用根号计算使得多样性倾向度小的变化的损失比多样性倾向度大的变化的损失大，本发明设计的网络模型是端到端训练，对于推荐结果的准确性和多样性等信息的预测是通过一个全局损失函数来训练优化，整个网络的总的损失如公式(5)所示，

其中k表示所有训练样本中教育资源项目经过som网络分类得到的总类别数，mu/k可表示用户u的多样性倾向度，对于多样性倾向度越大的用户，模型损失函数多样性的权重也同步占比大一点，鉴于每个用户的多样性参考指标不同，因此对于每个用户来说不同的部分采用了不同的权重值，对于多样性需求比较高的用户，多样性损失的权重大一些，

在item-som模块，对教育资源标签属性离散化处理，将这些离散特征进一步转换成为one-hot的形式，如果直接将one-hot类型的特征输入到som中，会导致网络参数太多，增加了网络训练的复杂度，同时降低了网络的准确度，如图3所示，本发明首先使用多层mlp对推荐项目特征进行高阶非线性组合，再输入到som中开始训练，使相似的教育资源推荐项目映射到相同的神经元中，得到推荐项目的聚类模型，在此聚类模型基础上进行教育资源项目分类时，仅需要输入教育资源项目的特征数据到som中，就可以获取其在输出节点上的位置，与训练的教育资源项目样本数据所对应的输出节点位置进行比较，就可得到教育资源项目的分类类别结果。

整个item-som网络结构的输入是教育资源项目的特征数据(资源标签属性，流行度，用户交互反馈)，该特征数据经过多层mlp特征非线性映射输出一个高阶特征向量，除此之外，网络中包含了两个全连接层(fullyconnectedlayer，简称fc层)，图中第一个fc层得到的d维向量作为item-som神经网络的输入；第二个fc层输出一个k维向量(k表示待推荐项目的总类别)，以该向量输出作为教育资源项目类别的预测值，将som网络得到的胜出类别转化为one-hot后作为该输出向量的真值yi，根据式(6)计算损失函数，反向优化调整两个fc层的参数，

其中yi为som输出经过one-hot后的第i个值，为经过第二个fc层归一化输出的向量中的对应分量，由损失函数可以看出，当分类越准确时，所对应的分量就会越接近于1，从而loss的值也就会越小。

实施例一，本发明从系统使用者的角度来介绍推荐系统的实施方式，系统的主要实施方式如下：

(1)用户登录通过身份认证进入系统，对不同的用户角色设置不同的功能权限，若用户为教师和学生，则视为普通用户，普通用户作为教育资源被推荐的对象，只有使用权，系统管理员则拥有对系统所有信息的管理权；

(2)教师和学生在进行教育资源访问的同时，系统会对其行为信息进行收集，如记录所点击资源的标签属性，及观看资源的时长及评分等数据；系统管理员对资源和用户相关的基础信息进行管理甚至分析，从而实现过程(3)中的模型建立；

(3)对用户日志分析，提取用户行为数据，计算用户偏好，构建用户兴趣模型特征向量，与此同时，系统还会对那些具有用户反馈行为(购买、浏览、收藏等)的资源进行分析，构建相应的资源模型特征向量；

(4)利用过程(3)生成的用户交互反馈过的资源模型特征，输入到item-som模块，对交互过的教育资源项目进行聚类分析，计算学生和教师的资源多样性参考值；

(5)将过程(4)中计算得到的用户资源多样性参考值，作为用户教育资源推荐多样性的预测真值，用于优化推荐模型的多样性指标，将用户交互过的资源及采样一定数量的未交互过的资源特征，及用户特征数据输入到som-cnn，构建用户与教育资源的交互模型，该交互模型可以计算用户对未交互的资源项目的评分，从而通过评分结果计算推荐结果列表；

(6)系统管理员可以在该过程中设置固定的模型更新周期，或者根据资源数据增长情况对用户和教育资源的交互模型进行动态更新，提高推荐结果的实时准确性；

(7)在推荐结果实时计算过程中，如用户在线搜索输入：姓名，用户类型(学生或老师)要找的教育资源标签关键字(资源学科、资源难易级别等)，此时教育资源信息库会筛选出一组粗的教育资源列表；

(8)将该用户对应的信息特征数据，及(7)中得到的一组教育资源对应的资源特征数据，送入到som-cnn模块中，计算用户对该组所有教育资源的评分，根据得分高低得到一组细粒度的推荐列表。

综上所述，该融合多目标的教育资源个性化推荐系统及方法，具有以下优点：

(1)本发明通过som对待推荐的教育资源项目实施聚类模型训练，实现对用户推荐多样性倾向度进行建模。

(2)本发明在推荐策略层面，将推荐的多样性作为回归问题，利用集成网络实现对推荐结果的准确性和多样性同步优化。

(3)本发明通过添加全局池化层，支持用户和项目隐因子的任意维度，且减小网络规模，降低网络参数。

(4)本发明能实现向目标用户精准推荐符合其多样性偏好倾向度的教育资源列表。

(5)本发明能满足教育资源个性化推荐应用需求。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序，而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素，在没有更多限制的情况下，由语句“包括一个”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素，

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁琳琳;陈春艳
技术所有人：贵州广播电视大学(贵州职业技术学院);贵州云科教服务有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。