1.本发明属于教学推荐技术领域,尤其涉及一种基于教学大数据的智能推荐方法。
背景技术:2.目前,网络技术的飞速发展,当今社会已经走进智能信息时代,网络平台资源信息的开放使各个行业领域都能够共享信息,因此,人们对网络课程资源的需求也更加迫切。在线教学资源的增多,引发教学资源“信息过载”,通常推荐算法有协同过滤推荐算法、混合推荐算法和基于内容的推荐算法等,传统协同过滤的算法存在计算特征单一,计算量大的问题。为了使用户推荐负荷个性化需求的资源,而个性化资源推荐的出现则正好解决了用户与教学资源信息过载的问题,但个性化资源推荐构建用户与资源之间联系,但使用户接受信息数据内容会出现严重失衡,从而降低了用户与教学资源信息的匹配度和用户体验度。
技术实现要素:3.有鉴于此,本发明提供了一种提高对用户教学资源推荐精准度、推荐质量和更好满足用户个性化推荐服务的基于教学大数据的智能推荐方法,来解决上述存在的技术问题,具体采用以下技术方案来实现。
4.本发明提供了一种基于教学大数据的智能推荐方法,包括以下步骤:获取用户搜索的历史记录数据并传输到候选队列,将用户搜索的历史目标信息设定成过滤的候选资源;根据候选资源得出的数据信息进行筛选和预测,将原始网络数据进行转换传输至构建网络模型所需的模型输入数据得到用户偏好行为数据,其中,用户偏好行为数据包括对学习资源的浏览次数、评论次数和下载次数,预设浏览次数为,其中表示用户m对资源n的浏览次数,预设评论次数为,其中表示用户m对资源n的评论次数,预设下载次数为,其中表示用户m对资源n的下载次数;计算用户偏好行为数据对应的项目评分,根据项目评分计算用户间相似度或项目间相似度,基于用户间相似度或项目间相似度获取用户感兴趣的项目;根据用户感兴趣的项目对应的课程类别建立学习者模型并对用户进行智能推荐。
5.作为上述技术方案的进一步改进,根据用户感兴趣的项目对应的课程类别建立学习者模型并对用户进行智能推荐,包括:使用神经网络自动抽取用户兴趣的过程缓解冷启动,通过用户兴趣得到用户喜欢的课程类别,计算用户间学习能力相似度得到相似用户并进行推荐;通过用户历史信息确定用户类别,引入学习者行为特征和学习能力相似度类内计
算得到模型相似度分数并计算类内用户评分相似度,融合计算模型相似度分数和评分相似度分数得到最终用户集合进行推荐。
6.作为上述技术方案的进一步改进,使用神经网络自动抽取用户兴趣的过程缓解冷启动,包括:采用lstm文本分类法对新用户进行分类,句子分词和向量化,输入词向量,经过lstm层处理输出n个时刻的向量,,...,输入上层输出的向量进行最大池化操作得到特征向量h,将上层的特征向量h经过softmax层处理完成信息分类,其中,lstm模型包括完成分词和向量化操作的第一层即embedding层、提高特征之间的独立性的第二层即spatial_dropout1d层、第三层即lstm层、使用maxpooling以获取到最显著特征的第四层和使用softmax进行分类的第五层。
7.作为上述技术方案的进一步改进,计算用户间学习能力相似度得到相似用户并进行推荐,包括:预设c为用户偏好同时映射为资源类别即,根据课程类别映射出用户的兴趣类别,表示学习者的学习能力水平,其中分别对应初级、中级别和高级,新用户类内相似度计算使用标准高斯分布,其表达式为,其中u表示全体用户,表示第j个类别为c的用户,表示目标用户,、分别表示两个用户的学习水平,的值越大两个用户的相似度越大,反之相似度越小。
8.作为上述技术方案的进一步改进,对用户的历史学习信息进行统计得到用户的兴趣标签,其表达式为,其中表示用户历史信息学习第i类课程的次数,表示用户的学习的总次数,根据提取到的用户兴趣标签在用户兴趣类别中进行计算的过程,包括:根据老用户的学习特征计算学习特征相似度,使用两个用户对同一个课程的行为特征做计算,用户对课程的行为使用向量表示,其表达式为,其中u表示全体用户,表示目标用户,表示同一类别下其他用户,,,表示用户对课程k的行为特征,表示用户对课程k的行为特征,k表示两个用户共同学过的课程,分
别表示学习者学习课程的时间、获得的经验、得到的分数、学习的进度和作业提交次数;两个用户共同课程的相似度计算的表达式为,其中k表示两个用户之间共同学习的课程,,n表示两个用户共同学习过的课程的总数;结合上述学习水平相似度表达式和两个用户共同课程的相似度表达式得到学习者模型相似度,其表达式为。
9.作为上述技术方案的进一步改进,根据用户兴趣标签的表达式计算出目标用户历史信息中目标用户感兴趣的类别,找到与目标用户兴趣相同其他用户得到用户评分,包括:根据表达式为计算用户间评分相似度,其中用户集合为,课程资源集合,表示用户和的相似度,i表示共同评分的课程,和分别表示、在共同评分项目中的均值,、分别表示用户和的课程评分,将学习者模型相似度和评分相似度进行相加得到表达式为,并将计算结果由高到低进行排序,取其前n个作为邻居集合;通过上述评分计算得出直接邻居,预测最终邻居用户中目标用户没有产生评分的课程的分数,选取预测分数最高的前n个课程进行推荐,其计算表达式为,其中表示用户对未评分项目i的预测评分,表示用户的平均评分,表示用户的平均评分,表示对项目i的评分,表示用户的邻居集合。
10.作为上述技术方案进一步改进,计算用户偏好行为数据资源评分,使流量次数、评论次数、下载次数具有可用性,使用归一化方法进行数据标准化处理,其表达式为, 其中表示评分,x表示次数,表示次数最小值,表示次数最大值,统一映射到;
根据归一化表达式进一步得到表达式为,其中表示用户对资源的浏览次数评分,表示用户对资源的评论次数评分,表示用户对资源的下载次数评分,得到用户对资源的初步用户偏好行为数据评分,,根据评论次数、评论次数和下载次数对评分的贡献度不同赋予不同权重,结合用户偏好行为数据权重得到最终用户偏好行为数据评分,其表达式为,其中,、和分别为浏览次数权重、评论次数权重和下载次数权重,表示用户对资源的最终用户偏好行为数据评分。
11.作为上述技术方案进一步改进,根据候选资源得出的数据信息进行筛选和预测,包括:将网络结构得到的数据信息进行筛选和预测,把原始网络数据进行转换传输得到构建网络模型所需要的模型输入数据,通过表达式为,其中表示用户项目矩阵;若时,得出用户对项目感兴趣,通过计算得出的信息比被用户忽略的资源信息分数更高,根据受关注度高和不受关注的差距得到用户和项目的关系矩阵;用户在关注资源信息时也关注用户在搜索页面时的历史记录,当用户关注网络页面时,记录下来网络用户的id信息,若用户id信息为,通过用户浏览记录确定用户搜索行为特点来表示,根据用户和项目的关系矩阵得到一个用户的信息交互记录并记为,与用户搜索行为特点关联得到行为高度,其表达式为,其中表示平台用户数,表示历史记录数量,通过分列和集合操作得到行为高度与用户本身的基本信息重合得到队列长度。
12.作为上述技术方案进一步改进,将用户搜索的历史记录作为用户的特征点采用softmax进行分类,若未知用户为u,构建函数,其中p表示第i类的概率,v表示特征定量,w表示维度系数,x表示边缘节点分布,根据函数对项目队列进行分类得到候选队列。
13.作为上述技术方案进一步改进,获取用户搜索的历史记录数据并传输到候选队列,包括:假设n为文件数量,不同文件中含有关键信息,若文件中关键信息的数量表示,关键信息在文件中出现的次数为,其中表示关键信息出现最多的次数,采用穷举算法得到关键信息,选择最大词出现频数;采用表示关键信息的参数,其表达式为,其中n表示数量,表示关键词重点,以获取用户最感兴趣的资源信息。
14.本发明提供了一种基于教学大数据的智能推荐方法,通过获取用户搜索的历史记录数据并传输到候选队列,将用户搜索的历史目标信息设定成过滤的候选资源,根据候选资源得出的数据信息进行筛选和预测,将原始网络数据进行转换传输至构建网络模型所需的模型输入数据得到用户偏好行为数据,计算用户偏好行为数据对应的项目评分,根据项目评分计算用户间相似度或项目间相似度,基于用户间相似度或项目间相似度获取用户感兴趣的项目,根据用户感兴趣的项目对应的课程类别建立学习者模型并对用户进行智能推荐,通过神经网络对用户进行预先分类,然后类内进行计算和推荐,缓解冷启动问题,对老用户类内多特征计算,解决了协同过滤单一评分特征计算的不足。从用户对资源的众多偏好行为中抽取浏览、评论、下载三种并统计它们次数数据,同时实现量化,形成用户偏好行为数据模型,通过此模型实现用户资源推荐服务,让其获取感兴趣资源,将所有用户偏好行为数据都考虑在内,从而构建更加成熟完善的个性化推荐模型,使得推荐质量更加精确。
附图说明
15.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
16.图1为本发明提供的基于教学大数据的智能推荐方法的流程图;图2为本发明提供的学习模型的智能推荐过程图。
具体实施方式
17.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终
相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
18.参阅图1,本发明提供了一种基于教学大数据的智能推荐方法,包括以下步骤:s10:获取用户搜索的历史记录数据并传输到候选队列,将用户搜索的历史目标信息设定成过滤的候选资源;s11:根据候选资源得出的数据信息进行筛选和预测,将原始网络数据进行转换传输至构建网络模型所需的模型输入数据得到用户偏好行为数据,其中,用户偏好行为数据包括对学习资源的浏览次数、评论次数和下载次数,预设浏览次数为,其中表示用户m对资源n的浏览次数,预设评论次数为,其中表示用户m对资源n的评论次数,预设下载次数为,其中表示用户m对资源n的下载次数;s12:计算用户偏好行为数据对应的项目评分,根据项目评分计算用户间相似度或项目间相似度,基于用户间相似度或项目间相似度获取用户感兴趣的项目;s13:根据用户感兴趣的项目对应的课程类别建立学习者模型并对用户进行智能推荐。
19.本实施例中,用户偏好行为显性偏好行为和隐性偏好行为,显性偏好行为是指用户在网络平台注册时填写的一些个人基本信息,如姓名、性别、专业、职业、爱好与兴趣等,隐性偏好行为是指用户在网络平台对需求资源所留下的隐性行为,如用户浏览、浏览时间、用户评论和下载等,显性偏好行为通常用户刻意去更改而不具备实时型,无法全面的、客观的反映出用户的偏好行为,而隐性偏好行为通常不是很稳定,是随着用户的兴趣爱好变化而改变,具有实时性和客观性等特点,能全面的呈现出用户的兴趣。当时,网络平台用户虽然存在搜索记录,但不一定是用户喜爱这个网络资源,反之,时,用户和平台资源没有交集,有可能不知道存在这一记录,而没有进行搜索,并不是不感兴趣,很多网络信息被大多数用户忽略,没有形成兴趣热度,即使有些项目质量差且信号不稳定,还是会用户发掘,而剩下的因缺少搜索量,这种情况对开发网络资源造成难度增加而导致数据消失。
20.需要说明的是,为了解决用户关注度而赵成数据流失过多,网络稀疏问题,需要建立一个候选网络,提高信息分析准确度,减少网络平台浏览率迅速增加,因此将用户不感兴趣的项目和实体网络图谱相结合,选择合适队列的分类器,项目信息种类数目较多,选择合适的分类器具有一定的难度,在大多用户的选择中,softmax作为最常用的分类器,且被验证在项目信息中的选择分类中体现了较好的效果。以softmax作为分类器,以用户的id信息作为label,提出一个用户行为特点作为softmax,根据协同过滤结果,不同网络用户可能具有相似的特征。对相邻的信息队列进行过滤筛选,相邻空间的项目虽然用户不同,但极其相似,因此,若想得到所需队列,只需要对其相邻两边的队列进行分析过滤,得到最优选择,需要保证搜索与之相同的历史记录和项目队列,再经过图谱中选择,找出和队列相应的项目,
最后再找出相邻的项目队列,加以处理,选择用户专注度更高的项目。构建网络资源信息获取模型得到课程资源信息,将得到的全部信息结合,形成关注度高的项目信息队列,最后将浏览频繁的信息运用softmax分类器分类,得到个性化算法设计,这种设计结构简单准确、安全性和实用性高,超出了预计的效。网络课程资源正在温度运行并呈现上升趋势,实现了个性化发展,增加了网页浏览频次,促进教学大数据的智能推荐的精准度和用户体验度。
21.可选地,根据用户感兴趣的项目对应的课程类别建立学习者模型并对用户进行智能推荐,包括:s20:使用神经网络自动抽取用户兴趣的过程缓解冷启动,通过用户兴趣得到用户喜欢的课程类别,计算用户间学习能力相似度得到相似用户并进行推荐;s21:通过用户历史信息确定用户类别,引入学习者行为特征和学习能力相似度类内计算得到模型相似度分数并计算类内用户评分相似度,融合计算模型相似度分数和评分相似度分数得到最终用户集合进行推荐。
22.本实施例中,根据候选资源得出的数据信息进行筛选和预测,包括:将网络结构得到的数据信息进行筛选和预测,把原始网络数据进行转换传输得到构建网络模型所需要的模型输入数据,通过表达式为,其中表示用户项目矩阵;若时,得出用户对项目感兴趣,通过计算得出的信息比被用户忽略的资源信息分数更高,根据受关注度高和不受关注的差距得到用户和项目的关系矩阵;用户在关注资源信息时也关注用户在搜索页面时的历史记录,当用户关注网络页面时,记录下来网络用户的id信息,若用户id信息为,通过用户浏览记录确定用户搜索行为特点来表示,根据用户和项目的关系矩阵得到一个用户的信息交互记录并记为,与用户搜索行为特点关联得到行为高度,其表达式为,其中表示平台用户数,表示历史记录数量,通过分列和集合操作得到行为高度与用户本身的基本信息重合得到队列长度。
23.需要说明的是,网络平台把特定用户搜索的历史记录数据传输到候选队列,并将用户搜索的历史目标信息设定成滤过的候选资源,根据得出的数据分析显示,许多用户对资源队列的点赞、差评都反映了用户在网络中行为的高低,从表达的信息可以描述出用户的个人习惯、性格好坏和兴趣爱好等,从用户给出的资源信息可以从行为得到一个人的特征表现。
24.可选地,使用神经网络自动抽取用户兴趣的过程缓解冷启动,包括:采用lstm文本分类法对新用户进行分类,句子分词和向量化,输入词向量,经过lstm层处理输出n个时刻的向量,,...,输入上层输出的向量进行最大池化操作得
到特征向量h,将上层的特征向量h经过softmax层处理完成信息分类,其中,lstm模型包括完成分词和向量化操作的第一层即embedding层、提高特征之间的独立性的第二层即spatial_dropout1d层、第三层即lstm层、使用maxpooling以获取到最显著特征的第四层和使用softmax进行分类的第五层。
25.本实施例中,计算用户间学习能力相似度得到相似用户并进行推荐,包括:预设c为用户偏好同时映射为资源类别即,根据课程类别映射出用户的兴趣类别,表示学习者的学习能力水平,其中分别对应初级、中级别和高级,新用户类内相似度计算使用标准高斯分布,其表达式为,其中u表示全体用户,表示第j个类别为c的用户,表示目标用户,、分别表示两个用户的学习水平,的值越大两个用户的相似度越大,反之相似度越小。
26.需要说明的是,lstm模型是对循环神经网络(recurrent neural network,rnn)改进的一种新型网络模型,lstm对rnn起到了扩展的作用。lstm通过“门”控制结构来实现对信息的筛选,输入门决定保留多少个有效的输入信息,输出门决定当前时刻输出多少个有效的单元状态,遗忘门决定是否保留上一个状态输出的信息。协同过滤是从用户或项目角度出发,计算用户或项目之间的相似度,根据相似度由高到低排列去除前n个作为邻居,协同过滤算法在应用中只考虑用户对项目的打分特征,未考虑用户固有的特征和行为,忽略了用户自身的客观信息,且随着用户数量的增多计算复杂度也会相应的增加。教学资源推荐算法使用协同过滤算法,需要计算用户评分相似度和目标用户的学习水平等特征以提高智能推荐效率。
27.可选地,对用户的历史学习信息进行统计得到用户的兴趣标签,其表达式为,其中表示用户历史信息学习第i类课程的次数,表示用户的学习的总次数,根据提取到的用户兴趣标签在用户兴趣类别中进行计算的过程,包括:根据老用户的学习特征计算学习特征相似度,使用两个用户对同一个课程的行为特征做计算,用户对课程的行为使用向量表示,其表达式为,其中u表示全体用户,表示目标用户,表示同一类别下其他用户,,,表示用户对课程k的行为特征,表示用户对课程k的行为特征,k表示两个用户共同学过的课程,分
别表示学习者学习课程的时间、获得的经验、得到的分数、学习的进度和作业提交次数;两个用户共同课程的相似度计算的表达式为,其中k表示两个用户之间共同学习的课程,,n表示两个用户共同学习过的课程的总数;结合上述学习水平相似度表达式和两个用户共同课程的相似度表达式得到学习者模型相似度,其表达式为。
28.本实施例中,根据用户兴趣标签的表达式计算出目标用户历史信息中目标用户感兴趣的类别,找到与目标用户兴趣相同其他用户得到用户评分,包括:根据表达式为计算用户间评分相似度,其中用户集合为,课程资源集合,表示用户和的相似度,i表示共同评分的课程,和分别表示、在共同评分项目中的均值,、分别表示用户和的课程评分,将学习者模型相似度和评分相似度进行相加得到表达式为,并将计算结果由高到低进行排序,取其前n个作为邻居集合;通过上述评分计算得出直接邻居,预测最终邻居用户中目标用户没有产生评分的课程的分数,选取预测分数最高的前n个课程进行推荐,其计算表达式为,其中表示用户对未评分项目i的预测评分,表示用户的平均评分,表示用户的平均评分,表示对项目i的评分,表示用户的邻居集合。
29.需要说明的是,用户基本信息反映用户兴趣少,若对用户的个人简要说明数据挖掘和分析可以更为准确地获取用户兴趣,可以解决人工对学习者分类的问题,缓解新用户冷启动问题。新用户可以使用神经网络自动抽取用户感兴趣的方法缓解冷启动,通过用户兴趣得到用户喜欢的课程类别,然后类内计算用户间学习能力相似度得到相似用户进行推荐。老用户可以通过用户历史信息确定用户类别,引入学习者学习行为特征和学习能力相似度类内计算得到模型想帝都分数,在此基础上计算类内用户评分相似度,融合计算模型相似度分数和评分想帝都得到最终用户集合进行推荐。采用lstm文本分类方法对新用户进行分类,采集某教学网站的教学资源数据集,包含1000个用户的个人注册信息和10类别的
课程资源,数据进行预处理,去除停用词,分词并完成数据向量化,将类别标签向量化,划分训练和测试数据集可以得到lstm模型性能分析结果。
30.可选地,计算用户偏好行为数据资源评分,使流量次数、评论次数、下载次数具有可用性,使用归一化方法进行数据标准化处理,其表达式为, 其中表示评分,x表示次数,表示次数最小值,表示次数最大值,统一映射到;根据归一化表达式进一步得到表达式为,其中表示用户对资源的浏览次数评分,表示用户对资源的评论次数评分,表示用户对资源的下载次数评分,得到用户对资源的初步用户偏好行为数据评分,,根据评论次数、评论次数和下载次数对评分的贡献度不同赋予不同权重,结合用户偏好行为数据权重得到最终用户偏好行为数据评分,其表达式为,其中,、和分别为浏览次数权重、评论次数权重和下载次数权重,表示用户对资源的最终用户偏好行为数据评分。
31.需要说明的是,评价推荐系统性能方法主要有平均绝对偏差mae、均方根误差rmse,准确率precision和召回率recall,它们有不同的侧重点,应用于不同的场景,其中mae和rmse主要应用于评分预测推荐场景,precision和recall主要应用于top-n推荐场景,参数的取值选取平均绝对偏差mae作为测评指标,最终推荐结果以top-n列表反馈用户,选取准确率和召回率作为测评制备,其计算表达式为,其中n表示资源集合,表示预测评分与真实评分之间的绝对误差,表示推荐算
法预测出用户u的资源集合,表示用户u在测试集中感兴趣的资源集合。参数用于调节相似度计算结果的比重,如表示没有考虑用户偏好行为数据评分,即还是传统的协同过滤方法,表示没有考虑用户对资源的评分。在不同取值情况下对推荐精度的营销,采用平均绝对偏差mae作为评估标准,mae算法其值越小,推荐质量越高。mae算法的精度跟随值的变化而变化,其值过大或过小都会使得效果不是最优,且随着数据集的不断增大,mae算法的值变换幅度却较小,逐渐趋于稳定,当,mae取值最低,模型方法推荐精度最高。
32.可选地,根据候选资源得出的数据信息进行筛选和预测,包括:将网络结构得到的数据信息进行筛选和预测,把原始网络数据进行转换传输得到构建网络模型所需要的模型输入数据,通过表达式为,其中表示用户项目矩阵;若时,得出用户对项目感兴趣,通过计算得出的信息比被用户忽略的资源信息分数更高,根据受关注度高和不受关注的差距得到用户和项目的关系矩阵;用户在关注资源信息时也关注用户在搜索页面时的历史记录,当用户关注网络页面时,记录下来网络用户的id信息,若用户id信息为,通过用户浏览记录确定用户搜索行为特点来表示,根据用户和项目的关系矩阵得到一个用户的信息交互记录并记为,与用户搜索行为特点关联得到行为高度,其表达式为,其中表示平台用户数,表示历史记录数量,通过分列和集合操作得到行为高度与用户本身的基本信息重合得到队列长度。
33.本实施例中,将用户搜索的历史记录作为用户的特征点采用softmax进行分类,若未知用户为u,构建函数,其中p表示第i类的概率,v表示特征定量,w表示维度系数,x表示边缘节点分布,根据函数对项目队列进行分类得到候选队列。获取用户搜索的历史记录数据并传输到候选队列,包括:假设n为文件数量,不同文件中含有关键信息,若文件中关键信息的数量表示,关键信息在文件中出现的次数为
,其中表示关键信息出现最多的次数,采用穷举算法得到关键信息,选择最大词出现频数;采用表示关键信息的参数,其表达式为,其中n表示数量,表示关键词重点,以获取用户最感兴趣的资源信息。
34.需要说明的是,得到如何表述关键词重点之后,可以轻松获取用户最感兴趣的资源信息,去推荐用户得到想要的产品,若用户尚未得到相同的产品,可以建议用户选择一个特殊与之相似的产品,还可以向用户推荐特性不同但模型结构相同的产品信息。通过神经网络对用户进行预先分类,然后类内进行计算和推荐,缓解冷启动问题,对老用户类内多特征计算,解决了传统协同过滤单一评分特征计算的不足,可以较好地适用于数据量较大的场景,学习者模型在大数据环境下教学资源推荐具有一定的现实意义。
35.在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
36.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
37.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。