一种基于显式和隐式信息的视频推荐方法与流程

文档序号:15615769发布日期:2018-10-09 21:20阅读:944来源:国知局

本发明涉及个性化推荐领域,尤其涉及基于用户社交网络关系和视频关联关系的协同过滤推荐方法。



背景技术:

随着电视媒体的迅猛发展,看视频成为了当下人们喜欢的一种娱乐消遣方式。一方面视频资源给用户带来了精神享受,但另一方面,海量的视频资源造成了信息过载问题,用户想要短时间内找到自己感兴趣的视频变得非常困难。

推荐系统作为一种用以满足用户个性化需求的系统和工具,能够有效缓解互联网的信息过载问题。基于矩阵分解的协同过滤则是解决推荐系统评分预测问题应用最为广泛的技术。目前,大量研究工作都围绕着矩阵分解进行有针对的进一步优化。为了缓解矩阵分解所面临的数据稀疏和冷启动等问题,许多研究者将额外信息加入到推荐系统中,例如用户社交信息,项目属性,用户评论和地理位置等显式信息。但现有的研究工作大都直接将这些显式信息融入优化目标中。鲜有工作将研究目标放在对评分显式信息的进一步挖掘中。评分作为一种用户和项目交互的显式表达,蕴藏着丰富的的隐式信息,这些隐式信息可以作为推荐系统理解用户偏好过程的有益补充,从而能够进一步提高推荐系统的性能。



技术实现要素:

针对现有推荐技术的不足,本发明公开了一种基于显式和隐式信息的视频推荐方法。该方法通过挖掘用户显式信息和视频隐式信息,将其融入到传统协同过滤方法中,该方法能实现更好的推荐效果。

为了实现上述发明目的,本发明采用的技术方案为:一种基于显式和隐式信息的视频推荐方法,包括如下步骤:

1)提取用户对视频的评分信息和用户社交关系信息;

2)根据用户对视频的评分和用户社交关系挖掘用户显式信息;

3)根据用户对视频的评分挖掘视频隐式信息;

4)融合用户显式信息和视频隐式信息,将其加入到协同过滤技术中。

在上述步骤1)中,基于本方法提取用户对视频的评分信息和用户社交关系信息。包含以下步骤:

11)从视频资源网站抓取用户对视频的评分作为用户视频评分矩阵r;

12)从该网站提取用户与用户之间的社交关系矩阵,使用每行每列值为0或者1来描述用户社交关系矩阵t,tuv=1表示用户u信任用户v,反之则为0。

上述步骤2)中,根据用户对视频的评分和用户社交关系挖掘用户显式信息包含以下步骤:

21)对于用户ui,使用来表示这个用户的邻居用户。使用用户评分的cosine相似度来刻画用户之间的彼此关系,挖掘得到用户的显式信息。

上述步骤3)中,根据用户对视频的评分挖掘视频的隐式信息包含以下步骤:

31)根据刻画视频相似度的指标,计算出所有视频之间两两相似度,对目标视频j,将所有视频与视频j的相似度进行降序排序,选出前k个相似度最高的视频组成视频j的近邻集aj,挖掘得到视频的局部隐式信息;

32)通过视频流行度和用户评分之间的加权挖掘得到视频的全局隐式信息。

上述步骤4)中,融合用户显式信息和视频隐式信息,将其加入到传统协同过滤技术中。包含以下步骤:

41)综合考虑两种信息提出综合显式和隐式信息模型;

42)使用随机梯度下降法优化目标函数。

本发明与现有技术相比,其显著优点是:本发明的方法(silgr)在推荐结果准确性上有明显的提高,用户显式信息和视频隐式信息的引入克服了传统协同过滤推荐方法推荐信息单一和数据稀疏导致推荐结果不准确的问题,能更加精准的对视频进行推荐。

附图说明

图1为本发明实施例的基于显式和隐式信息的推荐方法框架。

图2为本发明实施例的随机梯度下降法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中技术方案进行清楚的描述。

如图1所示,基于显式和隐式信息的推荐方法包括如下步骤:

1)提取用户对视频的评分信息和用户社交关系信息;

2)根据用户对视频的评分和用户社交关系挖掘用户显式信息;

3)根据用户对视频的评分挖掘视频隐式信息;

4)融合用户显式信息和视频隐式信息,将其加入到传统协同过滤技术中。

上述步骤1)中,基于本方法提取用户对视频的评分信息和用户社交关系信息。包含以下步骤:

11)从影片评分网站豆瓣抓取数据,豆瓣有各种类型的电影视频,用户可以对视频进行评分,用户和用户之间也可以建立社交关系。提取的视频评分作为用户视频评分矩阵r,用户对视频评分通常为0到5。

12)提取用户社交关系,使用每行每列值为0或者1来描述用户社交关系矩阵t,tuv=1表示用户u信任用户v,反之则为0。

上述步骤2)中,根据用户对视频的评分和用户社交关系挖掘用户显式信息包含以下步骤:

21)用户的显式信息揭示了用户之间和他们朋友之间的信任关系,对于用户ui,我们使用ni={uk|t(i,k)=1}来表示这个用户邻居用户。表示社会相似度矩阵,sik表示用户ui和uk的信任关系强度。sik可通过如下公式定义,使用用户评分的cosine相似度来刻画用户之间的彼此关系。

通过用户显式信息对矩阵分解模型中的用户语义矩阵进行修正,提出基于用户显式信息的推荐方法:

用于捕捉用户之间的偏置关系,sik越大,用户ui和uk联系越紧密。

上述步骤3)中,根据用户对视频的评分挖掘视频隐式信息包含以下步骤:

31)视频的局部隐式信息揭示了视频和其相似视频之间的联系,可以通过关联规则技术挖掘这种联系。一条关联规则可以作如下表示:li,j:i→j,综合考虑关联规则的支持度和置信度,提出刻画视频之间非对称关系的相似度方法ias:

式中support(li,j)是关联规则li,j的支持度,confidence(li,j)是关联规则li,j的置信度。rmax是评分矩阵中评分的最大值,|ru|是评分矩阵中用户的个数,|vi∩vj|是同时给视频i和视频j评分的用户集合。其中支持度和置信度计算公式分别如下:

support(li,j)=|vi∩vj|/|ru|

confidence(li,j)=|vi∩vj|/|vi|

根据刻画视频相似度的指标,计算出所有视频之间两两相似度,对目标视频j,将所有视频与视频j的相似度进行降序排序,选出前k个相似度最高的视频组成视频j的近邻集aj,提出基于视频局部隐式信息的推荐方法如式:

式中gjq表示视频vj和vq组成的关联规则的可信度,g为非对称矩阵。

32)视频的全局隐式信息揭示了单个视频在整个评分视频集合中的影响力强弱,我们使用视频流行度和用户评分信息的加权刻画视频的全局隐式信息。具体的计算方式如下:

zj=|rj|/n

式中rj是视频j评分的用户集合,n是用户的总数量;

对于每个用户,我们定义一种用户的内在偏好,定义如下:

式中i(u)指用户u评过分的视频集合

视频j和用户内在偏好的关系可以描述如下:

式中指视频j的平均评分,quj指对视频j评分的所有用户的内在偏好,指内在偏好向量的平均值。采用如下公式将相关系数值域映射到[0,1]:

zj=(corrj+1)/2(3)

迭代公式(1)(2)(3)直到满足下式时收敛,就获得了每个视频的全局隐式信息权重;

提出基于视频全局隐式信息的推荐方法如式:

上述步骤4)中,融合用户显式信息和视频隐式信息,将其加入到传统协同过滤技术中,用来调整用户和视频潜在特征向量的学习过程包含以下步骤:

41)步骤2)和步骤3)分别从用户显式信息和视频隐式信息来提升推荐质量,综合考虑两种信息提出综合显式和隐式信息方法,如式:

式中λu,λv,λ是正则项参数,来自用户显式信息的贡献由λu控制,来自视频隐式信息的贡献由λv控制,最后一项λ控制模型复杂度防止过拟合。

42)设以上最小化目标函数为l,使用梯度下降法对l求导,得到以下结果:

根据上述推导,给出基于显式和隐式信息的视频推荐方法过程(如图2所示)。

以上的实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1