基于社交网络的弱关系和强关系的视频推荐方法与流程

文档序号:11199298阅读:513来源:国知局
基于社交网络的弱关系和强关系的视频推荐方法与流程

本发明涉及信息技术领域,具体涉及一种视频推荐方法。



背景技术:

视频推荐在学术研究中一直是一个热门的研究主题,视频推荐与用户点击率和视频流行度密切相关。随着社交软件facebook、twitter、微博的兴起,基于社交网络的特性对视频传播普及的影响成为新的研究热点。传统研究工作中,根据视频的历史浏览总数预测视频将来的流行度(浏览数),认为视频的流行度随着时间呈现线性增长,所以可以根据视频在不同时间段的流行度相较于前一个时间段的增量作为特征,训练线性回归模型预测视频将来的流行度。此外还有基于多阶段的时序预测视频流行度的在线学习的模型,利用视频在社交网络中的动态传播的特性,以及在每一个划分的传播的时间段内预测视频的流行度。

在社交网络中的发布的视频中可能包含标签、是否是大v认证的人发布、文本长度等特征,根据用户历史点击的视频来估算出用户对新视频的潜在兴趣值。但是传统模型并没有考虑到用户之间的交互信息,比如提及、点赞、转发、评论、回复。在社交网络中决定用户是否点击一个视频,很大程度上取决于视频贡献者在社交网络中的位置,而与视频的内容无关。视频贡献者是指对视频有过用户行为,比如发布、转发、点赞、收藏等。而且人们更易于接受朋友推荐的物品。在传统工作中提出了一种基于朋友关系聚簇的lbm(latticeboltzmannmethod)模型,该模型首先根据用户与双向朋友之间的互动频繁程度,采用kmeans算法将用户的好友分为亲密好友、熟悉好友、不熟悉好友,然后在不同朋友关系中,采用lbm算法训练朋友的用户行为特征的权重。最后累加不同簇中的朋友行为权重,得到视频最后被该用户点击的概率。但是该模型中,只考虑了朋友关系即双向关注的强关系,但是没有考虑到单向关注的弱关系。

社交网络中的社交关系主要有强关系网络和弱关系网络。强关系网络中,用户可能是现实的朋友关系,比如家人、同学、同事等,强关系主要体现的是用户对好友的亲密度。弱关系是一种虚拟关系,一般用户之间并不认识,更能体现用户的偏爱兴趣。而像微博、twitter这样的社交网络,是以用户的弱关系为主的。目前基于社交网络的预测视频流行度以及用户点击率的工作中,还没有考虑将强关系和弱关系这两种社交关系联合起来。



技术实现要素:

发明目的:为了克服现有技术中存在的不足,本发明提供一种基于社交网络的弱关系和强关系的视频推荐方法,通过融合弱关系好友的偏爱和强关系好友的亲密度,进一步基于所有好友进行视频推荐。

技术方案:为实现上述目的,本发明的基于社交网络的弱关系和强关系的视频推荐的方法包括以下步骤:

1)基于用户的弱关系好友的影响力、用户与弱关系好友的相关度以及弱关系好友对视频的行为特征,计算用户对该视频的第一预估点击概率;

2)基于不同亲密度的强关系好友对视频的行为特征,计算用户对该视频的第二预估点击概率;

3)线性融合第一预估点击概率和第二预估点击概率,得到用户对视频的预估点击概率;

4)基于用户对视频的行为观察值以及用户对视频的预估点击概率,构造损失函数;

5)采用随机梯度算法对步骤1)-4)中的特征参数进行优化,使损失函数的值最小化,当损失函数的值满足预定条件时,停止优化,最终得到用户对视频的点击概率;

6)利用topn算法向用户推荐点击概率最高的n个视频。

其中,对弱关系好友而言,弱关系好友的影响力influence(w)通过repagerank算法计算得出,计算公式为其中,

d为用户游走的概率,即用户点击其他链接的概率,其通过高斯函数初始化;

b表示关注了弱关系好友的粉丝集合;

influence(u)为用户u的影响力,其通过高斯函数初始化;

out(u)为用户u关注的好友数;

re(u)为用户的转发率,根据用户u所发的视频被转发的次数与其所发的视频总数的比得到。

根据以上得到的影响力,使用以下公式来计算步骤1)中的用户对视频t的第一预估点击概率其中,

f表示弱关系好友对视频t的行为特征;

f表示弱关系好友对视频t的行为特征集合,包括发表、提及、点赞、评论、回复、转发、收藏等动作;

bf,w为弱关系好友w的行为特征f的权重,其通过高斯函数初始化;

itf,w是指示函数,表示弱关系好友w对视频t是否有过行为,如果有,则itf,w=1,否则itf,w=0;

ru,w为用户与弱关系好友的相关度,根据用户点击弱关系好友的视频总数与用户的视频总数的比得到。

对强关系好友而言,首先基于用户与强关系好友的互动频率二元组(f1,f2),利用kmeans算法将强关系好友划分到不同亲密度的好友簇中,再通过不同亲密度的强关系好友对视频t的行为特征f计算用户对视频t的第二预估点击概率其中,k是强关系好友所在的好友簇,bf,s是簇k中强关系好友的行为特征f的权重,是指示函数,表示簇k中的强关系好友对视频t是否有过互动行为,如果有,则否则

得到了之后,将其线性融合,在融合时考虑用户对视频的点击偏好以及用户点击视频的平均点击率,以使最终得到的预估点击概率更准确。此外,为了进一步提高命中率,还基于用户对视频的实际动作观察值和预估点击概率构造损失函数,并对损失函数进行修正,利用随机梯度sgd(stochasticgradientdescent)算法优化特征参数,最后得到精确的点击概率,并向用户推荐点击概率最高的n个视频。

有益效果:本发明的视频推荐方法结合了与用户相关的弱关系好友和强关系好友进行视频推荐,综合考虑了弱关系好友的影响力、强关系好友的亲密度、强关系和弱关系好友的互动行为特征的权重以及对行为特征权重的累积求和,得到用户对视频的点击概率,从而能够提高视频推荐的准确性。

附图说明

图1是社交网络中的弱关系和强关系的图谱;

图2是本发明的方法的总体流程图;

图3是本发明计算用户弱关系好友的影响力的流程图;

图4是本发明对用户强关系好友进行聚簇的流程图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

社交网络中用户存在两种社交关系,如图1所示,其中,单向箭头表示单向关注的弱关系,双向箭头表示互相关注的强关系。在社交网络中,弱关系是一种虚拟关系,一般用户之间并不认识,这种关注更能体现用户的偏爱兴趣。而强关系是一种现实关系,即用户之间是现实的朋友关系,比如家人、同学、同事等,强关系主要体现的是用户对好友的亲密度以及信任度。

图2示出了本发明的方法的流程图,其中,对社交网络的弱关系好友,根据用户的粉丝数和转发率设计了一种新的计算用户影响力的算法repagerank;对社交网络的强关系好友,是基于kmeans算法根据用户与好友的互动频率划分不同的亲密度;然后融合用户的弱关系好友和强关系好友,根据好友对该视频t的行为特征(发表、点赞、转发、评论等)来预测该视频t的点击概率;再根据用户对视频t的观察值与预测值的平方和作为损失函数,采用随机梯度sgd算法最小化损失函数,优化特征参数;最后采用topn算法给用户推荐点击概率最大的n个视频集合。在本实施例中,n取10。下文详细描述具体过程。

首先,计算弱关系好友的影响力,如图3所示,计算弱关系好友的影响力需要的步骤如下:

3a)通过高斯函数初始化用户u的影响力influence(u)。

3b)根据用户u所发的视频被转发的次数与其所发的视频总数的比,得到用户的转发率re(u)。

3c)采用min-max归一化方法将用户转发率re(u)映射至0到1之间。

3d)融合转发率和粉丝数计算弱关系好友的影响力,计算公式为:其中,d为用户游走的概率,即用户点击其他链接的概率,本实施例中设置为0.85;b表示关注了弱关系好友的粉丝集合;out(u)为用户u关注的好友数。

3e)重复执行步骤3b)-3d),直到弱关系好友的影响力收敛。

其次,对强关系好友而言,用户的强关系好友是现实的“朋友”关系,比如家人、同学、同事等,但是在这些“朋友”关系也有不同程度的亲密关系,因此可以通过用户与这些强关系好友的互动频繁程度划分不同的亲密度的朋友,比如亲密好友、熟悉好友和不熟悉好友。如图4所示,划分3个不同亲密度好友簇的步骤如下:

4a)根据用户u与强关系好友s之间的互动行为(发表、评论、转发)总数占用户的视频推特总数的比重,计算用户u与强关系好友s的互动频率f1,同理计算强关系好友s与该用户u的互动频率f2。

4b)用户u与强关系好友s的互动频率组成互动频率二元组(f1,f2)。

4c)采用java语言中random函数随机产生3个互动二元组作为3个簇中心。

4d)利用kmeans算法根据不同的互动频率二元组,将强关系好友划分到3个不同的簇中。

4e)采用平均法计算3个簇中的中心。

4f)重复步骤4d)-4e)直到簇中心收敛。

可以通过两种方式判断函数是否收敛,一种是对比前后两次计算结果之间的差是否落入允许的误差范围,如果落入了,表明两轮计算的值趋于一致,则可以认为函数收敛;另一种是基于经验限定重复执行的次数,当重复执行了指定次数的计算以后,就认为函数达到收敛。

接下来,基于弱关系好友和强关系好友的行为特征(发表、点赞、转发、评论等)预测视频的点击概率。根据用户u的历史信息训练得到好友互动行为特征的权重,最终可以根据好友互动行为特征的权重累加和得到用户对一个新的视频t的点击概率,步骤如下:

1)按照图3的流程计算用户u的弱关系好友的影响力influence(w)。

2)选取用户u的前10个最有影响力的弱关系好友,形成弱关系好友集合。

3)根据用户u点击弱关系好友w的视频t总数占用户u的视频总数的比,计算用户u与弱关系好友w的相关度ru,w。

4)根据弱关系好友对视频t的互动行为特征f(点赞、评论、转发等),累积求和得到用户对视频t的第一预估点击概率f表示弱关系好友对视频t的行为特征,f表示弱关系好友对视频t的行为特征集合,bf,w为弱关系好友的行为特征f的权重,其通过高斯函数初始化,itf,w是指示函数,表示弱关系好友对视频t是否有过行为,如果有,则itf,w=1,否则itf,w=0。

5)按照图4的流程将用户u的强关系好友划分亲密好友、熟悉好友和不熟悉好友的好友簇k,簇的大小为3。

6)通过不同簇k中强关系好友对视频t的用户行为特征f来计算用户对视频t的第二预估点击概率其中bf,s是簇k中强关系好友的行为特征f的权重,是指示函数,表示簇k中的强关系好友对视频t是否有过互动行为,如果有,则否则

7)计算用户u对于所有好友的视频的平均点击率a。

8)用高斯函数初始化用户u的点击偏置参数b0,b0表示用户u点击视频的偏好。

9)线性融合平均点击率a、偏置参数b0、根据弱关系好友得到的第一预估点击概率以及根据强关系好友得到的第二预估点击概率得到用户对视频t的预估点击概率

10)计算用户u对视频t的观察值rt,如果用户对视频t有过行为,则rt=1,否则rt=0。

11)将观察值rt与预估值的差的平方和作为损失函数其中t表示用户有过行为的视频集合。

12)为了防止优化损失函数过程中导致学习的过拟合,加入了参数的l2范数,最后损失函数可以表示为

13)采用随机梯度sgd算法优化学习参数b0、bf,w和bf,s,使损失函数的值最小化。

14)最终用户u对一个新的视频t的点击概率可以根据该用户弱关系好友互动行为特征权重的累加和以及强关系好友簇的互动行为特征权重的累加和来计算,将两者以及用户u的偏置值b0以及平均值a的线性结合得到用户u对视频t的点击概率pt=a+b0+pt1+pt2

15)最后给用户推荐点击概率最高的10个视频。

本发明方法基于社交网络预测点击率。根据社交网络中的弱关系好友以及强关系好友互动行为特征,线性融合预测用户的视频点击率。

以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1