一种视频推荐方法和装置与流程

文档序号:18689913发布日期:2019-09-17 20:27阅读:154来源:国知局
一种视频推荐方法和装置与流程

本发明属于数据处理领域,尤其涉及一种视频推荐方法和装置。



背景技术:

当前,互联网(Internet)已经成为人们获取信息的重要来源,是人们获取信息、改变生活方式、赢得商机的重要媒介。然而,互联网规模和信息资源的迅猛增长带来了信息过载的问题,人们面临“信息丰富、但有用信息获取困难”的窘境,从互联网中有效地获取信息日益困难。目前,搜索引擎是最普遍的辅助人们获取信息的工具,但它只能满足主流需求,没有考虑用户的个性化信息需求,仍然无法很好地解决信息过载的问题。目前,解决信息过载问题的一种主要手段是“信息推荐”。所谓信息推荐,是指在分析预测用户需求的基础上主动推送用户可能需要但又无法获取的有用信息,并能够以用户为中心,通过研究用户行为、兴趣和环境等,为用户推荐更具针对性的信息,即实现信息的“按需定制服务”。

视频是互联网中信息的重要组成部分,而且,随着互联网中各种视频信息的增多,良好的视频推荐方案是增强用户粘度的一种有效方式。现有的一种视频推荐方案是协同过滤推荐算法,即,根据推荐系统针对的目标用户不同,将被推荐视频分为两大类:对大众的视频推荐和对个人的视频推荐,其中,对大众的视频推荐,就是对所有视频用户推荐一样的视频信息,而对个人的视频推荐,即是对不同的用户,根据个性和需求的不一样,产生不同的推荐结果,例如,视频网站上的“猜你喜欢”功能,展示的就是为个体推荐的视频资源。

然而,上述现有的视频推荐方案存在的主要缺陷是忽视了时间和场景等因素的影响。一方面,现有的视频推荐方案在利用历史行为用户进行推荐时,往往忽视了行为发生的时间的作用,因为,用户选择视频的过程实际上是个动态决策的过程,所感兴趣的领域是随时间而变化的,在这个过程中,用户近期发生的行为对用户当前的决策应该更有影响力;另一方面,视频与传统的物品属性上存在着较大的区别,因为视频对观看者所处的时间节点和具体场景信息均有较高要求。

综上,由于现有的视频推荐方案忽视了时间和场景等因素的影响,导致推荐的视频不能令用户满意。



技术实现要素:

本发明的目的在于提供一种视频推荐方法和装置,以准确地推荐与用户需求一致的视频信息。

本发明第一方面提供一种视频推荐方法,所述方法包括:

构建联合推荐信息图,所述联合推荐信息图包括用户集合、视频集合、联合推荐信息集合、用户集合中元素与视频集合中元素构成的第一类边、视频集合中元素与联合推荐信息集合中元素构成的第二类边以及用户集合中元素与联合推荐信息集合中元素构成的第三类边,所述联合推荐信息集合包括时间段和视频类型;

计算所述第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C;

根据所述WU,I、WI,C和WU,C并通过随机游走所述联合推荐信息图,获取推荐请求集合中的用户对视频集合中的视频的访问概率,以针对每个用户生成对应的视频推荐列表,所述推荐请求集合包括所述用户集合中元素和联合推荐信息集合中元素;

向用户推荐对应视频推荐列表中的视频。

本发明第二方面提供一种视频推荐装置,所述装置包括:

构建模块,用于构建联合推荐信息图,所述联合推荐信息图包括用户集合、视频集合、联合推荐信息集合、用户集合中元素与视频集合中元素构成的第一类边、视频集合中元素与联合推荐信息集合中元素构成的第二类边以及用户集合中元素与联合推荐信息集合中元素构成的第三类边,所述联合推荐信息集合包括时间段和视频类型;

边权值计算模块,用于计算所述第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C;

访问概率获取模块,用于根据所述WU,I、WI,C和WU,C并通过随机游走所述联合推荐信息图,获取推荐请求集合中的用户对视频集合中的视频的访问概率,以针对每个用户生成对应的视频推荐列表,所述推荐请求集合包括所述用户集合中元素和联合推荐信息集合中元素;

推荐模块,用于向用户推荐对应视频推荐列表中的视频。

从上述本发明技术方案可知,所构建的联合推荐信息图不仅包含用户集合、视频集合及其边,而且包含联合推荐信息集合以及与其他集合的边,推荐请求集合中的用户对视频集合中的视频的访问概率是根据这些边的权值计算得到。由于考虑了除用户对视频评分之外的因素,例如,联合推荐信息图包括视频集合中元素与联合推荐信息集合中元素构成的第二类边以及用户集合中元素与联合推荐信息集合中元素构成的第三类边,而联合推荐信息集合还包括时间段,因此,综合这些因素得到的视频推荐结果更加合理,能够为用户推荐更接近其需求、兴趣爱好等方面的视频。

附图说明

图1是本发明实施例一提供的视频推荐方法的实现流程示意图;

图2-a是本发明实施例提供的用户-视频行为图;

图2-b是本发明实施例提供的联合推荐信息图;

图3是本发明实施例三提供的视频推荐装置的结构示意图;

图4是本发明实施例四提供的视频推荐装置的结构示意图;

图5是本发明实施例五提供的视频推荐装置的结构示意图;

图6-a是本发明实施例六提供的视频推荐装置的结构示意图;

图6-b是本发明实施例七提供的视频推荐装置的结构示意图;

图6-c是本发明实施例八提供的视频推荐装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供一种视频推荐方法,所述方法包括:构建联合推荐信息图,所述联合推荐信息图包括用户集合、视频集合、联合推荐信息集合、用户集合中元素与视频集合中元素构成的第一类边、视频集合中元素与联合推荐信息集合中元素构成的第二类边以及用户集合中元素与联合推荐信息集合中元素构成的第三类边,所述联合推荐信息集合包括时间段和视频类型;计算所述第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C;根据所述 WU,I、WI,C和WU,C并通过随机游走所述联合推荐信息图,获取推荐请求集合中的用户对视频集合中的视频的访问概率,以针对每个用户生成对应的视频推荐列表,所述推荐请求集合包括所述用户集合中元素和联合推荐信息集合中元素;向用户推荐对应视频推荐列表中的视频。本发明实施例还提供相应的视频推荐装置。以下分别进行详细说明。

请参阅附图1,是本发明实施例一提供的视频推荐方法的实现流程示意图,主要包括以下步骤S101至步骤S104,详细说明如下:

S101,构建联合推荐信息图。

在本发明实施例中,联合推荐信息图实际上是在用户-视频行为图的基础上增加了联合推荐信息集合中的元素而来,即,首先根据用户对视频的历史评分记录,构建用户-视频行为图,如附图2-a所示。用户-视频行为图中的节点由用户集合中的元素和视频集合中的元素组成,即,用户集合中的每个元素和视频集合中的每个元素构成用户-视频行为图的节点。为了描述方便,下文中对用户集合中的元素构成的用户-视频行为图的节点称为用户节点,对视频集合中的元素构成的用户-视频行为图的节点称为视频节点。在构建成用户-视频行为图后,从联合推荐信息数据库选取时间段和视频类型,例如,选取4个时间段(全天按照6个小时划分为4段)与19个视频类型节点(按照视频内容定义的类型,可根据实际情况进行修改)作为联合推荐信息集合中的元素。这些联合推荐信息集合中的元素可作为联合推荐信息节点添加至附图2-a示例的用户-视频行为图中,随后,在添加视频节点与联合推荐信息节点之间的边以及用户节点与联合推荐信息节点之间的边之后,构成如附图2-b示例的联合推荐信息图。因此,本发明实施例提供的联合推荐信息图包括用户集合、视频集合、联合推荐信息集合、用户集合中元素即用户节点与视频集合中元素即视频节点构成的第一类边、视频集合中元素即视频节点与联合推荐信息集合中元素即联合推荐信息节点构成的第二类边以及用户集合中元素即用户节点与联合推荐信息集合中元素即联合推荐信息节点构成的第三类边,而联合推荐信息集合包括时间段和视频类型。由于联合推荐信息集合包括时间段和视频类型这两种元素,因此,第二类边包括视频节点和时间段节点之间的边以及视频节点和视频类型节点之间构成的边。

S102,计算第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C。

对于附图2-b示例的联合推荐信息图,第一类边即用户节点与视频节点构成的边的权值WU,I由用户对视频的评分(通常在1至5分的区间)确定,用户对视频的评分越高,则第一类边的权值WU,I越大,表示用户对该视频的感兴趣程度越大。第二类边即视频节点与联合推荐信息节点构成的边的权值WI,C与用户对视频的评分息息相关,并会随着用户对视频行为的加入动态地发生变化。的权值WI,C计算公式如下:

其中,Su,i,t表示用户u在t时刻对视频i产生的评分行为,其值表示表示用户u在t时刻对视频i的评分,C(Su,i,t)表示评分行为Su,i,t产生时的联合推荐信息集合,nt-1表示包括t-1时刻在内的之前已经发生过拥有联合推荐信息c的行为的次数,nt表示包括t时刻在内的之前已经发生过拥有联合推荐信息c的行为的次数。

第三类边即即用户节点与联合推荐信息节点构成的边的权值WU,C相对要复杂,在本发明实施例中,其一种计算方法是:结合时间衰减模型,根据用户对视频评分发生的时间计算第三类边的权值WU,C。在给出WU,C的具体计算方法之前,先做一个基本假设,即,假设用户的每条历史行为中,用户对视频的评分也能表达用户对于发生这条行为所附带的联合推荐信息的偏好,定义对于用户的每一条评分行为Su,i,t∈S(u,i,t)都拥有一个联合推荐信息集合C(Su,i,t)并且为每个用户维护一个对出现过的所有联合推荐信息的偏好向量P(U,C),p(u,c)∈P(U,C)表示用户u对联合推荐信息c的偏好程度。为了使联合推荐信息图中节点之间边的权值处于一个合理的计算范围内,需要约束用户对联合推荐信息的偏好程度与用户对视频的评分处于一个合理区间内。

具体地,结合时间衰减模型,根据用户对视频评分发生的时间计算第三类边的权值WU,C包括如下步骤S1021至S1023:

S1021,模拟人类对历史行为的遗忘规律,采用引入了时间遗忘因子的评分值代替用户对视频的历史评分值,得到用户对该视频新的评分值。

在本发明实施例中,时间遗忘因子为其中,δ为遗忘系数,并且0<δ<1,t为当前时刻,t0为初始时刻,tm为最终时刻。从时间遗忘因子oblivion(t)的表达式可知,随着时刻t的推移,遗忘因子oblivion(t)逐渐变小。

可以将用户对视频的历史行为即对视频的历史评分按照时间升序来排列,将每个不同时间点作为一个新的时刻来处理。

对于用户新产生的评分行为Su,i,t,利用时间遗忘因子计算其经过时间衰减后用户对视频的评分ST(u,i,t)为:

ST(u,i,t)=S(u,i,t)*oblivion(t).................公式(2)

上述公式(2)中,S(u,i,t)为用户对视频发生评分行为Su,i,t时的评分值;ST(u,i,t)即为用户对该视频新的评分值。

需要说明的是,若考虑多用户的评分行为,用户对视频新的评分值即 ST(u,i,t)将是经过多行为归一化方法后的用户对该种行为的行为配比,然后把该配比做时间衰减。

S1022,将经由步骤S1021得到的视频新的评分值更新至用户联合推荐信息偏好向量中对应用户对联合推荐信息的偏好值。

即,对于用户对视频新产生的评分行为Su,i,t附带的联合推荐信息集合C(Su,i,t)中的每一个联合推荐信息c∈C(Su,i,t),将经过时间衰减后的用户对该视频新的评分值ST(u,i,t),分别更新到用户对联合推荐信息的偏好向量P(U,C)中对应的每一个p(u,c)中。例如,用户在成都晚上9点为一部爱情电影评分了4分,那么该条行为所附带的联合推荐信息包括观影地点成都、观影时间晚上9点、视频类型为爱情等,在为该用户所维护的所有偏好向量中找到这三条联合推荐信息,并为用户对这三条联合推荐信息的偏好值中注入评分4分的偏好。

S1023,归一化用户对联合推荐信息的偏好值,将归一化后的用户对联合推荐信息的偏好值作为第三类边的权值WU,C。

S103,根据第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C并通过随机游走联合推荐信息图,获取推荐请求集合中的用户对视频集合中的视频的访问概率,以针对每个用户生成对应的视频推荐列表,其中,推荐请求集合包括用户集合中元素和联合推荐信息集合中元素。

作为本发明一个实施例,根据第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C并通过随机游走联合推荐信息图,获取推荐请求集合中的用户对视频集合中的视频的访问概率,以针对每个用户生成对应的视频推荐列表可通过如下步骤S1031和步骤S1032得到:

S1031,分别以推荐请求集合中每个节点作为起始点,在联合推荐信息图上随机游走,并计算每一轮随机游走后推荐请求集合中每个节点对联合推荐信息图中其他节点的访问概率,当判断节点的访问概率达到收敛时结束游走,其中,节点为推荐请求集合中的元素。

S1032,将推荐请求集合中每个节点对联合推荐信息图中其他节点的访问概率相加,得到推荐请求集合对联合推荐信息图中其他节点的访问概率,生成每个用户对应的视频推荐列表。

具体地,步骤S1031和步骤S1032包括如下步骤S’1031至步骤S’1034:

S’1031,生成推荐请求集合。

联合推荐利用了图模型强大的信息包容力,将联合推荐信息图中多个节点组合起来进行推荐,来模拟用户在不同联合推荐信息下的实际需求,将目标用户和联合推荐信息组合起来构成推荐请求集合,推荐请求集合可以理解为联合推荐信息图中的用户节点和联合推荐信息节点构成的集合。

S’1032,在考虑了时间衰减因素的联合推荐信息图上,采用随机游走的方式来获取推荐请求集合Q中每个节点q∈Q对联合推荐信息图中其他节点的访问概率,以节点q为出发点,每游走到一个节点时以概率β选择一个邻居节点继续游走,以1-β的概率返回节点q重新开始新一轮的游走,单次随机游走时节点q∈Q对联合推荐信息图中其他节点的访问概率PR(v)的计算公式表示如下:

其中,β为设定的重启概率,其值一般为0.85,in(v)为与视频v相关联的联合推荐信息集合,out(v’)为视频v未关联的联合推荐信息集合,vq表示初始节点,即算法输入时的推荐请求集合节点。

S’1033,得到推荐请求集合Q中每个节点q对联合推荐信息图中其他节点的访问概率后,将这些访问概率相加,得到推荐请求集合Q对联合推荐信息图中其他视频节点的访问概率u(Q),u(Q)的计算公式如下:

上述公式(5)中,n表示联合推荐信息图中所有节点个数总和,I表示视频集合,i表示每个视频节点,表示节点q对其他视频节点的访问概率。

S’1034,将推荐请求集合Q中用户已经评分过的视频剔除,剩余的视频按照u(Q)中的访问概率降序排列,取出前N个视频生成针对每个用户的视频推荐列表。

S104,向用户推荐对应视频推荐列表中的视频。

从上述附图1示例的视频推荐方法可知,所构建的联合推荐信息图不仅包含用户集合、视频集合及其边,而且包含联合推荐信息集合以及与其他集合的边,推荐请求集合中的用户对视频集合中的视频的访问概率是根据这些边的权值计算得到。由于考虑了除用户对视频评分之外的因素,因此,综合这些因素得到的视频推荐结果更加合理,能够为用户推荐更接近其需求、兴趣爱好等方面的视频。

请参阅附图3,是本发明实施例三提供的视频推荐装置的结构示意图。为了便于说明,附图3仅示出了与本发明实施例相关的部分。附图3示例的视频推荐装置可以是附图1示例的视频推荐方法的执行主体。附图3示例的视频推荐装置主要包括构建模块301、边权值计算模块303、访问概率获取模块303和推荐模块304,其中:

构建模块301,用于构建联合推荐信息图,所述联合推荐信息图包括用户集合、视频集合、联合推荐信息集合、用户集合中元素与视频集合中元素构成的第一类边、视频集合中元素与联合推荐信息集合中元素构成的第二类边以及用户集合中元素与联合推荐信息集合中元素构成的第三类边,所述联合推荐信息集合包括时间段和视频类型;

边权值计算模块302,用于计算第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C;

访问概率获取模块303,用于根据WU,I、WI,C和WU,C并通过随机游走联合推荐信息图,获取推荐请求集合中的用户对视频集合中的视频的访问概率,以针对每个用户生成对应的视频推荐列表,所述推荐请求集合包括所述用户集合中元素和联合推荐信息集合中元素;

推荐模块304,用于向用户推荐对应视频推荐列表中的视频。

需要说明的是,以上附图3示例的视频推荐装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将所述视频推荐装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,前述的构建模块,可以是具有执行前述构建联合推荐信息图的硬件,例如构建器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备;再如前述的边权值计算模块,可以是执行计算第一类边的权值WU,I、第二类边的权值WI,C和第三类边的权值WU,C的硬件,例如边权值计算器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备(本说明书提供的各个实施例都可应用上述描述原则)。

附图3示例的边权值计算模块302可以包括第三类边权值计算单元401,如附图4所示本发明实施例四提供的视频推荐装置。第三类边权值计算单元401用于结合时间衰减模型,根据用户对视频评分发生的时间计算所述第三类边的权值WU,C。

附图4示例的第三类边权值计算单元401可以包括评分值重计算单元501、更新单元502和归一化单元503,如附图5所示本发明实施例五提供的视频推荐装置,其中:

评分值重计算单元501,用于模拟人类对历史行为的遗忘规律,采用引入了时间遗忘因子的评分值代替用户对视频的历史评分值,得到视频新的评分值,其中,时间遗忘因子为δ为遗忘系数,并且0<δ<1,t为当前时刻,t0为初始时刻,tm为最终时刻;

更新单元502,用于将视频新的评分值更新至用户联合推荐信息偏好向量中对应用户对联合推荐信息的偏好值;

归一化单元503,用于归一化用户对联合推荐信息的偏好值,将所述归一化后的用户对联合推荐信息的偏好值作为第三类边的权值WU,C。

附图3至5任一示例的访问概率获取模块303可以包括游走单元601和求和单元602,如附图6-a至附图6-c所示本发明实施例六至实施例八提供的视频推荐装置,其中:

游走单元601,用于分别以所述推荐请求集合中每个节点作为起始点,在所述联合推荐信息图上随机游走,并计算每一轮随机游走后所述推荐请求集合中每个节点对所述联合推荐信息图中其他节点的访问概率,当判断节点的访问概率达到收敛时结束游走,所述节点为所述推荐请求集合中的元素;

求和单元602,用于将所述推荐请求集合中每个节点对所述联合推荐信息图中其他节点的访问概率相加,得到所述推荐请求集合对所述联合推荐信息图中其他节点的访问概率,生成每个用户对应的视频推荐列表。

需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。

以上对本发明实施例所提供的视频推荐方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1