一种视频推荐的方法、系统及电子设备与流程

文档序号:11829981阅读:209来源:国知局
一种视频推荐的方法、系统及电子设备与流程
本发明属于信息处理
技术领域
,尤其涉及一种视频推荐的方法、系统及电子设备。
背景技术
:个性化推荐系统是基于用户个性化需求而产生的新型推荐系统。推荐算法是推荐系统研究最核心的模块,它的优劣会直接影响到推荐系统整体的性能。目前最流行的推荐算法是基于内容、基于协同过滤、基于关联规则的推荐算法,以及这几种推荐的结合体。这些推荐算法都是以描述用户兴趣为出发点,通过不同的搜索策略,最后着力于对用户未来兴趣的预测。但这些推荐算法在实际的应用中也存在着一些问题:(1)、稀疏问题。当一个用户浏览过一个系统很少的对象或很少进行操作与评价时,用户的行为数据就会变得很稀疏,而利用此类数据去计算用户之间的相似性是不可靠的。(2)、常用推荐算法对于越是热门的视频,它的推荐度就越大,但并非越是热门的视频,用户就一定会喜欢。例如有一部热门电影,有可能是该部影片的前期营销宣传活动做得很成功,但影片本身质量并不优秀,并不是用户所希望观看的。根据长尾理论,用户对于视频的关注度也存在此效应,传统的推荐算法对热门资源的推荐度较高,但这种资源其实是不需要推荐的,用户通过其他的渠道(媒体、报纸报道等)也可以快速获知,但有可能用户真正感兴趣的视频却被忽略掉了。(3)、用户的兴趣是在时刻变化的,随着时间用户的兴趣会发生转移,如果系统不能动态跟踪用户的行为数据,实时进行更新就会导致系统推荐的产品 并不是用户感兴趣的,使得系统的性能下降。技术实现要素:本发明实施例提供了一种视频推荐的方法、系统,旨在解决现有的推荐算法所存在的问题,提高推荐系统的覆盖度,提升推荐内容的多样性以及新颖性,提升用户满意度和用户粘性。一方面,提供一种视频推荐的方法,所述方法包括:根据用户与视频的关系矩阵A构建用户-视频二分图,所述二分图中包括n个用户节点和m个视频节点,若用户ui观看过视频vj,则用户节点ui与视频节点vj之间用一条边连接,其中,i∈[1,n],j∈[1,m];基于随机漫步的PR算法,计算所述二分图中的用户ui对所述m个视频节点的访问概率;根据所述关系矩阵A,剔除用户ui观看过的视频,得到用户ui对未观看的视频的访问概率;对所述用户ui对未观看的视频的访问概率进行排序,将访问概率最高的前N个视频推荐给用户ui。进一步地,在所述基于随机漫步的PR算法中,根据下述公式计算所述二分图中的用户ui对于所述m个视频节点的访问概率:PR(v)=βΣv′∈in(v)PR(v′)|out(v′)|(v≠vn)βΣv′∈in(v)PR(v′)|out(v′)|+(1-β)(v=vn)]]>公式1其中,β为设定的重启概率,ν是初始的游走点,v'是下一个游走点,vn表示用户观看过的视频节点,in(v)为用户ui已经观看过的视频集合,out(v')除in(v)以外的其他视频集合。进一步地,所述基于随机漫步的PR算法,计算所述二分图中的用户ui对于所述m个视频节点的访问概率,包括:计算所述二分图中的n个用户对于所述m个视频节点的转移概率矩阵W(v,v');其中,W(v,v')满足下述公式:W(v,v′)=1|out(v′)|]]>公式2根据公式3计算得到用户ui对所述m个视频节点的访问概率矩阵,其中,根据所述公式1和所述公式2得到公式3,公式3如下:PR(v')=(1-β)(1-βWT)-1PR(v)公式3根据所述访问概率矩阵得到用户ui对所述m个视频节点的访问概率。进一步地,所述关系矩阵A满足如下公式:A=|αij|其中,αij=1表示用户ui观看过视频vj,否则αij=0。另一方面,提供一种视频推荐的系统,所述系统包括:二分图构建单元,用于根据用户与视频的关系矩阵A构建用户-视频二分图,所述二分图中包括n个用户节点和m个视频节点,若用户ui观看过视频vj,则用户节点ui与视频节点vj之间用一条边连接,其中,i∈[1,n],j∈[1,m];第一访问概率计算单元,用于基于随机漫步的PR算法,计算所述二分图中的用户ui对所述m个视频节点的访问概率;第二访问概率计算单元,用于根据所述关系矩阵A,剔除用户ui观看过的视频,得到用户ui对未观看的视频的访问概率;推荐单元,用于对所述用户ui对未观看的视频的访问概率进行排序,将访问概率最高的前N个视频推荐给用户ui。进一步地,所述第一访问概率计算单元基于随机漫步的PR算法,根据下述公式计算所述二分图中的用户ui对于所述m个视频节点的访问概率:PR(v)=βΣv′∈in(v)PR(v′)|out(v′)|(v≠vn)βΣv′∈in(v)PR(v′)|out(v′)|+(1-β)(v=vn)]]>公式1其中,β为设定的重启概率,ν是初始的游走点,v'是下一个游走点,vn表示用户观看过的视频节点,in(v)为用户ui已经观看过的视频集合,out(v')除in(v)以外的其他视频集合。进一步地,第一访问概率计算单元包括:转移概率矩阵计算模块,用于计算所述二分图中的n个用户对于所述m个视频节点的转移概率矩阵W(v,v');其中,W(v,v')满足下述公式:W(v,v′)=1|out(v′)|]]>公式2访问概率矩阵计算模块,用于根据公式3计算得到用户ui对所述m个视频节点的访问概率矩阵,其中,根据所述公式1和所述公式2得到公式3,公式3如下:PR(v')=(1-β)(1-βWT)-1PR(v)公式3访问概率计算模块,用于根据所述访问概率矩阵得到用户ui对所述m个视频节点的访问概率。进一步地,所述关系矩阵A满足如下公式:A=|αij|其中,αij=1表示用户ui观看过视频vj,否则αij=0。再一方面,提供一种电子设备,所述电子设备包括如上所述的视频推荐的系统。进一步地,所述电子设备是数字电视、智能手机或者平板电脑。在本发明实施例,相比现有的视频推荐的方法,具有以下优点:(1)不需要像协同过滤算法去计算出各个视频之间或各个用户之间的相似度,也不需要像基于内容的推荐算法去分析文本内容及相关领域的知识进行共同计算;(2) 只考虑做了选择的用户以及未选择的待推荐的对象,所以对数据的稀疏性不敏感,而且计算量相对较小;(3)当有新的用户或对象信息添加进来时,通过迭代计算使得系统快速达到新的平衡状态,具有较好的可扩展性;(4)通过用户与视频关联的网络结构,该系统会具备较高的覆盖率,同时推荐结果具备一定的多样性,能给用户带来惊喜。附图说明图1是本发明实施例一提供的视频推荐的方法的实现流程图;图2实施例一提供的视频推荐的方法中,用户A、B、C和视频a、b、c、d构成的用户-视频二分图的示意图;图3示出图2所示的二分图分配资源的过程示意图;图4是本发明实施例二提供的视频推荐的系统的结构框图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。在本发明实施例中,先根据用户与视频的关系矩阵A构建用户-视频二分图,再基于随机漫步的PR算法,计算所述二分图中的用户ui对m个视频节点的访问概率,然后根据所述关系矩阵A,剔除用户ui观看过的视频,得到用户ui对未观看的视频的访问概率,最后对所述用户ui对未观看的视频的访问概率进行排序,将访问概率最高的前N个视频推荐给用户ui。以下结合具体实施例对本发明的实现进行详细描述:实施例一图1示出了本发明实施例一提供的视频推荐的方法的实现流程,详述如下:在步骤S101中,根据用户与视频的关系矩阵A构建用户-视频二分图,所述二分图中包括n个用户节点和m个视频节点,若用户ui观看过视频vj,则用户节点ui与视频节点vj之间用一条边连接,其中,i∈[1,n],j∈[1,m]。在本发明实施例中,在一个由n个用户和m个视频组成的视频推荐的系统中,用户节点和视频节点之间的关系可以用一个关系矩阵A=|αij|来描述,其中,αij=1表示用户ui观看过视频vj,否则αij=0。根据用户与视频的关系矩阵构建的用户-视频二分图中包括n个用户节点和m个视频节点,若用户ui观看过视频vj,则用户节点ui与视频节点vj之间用一条边连接,其中,i∈[1,n],j∈[1,m]。具体的,构建二分图的过程如下:若根据用户与视频的关系矩阵中的αij的值判断得到用户ui观看过视频vj,则将用户ui与视频vj之间用一条边连接,这代表了用户ui与视频vj之间直接关联,以此类推,当所有用户对应的用户节点与已经观看过的视频对应的视频节点之间用边连接完毕后,形成一个网格关系,这个网格关系可以称作用户-视频二分图G(U,V,E),其中用户集合为Ui,i∈[1,n];视频集合为Vj,j∈[1,m],E为边。请参见图2,在图2中示出了用户A、B、C和视频a、b、c、d构成的用户-视频二分图,其中用户A已经观看过视频a和c,则用户A与视频a和c均连接;用户B已经观看过视频a、b、c和d,则用户B与视频a、b、c和d均连接;用户C已经观看过视频c和d,则用户C与视频c和d均连接。在步骤S102中,基于随机漫步的PR算法,计算所述二分图中的用户ui对于所述m个视频节点的访问概率。在本发明实施例中,假设要对用户ui进行个性化视频推荐,则执行以下步骤:步骤1、从用户ui对应的视频节点vn开始在用户与视频的邻接矩阵A上进行随机漫步;步骤2、漫步到任何一个视频节点时,首先按照概率β进行判定,是继续漫步,还是停止此次漫步而是从vn节点重新开始漫步。如果继续漫步,则从当前节点指向的节点中按照均匀分布原则随机选择一个节点作为下次漫步经过的节点;步骤3、如此反复,经过多次漫步之后,每一个视频节点被访问到的概率会收敛到一个数,而这个数就是视频节点的访问概率PR值,PR值可以作为推荐列表中视频的权重而加以应用。上述说明可以用公式1表示如下:PR(v)=βΣv′∈in(v)PR(v′)|out(v′)|(v≠vn)βΣv′∈in(v)PR(v′)|out(v′)|+(1-β)(v=vn)]]>公式1其中,β为设定的重启概率,一般为0.85,ν是初始的游走点,v'是下一个游走点,vn表示用户观看过的视频节点,in(v)为用户ui已经观看过的视频集合,out(v')除in(v)以外的其他视频集合。比如,图2中,针对用户A,in(v)为视频a和c,out(v')为b和d。其中,基于随机漫步的PR算法,计算二分图中的用户ui对于m个视频节点的访问概率的过程如下:将计算每个节点PR值的过程可以看作是一个资源分配的过程,假设每个视频有相应的资源,然后将资源通过边分配给直接相关的每个用户,每个用户再把其收集到的资源再分配给与他直接相关的每个视频,这里定义用户与视频之间的边是没有权重的,可以看作是平均分配。图3示出了对一个由用户A、B、C和视频a、b、c、d构成的二分图分配资源的过程。在图3中,A、B、C为3个用户组成的用户集合,a、b、c、d为4个视频组成的视频集合,其中各个视频对应的资源量分别为x、y、z、s。第一步、将视频集合沿着边分配给用户,每个边的权重均相等,可以得出 每个用户分配的资源量A=1/2x+1/2s,B=y+1/2z+1/2s,C=1/2x+1/2z。第二步、为资源的返流,将用户的资源通过边等分配给每个视频,可以得到各个视频重新分配后的资源值:x′=1/2x+1/4z+1/4s,y′=1/3y+1/6z+1/6s,z′=1/4x+1/3y+5/12z+1/6s,s′=1/4x+1/3y+1/6z+5/12s。这个过程可以用转移概率矩阵的形式表示如下:x′y′z′s′=1/201/41/401/31/61/61/41/35/121/61/41/31/65/12*xyzs]]>其中,1/201/41/401/31/61/61/41/35/121/61/41/31/65/12]]>为求得的转移概率矩阵。资源量的计算是基于在二分图上进行资源流动分配模拟得出的,将二分图中的所有顶点看作是一个个的状态点,整个的无向二分图就可以看作是一个马尔科夫链式随机过程,资源的分配过程就是马尔科夫过程的状态迁移。因为在所构建的二分图中,每一个用户都是有做出选择的,每一个待推荐的对象也都是已经被选择的,并且这种选择与被选择的关系则是通过边来表示的,因此可以得出各个点都是有边相连通的,也就是说资源是可以流动到达的。该马尔科夫链是状态可达的有限自动机,具有各态遍历性。依定理:各态遍历的有限状态的马尔科夫链,有且仅有一个平稳的分布wP=w。其中P表示马尔科夫链中各个状态之间的转移概率矩阵。在资源流动的过程中,短周期内的资源总量是保持不变的,资源的扩散最终会趋向于一个平衡的状态,并且该状态只与二分图的结构有关。依据上面介绍的求解过程,可以将对视频访问概率的求解过程转换为对转移概率矩阵的转换过程。令W(v,v')用户-视频二分图中n个用户对于m个视频节点的转移概率矩阵,W(v,v')满足下述公式:W(v,v′)=1|out(v′)|]]>公式2再根据所述公式1和所述公式2先得到公式PR(v')=(1-β)PR(v)+βWTPR(v'),在对该公式进行处理,得到公式3;PR(v')=(1-β)(1-βWT)-1PR(v)公式3然后根据公式3计算得到用户ui对于所述m个视频节点的访问概率矩阵,最后根据所述访问概率矩阵得到用户ui对于所述m个视频节点的访问概率。举例如下:用户集U={A,B,C},视频集V={a,b,c,d},用户的行为数据集由一个个(u,v)二元组组成,表示为用户u对视频v产生过观看行为,用户与视频的二分图如图2所示,根据对图3所示的二分图求矩阵的方法,可以得到图2所示的二分图中的3个用户对于4个视频节点的转移概率矩阵W=3/81/41/41/81/81/41/121/83/81/45/123/81/81/41/43/8,]]>则WT=3/81/83/81/81/41/41/41/41/41/125/121/41/81/83/83/8.]]>针对用户A,根据图2所示的二分图,可以得到PR(A)=1010,]]>根据公式PR(A')=(1-β)(1-βWT)-1PR(A)以及预设的β=0.85,可以得到PR(A′)=0.6710.1700.8280.331,]]>PR(A')为用户A对视频集{a,b,c,d}的访问概率矩阵。通过该访问概率矩阵可以得到用户A对视频a、b、c和d的访问概率分别为0.671,0.170,0.828和0.331。在步骤S103中,根据所述用户和视频的关系矩阵,剔除用户ui观看过的视频,得到用户ui对于未观看的视频的访问概率。在本发明实施例中,根据用户和视频的关系矩阵,可以得出用户A已经观看过视频a和视频c,未观看的视频为视频b和视频d,可以得到用户A对视频b和视频d的访问概率分别为0.170和0.331。在步骤S104中,对所述访问概率进行排序,将访问概率最高的前N个视频推荐给用户ui。在本发明实施例中,如步骤S103中所述,显然视频d的访问概率大于视频b的访问概率,则将视频d优先推荐给用户A,推荐给用户A的视频列表为{d,b}。其中N为预设的大于1的自然数。本实施例,先根据用户与视频的关系矩阵A构建用户-视频二分图,再基于随机漫步的PR算法,计算所述二分图中的用户ui对m个视频节点的访问概率,然后根据所述关系矩阵A,剔除用户ui观看过的视频,得到用户ui对未观看的视频的访问概率,最后对所述用户ui对未观看的视频的访问概率进行排序,将访问概率最高的前N个视频推荐给用户ui。相比现有的视频推荐的方法,具有以下优点:(1)不需要像协同过滤算法去计算出各个视频之间或各个用户之间的相似度,也不需要像基于内容的推荐算法去分析文本内容及相关领域的知识进行共同计算;(2)只考虑做了选择的用户以及未选择的待推荐的对象,所以对数据的稀疏性不敏感,而且计算量相对较小;(3)当有新的用户或对象信息添加进来时,通过迭代计算使得系统快速达到新的平衡状态,具有较好的可扩展性;(4)通过用户与视频关联的网络结构,该系统会具备较高的覆盖率,同时推荐结果具备一定的多样性,能给用户带来惊喜。本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘或光盘等。实施例二图4示出了本发明实施例二提供的视频推荐的系统的具体结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。该视频推荐的系统可以是内置于电子设备中的软件单元、硬件单元或者软硬件结合的单元,该电子设备可以 是数字电视、智能手机或者平板电脑。该视频推荐的系统4包括:二分图构建单元41、第一访问概率计算单元42、第二访问概率计算单元43和推荐单元44。其中,二分图构建单元41,用于根据用户与视频的关系矩阵A构建用户-视频二分图,所述二分图中包括n个用户节点和m个视频节点,若用户ui观看过视频vj,则用户节点ui与视频节点vj之间用一条边连接,其中,i∈[1,n],j∈[1,m];第一访问概率计算单元42,用于基于随机漫步的PR算法,计算所述二分图中的用户ui对所述m个视频节点的访问概率;第二访问概率计算单元43,用于根据所述关系矩阵A,剔除用户ui观看过的视频,得到用户ui对未观看的视频的访问概率;推荐单元44,用于对所述用户ui对未观看的视频的访问概率进行排序,将访问概率最高的前N个视频推荐给用户ui。具体的,所述第一访问概率计算单元42基于随机漫步的PR算法,根据下述公式计算所述二分图中的用户ui对于所述m个视频节点的访问概率:PR(v)=βΣv′∈in(v)PR(v′)|out(v′)|(v≠vn)βΣv′∈in(v)PR(v′)|out(v′)|+(1-β)(v=vn)]]>公式1其中,β为设定的重启概率,ν是初始的游走点,v'是下一个游走点,vn表示用户观看过的视频节点,in(v)为用户ui已经观看过的视频集合,out(v')除in(v)以外的其他视频集合。具体的,所述第一访问概率计算单元42包括:转移概率矩阵计算模块,用于计算所述二分图中的n个用户对于所述m个视频节点的转移概率矩阵W(v,v');其中,W(v,v')满足下述公式:W(v,v′)=1|out(v′)|]]>公式2访问概率矩阵计算模块,用于根据公式3计算得到用户ui对所述m个视频 节点的访问概率矩阵,其中,根据所述公式1和所述公式2得到公式3,公式3如下:PR(v')=(1-β)(1-βWT)-1PR(v)公式3访问概率计算模块,用于根据所述访问概率矩阵得到用户ui对所述m个视频节点的访问概率。具体的,所述关系矩阵A满足如下公式:A=|αij|其中,αij=1表示用户ui观看过视频vj,否则αij=0。本发明实施例提供的视频推荐的系统4可以应用在前述对应的方法实施例一中,详情参见上述实施例一的描述,在此不再赘述。值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1