直播间推荐方法、计算机可读存储介质及电子设备与流程

文档序号:15446006发布日期:2018-09-14 23:22阅读:180来源:国知局

本发明涉及大数据推荐领域,尤其涉及一种基于观看路径的直播间推荐方法。



背景技术:

随着直播平台的发展,直播平台上的直播间越来越多,用户想从众多的直播间中选择一个自己喜欢的看的直播间变得更加困难,如何为用户推荐直播间成为了目前急需解决的问题。目前常用的向用户推荐直播间的方法是热播榜推荐,也就是向用户推荐一段时间内直播网站里按照受欢迎程度排序的主播的榜单。这种方法的缺点是没有考虑到用户的个性化需求,其对新用户具有一定的效果,但对于老用户不仅不能满足用户的需求,还会让用户觉得反感。

事实上,用户在直播平台上对直播间的观看行为是存在先后顺序的,每个用户都有一条属于自己的直播间观看路径,该路径表面上反映了用户观看直播间的时间顺序,但是从更深层次的角度来看,观看路径代表了用户的观看喜好,往往相似的直播间观看的时间间隔会很小,所以用户的观看路径是一个值得挖掘的信息。



技术实现要素:

基于上述思路,为了克服上述问题的至少一个方面,本发明实施例提供一种直播间推荐方法,通过用户的观看路径来确定直播间之间的权重,进而确定直播间之间的相似度,再根据用户的观看记录对用户进行个性化的推荐。

根据本发明的一个方面,提供一种直播间推荐方法,包括如下步骤:

步骤s1,根据观看记录,对直播平台上的每个用户在预设时间内观看的直播间按照时间顺序进行排序;

步骤s2,获取直播平台中所有被观看过的直播间集合r,计算直播间集合r中的任意两个直播间之间的权重值;

步骤s3,根据任意两个直播间之间的权重值计算任意两个直播间之间的相似度值;

步骤s4,对于直播间集合r中的任一源直播间而言,将与任一源直播间相似的直播间按照相似度值由大到小的顺序排列在源直播间的推荐列表中;以及

步骤s5,获取用户最后观看的直播间作为上述源直播间,将源直播间的推荐列表中的处于开播状态的直播间依次推荐给用户。

根据一些实施例,在步骤s1之前还包括步骤:删除每个用户在预设时间内单次观看时间小于或等于预定时间的直播间的观看记录。

根据一些实施例,根据下式计算直播间集合r中的任意两个直播间之间的权重值:

其中,wfb是直播间f到直播间b的权重值,m(f)是观看了直播间f的人数,m(f→b)是观看了直播间f后继续观看直播间b的人数。

根据一些实施例,在步骤s2和步骤s3之间还包括以下步骤:获取直播间b的直接关联直播间集合n(b),直接关联直播间集合n(b)指的是所有用户在观看直播间b之前所观看的紧邻的直播间的集合。

根据一些实施例,根据下式计算两个直播间之间的相似度值:

其中,sim(a,b)是直播间a和b的相似度值;α是传导衰减因子,α的取值范围是0.8~0.9;k是迭代轮次,k是正整数,取值范围为10~20;n(b)是直播间b的直接关联直播间集合;wib是直播间b的直接关联直播间i到直播间b的权重值;wib是直播间b的直接关联直播间j到直播间b的权重值;sim(a,i)0=wai,sim(a,a)0=1。

根据本发明的另一个方面,提供一种计算机可读存储介质,其上存储有可执行指令,指令在由处理器执行时,可以实现根据上述实施例中的任一项的直播间推荐方法的步骤。

根据本发明的又一个方面,提供一种电子设备,其包括:

存储器,用于存储可执行指令;以及

处理器,用于执行存储器中存储的可执行指令,以实现根据上述实施例中的任一项的直播间推荐方法的步骤。

与现有技术相比,本发明具有以下优点:通过用户的观看路径来确定直播间之间的权重,进而确定直播间之间的相似度,再根据用户的观看记录对用户进行个性化的推荐,提高了推荐的准确性,并且最大程度上保证推荐的直播间是用户喜欢观看的直播间。

附图说明

通过下文中参照附图对本发明所作的描述,本发明的其它目的和优点将显而易见,并可帮助对本发明有全面的理解。

图1是实施根据本发明实施例的直播间推荐方法的整体流程图;

图2是根据本发明实施例的计算机可读存储介质的结构示意图;

图3是根据本发明实施例的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。

本发明提供一种直播间推荐方法,根据图1所示,该方法包括以下步骤:

s1,根据观看记录,对直播平台上的每个用户在预设时间内观看的直播间按照时间顺序进行排序。

直播平台上的每个用户观看直播间都会产生记录,这些记录都保存在数据库中,将每个用户在预设时间内的观看记录从数据库中调取出来,这个预设时间是可以自定义的,例如,在本实施例中预设时间可以是7天。当然,在其他实施例中,也可以是其他时间长度,比如可以为更长的时间长度,例如30天,还可以是较短的时间长度,例如数小时。然后,将记录上的直播间按照时间顺序排序,时间越早的直播间可以排在越前面。

在一些可能的实施例中,在进行上述步骤之前,还可以进行如下步骤:删除每个用户在预设时间内单次观看时间小于或等于预定时间的直播间的观看记录。用户观看时间小于或等于预定时间的观看行为可能只是不小心点到该直播间或者其他某些类似的行为,并不是真正观看了该直播间或者对该直播间有兴趣,这个步骤是为了保留有效的观看行为,减小数据的误差,从而最大化地保证数据的准确性。这个预定时间也是可以自定义的,为了减小误差,在本实施例中可以设定预定时间为1分钟。

s2,获取直播平台中所有被观看过的直播间集合r,计算直播间集合r中的任意两个直播间之间的权重值。

在预设时间内,可能有些直播间没有被用户观看过,这些未被用户观看过的直播间将无法计算与其他直播间之间的相似度,为了减少计算量,需要排除这些未被观看过的直播间。从数据库中获取直播平台上所有被用户观看过的直播间,将这些直播组成一个集合r,计算直播间集合r中的任意两个直播间之间的权重值,例如,可以根据下式计算直播间集合r中的直播间f和直播间b之间的权重值:

其中,wfb是直播间f到直播间b的权重值,m(f)是观看了直播间f的人数,m(f→b)是观看了直播间f后直接继续观看直播间b的人数。权重值,可以是指用户观看了直播间f后接着观看直播间b的概率。权重值越大,说明概率越高,也就说明用户在观看了直播间f后接着观看直播间b的概率越高。这在一定程度上反映了直播间f和直播间b的关联性,概率越高,说明直播间f和直播间b的关联性越大。

在一些可能的实施例中,在计算完集合r中任意两个直播间之间的权重值后还包括如下步骤:获取直播间b的直接关联直播间集合n(b),直接关联直播间集合n(b)指的是所有用户在观看直播间b之前所观看的紧邻的直播间的集合。这里的“紧邻”是指用户观看完该直播间后直接观看直播间b,在观看该直播间和观看直播间b之间没有观看其他直播间。

s3,根据任意两个直播间之间的权重值计算任意两个直播间之间的相似度值。

例如,可以根据下式计算直播间a和直播间b之间的相似度值:

其中,sim(a,b)是直播间a和b的相似度值;α是传导衰减因子,α的取值范围是0~1,通常可以取0.8-0.9之间的数值;k是迭代轮次,k是正整数,通常取值范围为10~20;n(b)是直播间b的直接关联直播间集合;wib是直播间b的直接关联直播间i到直播间b的权重值;wjb是直播间b的直接关联直播间j到直播间b的权重值;sim(a,i)0=wai,sim(a,a)0=1。

s4,对于直播间集合r中的任一源直播间而言,将与任一源直播间相似的直播间按照相似度值由大到小的顺序排列在源直播间的推荐列表中。

举个例子说明一下源直播间的含义:直播间a和直播间b的相似度值为0.3,直播间a和直播间c的相似度值为0.2,直播间a和直播间d的相似度值为0.1,那么这里的源直播间就是直播间a,也即是说,源直播间是指作为基础直播间,与其他多个直播间具有相似关系的直播间。在这个例子里,按照相似度值由大到小的顺序进行排列,排列顺序如下:b、c、d。

s5,获取用户最后观看的直播间作为上述源直播间,将源直播间的推荐列表中的处于开播状态的直播间依次推荐给用户。

根据用户的观看记录,找到用户最后观看的直播间,在将该直播间的推荐列表中的直播间推荐给用户之前,还需要判断这些直播间是否处于开播状态,如果没有开播,则不向用户推荐这些直播间,在确定了直播间的开播状态后,将处于开播状态的直播间按照推荐列表中的排序依次推荐给用户。例如,接着上面的例子,用户最后观看的直播间是a,直播间c没有开播,那么就按照b、d的顺序依次向用户推荐。

下面列举一个实际例子具体说明本发明是如何计算两个直播间的相似度值的。

假设有四条观看路径:a→c,a→d,c→b,d→b。观看直播间a的人数是1000,观看了直播间a后继续观看直播间c的人数是200,观看了直播间a后继续观看直播间d的人数是600,观看直播间c的人数是300,观看了直播间c后继续观看直播间b的人数是150,观看直播间d的人数是800,观看了直播间d后继续观看直播间b的人数是240。

首先计算权重值,计算结果如下:

因为sim(a,i)0=wai,所以sim(a,c)0=wac,sim(a,d)0=wad。

α取0.8,第一轮迭代,a和b之间的相似度值如下:

同理可得,sim(a,c)1=0.16,sim(a,d)1=0.48。

第二轮迭代,a和b之间的相似度值如下:

……

第十轮迭代,a和b之间的相似度值如下:

在这个例子里,为了方便描述,并没有加入直播间c和直播间d的其他直接关联直播间,所以直播间a到直播间c和直播间a到直播间d的权重都是1,这就导致sim(a,c)k+1=αsim(a,c)k,sim(a,d)k+1=αsim(a,d)k,从而使得直播间a和直播间b之间的相似度值有所衰减。上述例子考虑的情景较为简单,在实际操作中,直播间c和直播间d还存在着其他关联直播间,真实的相似度值不会像上述示例一样不断衰减。

由于用户观看直播间的路径代表了用户的喜好,路径可以形成一定的共现关系,本实施例中通过挖掘路径的深层含义,找到直播间之间的相似关系,从而对用户进行个性化的直播间推荐,极大地增强了推荐的效果,并提高了推荐的准确性。

基于同一发明构思,参考图2所示,本发明还提供一种计算机可读存储介质201,其上存储有可执行指令202,可执行指令202在由处理器执行时,可以实现根据上述实施例中的任一项所述的直播间推荐方法的步骤。

基于同一发明构思,参考图3所示,本发明还提供一种电子设备301,该电子设备301包括:

存储器310,其用于存储可执行指令311;以及

处理器320,其用于执行存储器310中存储的可执行指令311,以实现如上述实施例中任一项所述的直播间推荐方法的步骤。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1