一种用户兴趣度计算方法、服务器及可读存储介质与流程

文档序号:16919461发布日期:2019-02-19 19:13阅读:237来源:国知局
一种用户兴趣度计算方法、服务器及可读存储介质与流程

本发明涉及大数据领域,尤其涉及一种用户兴趣度计算方法、服务器及可读存储介质。



背景技术:

在视频直播平台上,往往会通过大量的数据分析来为用户推荐观看的视频,这些观看的视频是基于用户兴趣分析,根据用户兴趣类别,推送相关度较高的视频。

通常只用获取用户历史观看记录,并计算用户对不同类别视频的兴趣度来推荐兴趣度较高的相关类别直播视频即可。然而在实际中,由于出现某一热点事件,许多用户即使对该热点相关视频毫无兴趣,也会进行观看。突发性的庞大的直播观看量,会影响用户兴趣度计算基数,导致用户对各类直播实际兴趣度计算不准确,进而使得推送的直播视频也不太准确。



技术实现要素:

本发明实施例提供了一种用户兴趣度计算方法、服务器及可读存储介质,用于量化用户对某一类直播视频的感兴趣程度。

在本发明实施例的第一方面,提供了一种用户兴趣度计算方法,包括:

分别获取各预设时段内预定类别视频的所述预定用户观看次数和所有类别视频的所述预定用户观看次数;

按时段顺序分别计算各预设时段内所述预定类别视频的所述预定用户兴趣度,并根据各时段内的所述预定用户兴趣度,计算除当前时段外所有时段的所述预定用户历史兴趣度;

获取各预设时段内所述预定类别视频所述预定用户的观看次数大于或等于预设阈值的时段数量,并根据时段数量和各时段间所述预定类别视频所述预定用户的观看次数的增长比例,计算降权因子;

通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度。

在本发明实施例的第二方面,提供了一种服务器,包括:

获取模块:用于分别获取各预设时段内预定类别视频的所述预定用户观看次数和所有类别视频的所述预定用户观看次数;

第一计算模块:用于按时段顺序分别计算各预设时段内所述预定类别视频的所述预定用户兴趣度,并根据各时段内的所述预定用户兴趣度,计算除当前时段外所有时段的所述预定用户历史兴趣度;

第二计算模块:用于获取各预设时段内所述预定类别视频所述预定用户的观看次数大于或等于预设阈值的时段数量,并根据时段数量和各时段间所述预定类别视频所述预定用户的观看次数的增长比例,计算降权因子;

降权模块:用于通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度。

在本发明实施例的第三方面,提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例第一方面所述方法的步骤。

在本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。

在本发明实施例的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被一个或多个处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。

从以上技术方案可以看出,本发明实施例具有以下优点:

本发明实施例中,通过计算热点事件的降权因子,对原始用户兴趣度进行降权,得到降权后用户的真实历史兴趣。可以减少短时大流量的用户观看,对用户历史兴趣度计算带来的影响,能够准确获得用户实际历史兴趣度,这样可以为用户推荐更符合用户喜好的视频,提升用户体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中用户兴趣度计算方法一个实施例的流程示意图;

图2为本发明实施例中用户兴趣度计算方法的另一个实施例流程图;

图3为本发明实施例中用户兴趣度计算服务器的一个实施例结构图;

图4为本发明实施例中服务器的结构示意图。

具体实施方式

本发明实施例提供了一种用户兴趣度计算方法、服务器及可读存储介质,用于计算用户真实的历史兴趣度。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1,本发明实施例中用户兴趣度计算方法的一个实施例流程图,该流程图中方法包括:

s101、分别获取各预设时段内预定类别视频的预定用户观看次数和所有类别视频的预定用户观看次数;

所述预设时段为预先设定时间长度的计算周期,例如预设时段时长可设为7天或24小时,以当前时刻所处时段为初始时段,可记为t0,以此类推,每间隔7天或24小时,为另一个周期,分别记为t1、t2、…、tn。所述预定类别视频即以直播视频所属类别来划分视频,如游戏类、户外类、颜值类等,所述类别可以有更大或更小的划分,具体可以根据视频标签确定,在此不做限定。

所述预定用户即直播视频的观看用户,可以为注册用户或临时用户。所述观看次数以用户点击打开直播视频为一次计数,优选的,在一个时段内同一用户多次打开直播视频仍按一次计数。

所述所有类别视频即在当前视频网站或平台上所有可以点击观看的视频。

具体的,分别获取各预设时段内所有用户观看预定类别视频的次数和所有类别视频的次数;

根据如下公式(1)计算预定类别视频预定用户兴趣度:

其中,表示在预设时段t内预定类别视频cj的用户观看次数,nt表示在预设时段t内所有类别视频的用户观看次数,表示在预设时段t内预定类别视频cj所有用户的观看次数,mt表示所有类别视频所有用户的观看次数,it(ui,cj)表示预定用户ui对预定类别视频cj的兴趣度。

s102、按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度,并根据各时段内的预定用户兴趣度,计算除当前时段外所有时段的预定用户历史兴趣度;

所述按时段顺序即以当前时段为准,从距离一个周期的t1时段开始算起,用户所拥有的所有历史观看记录,都可以以所属时段计算用户兴趣度。所述用户兴趣度一般用于衡量用户对某一类直播视频的感兴趣程度,可通过计算用户对该类直播视频观看比例及全网用户观看比例来计算。

所述用户历史兴趣度即除当前时段外,根据用户所有历史观看记录可以计算得到用户以前对该预定类别视频的感兴趣程度。

具体的,根据如下公式(2)计算所述预定用户的历史兴趣度:

其中,i(ui,cj)表示预定用户ui对预定类别视频cj的历史兴趣度,it(ui,cj)表示在预设时段t内预定用户ui对预定类别视频cj的兴趣度,β是时间衰减系数。

所述时间衰减因子可以反映随着时段的变化,用户兴趣度会随着时间变化也发生改变,一般时间越久,用户兴趣度值会越小,所以β值可以取0到1之间的值。

s103、获取各预设时段内所述预定类别视频预定用户的观看次数大于或等于预设阈值的时段数量,并根据所述时段数量和各时段间所述预定类别视频预定用户的观看次数的增长比例,计算降权因子;

所述预设阈值用于表示短时某一直播视频点击量大量增加这一类热点事件,阈值的设定具体根据点击量变化曲线(或用户观看次数变化)设定,超过该阈值即可判定为热点事件(或热点视频)。

所述时段数量即存在热点事件(或热点视频)的时段数量,可通过示性函数对热点事件出现次数统计。所述降权因子用于减少热点事件对用户兴趣度计算的影响,通过降权因子可以对热点事件降权,进而反映用户真实历史兴趣度。

所述增长比例指的是用户观看预定类别视频时,观看次数(或点击次数)在各相邻时段间次数的增长比,根据所述增长比例可以设定调节系数值。

根据如下公式(3)计算所述降权因子:

其中,表示预定类别视频cj的突发事件降权因子,γ表示调节系数,表示在预设时段t内预定类别视频cj的观看总次数,threshold表示预设阈值,i(.)为示性函数,表示在预设时段t内预定类别视频cj的所有用户观看次数大于或等于预设阈值threshold,则函数取值为1,否则为0,t表示预设时段数量。

s104、通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度。

所述用于历史兴趣度用于表示当前时段之前,用户对某类视频的感兴趣程度,可以基于用户的感兴趣程度在当前时刻为用户推荐其感兴趣的直播视频。

具体的,根据如下公式(4)计算降权后所述预定用户历史兴趣度:

其中,i(ui,cj)表示预定用户ui对预定类别视频cj的历史兴趣度,表示预定类别视频cj的突发事件降权因子,i'(ui,cj)表示降权后所述预定用户ui历史兴趣度。

可选的,根据热点视频降权后所述预定用户的历史兴趣度,在当前时段推送所述预定类别视频中相关的直播视频。

本实施例中,基于降权因子计算用户历史兴趣度可以真实反映用户感兴趣内容,减少热点事件影响,可保证后续推送的视频更符合用户喜好。

为便于理解,根据图1所描述的实施例,下面以一个实际应用场景对本发明实施例中的一种用户兴趣度计算方法进行描述:

图2示出了用户兴趣度计算方法的另一个实施例流程图,以实际计算为例,详述如下:

假设用户u在t=1的时段内对c类直播视频的观看次数n1(u,c)=10,对所有的类别直播视频观看次数为

所有用户在t=1的时段内对于c类直播视频的观看次数对所有的类别直播视频观看次数为

则用户u对c类直播视频在时间段t=1的兴趣度为:

用户u在t=2的时间段内对于c类直播视频的观看次数n2(u,c)=30,对所有的类别直播视频观看次数为

全网用户在t=2的时间段内对于c类直播视频的观看次数对所有的类别直播视频观看次数为

则用户u对c类直播视频在时间段t=1的兴趣度为:

现在考虑t=1和t=2时段的时间,时间衰减系数β=0.5,用户u对c类直播视频的历史兴趣度为:

在s202中可根据用户观看量增长比例,设定调节系数值,假设调节系数γ=0.7,预设阈值设为threshold=2500,由于在t=2时段所有用户对于c类直播视频的观看次数大于阈值,因此需要对用户u对c的历史兴趣度进行调节,调节系数为:

根据降权因子threshold的值,s203可以得到经过对热点事件降权后的用户u对c类直播视频的历史兴趣度为:

i'(ui,cj)=16.89*0.85=14.35

根据以上计算方法还可以分别计算其他类别视频的历史兴趣度,再对用户u的历史兴趣度根据值的大小,确定最感兴趣类别,并为用户推送该类别的直播视频。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

上面主要描述了一种用户兴趣度计算方法,下面将对一种用户兴趣度计算服务器进行详细描述。

图3示出了本发明实施例中用户兴趣度计算服务器一个实施例的结构示意图,包括如下:

获取模块310:用于分别获取各预设时段内预定类别视频的预定用户观看次数和所有类别视频的预定用户观看次数;

可选的,所述按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度具体为:

分别获取各预设时段内所有用户观看预定类别视频的次数和所有类别视频的次数;

根据如下公式(1)计算预定类别视频预定用户兴趣度:

其中,表示在预设时段t内预定类别视频cj的用户观看次数,nt表示在预设时段t内所有类别视频的用户观看次数,表示在预设时段t内预定类别视频cj所有用户的观看次数,mt表示所有类别视频所有用户的观看次数,it(ui,cj)表示预定用户ui对预定类别视频cj的兴趣度。

第一计算模块320:用于按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度,并根据各时段内的预定用户兴趣度,计算除当前时段外所有时段的预定用户历史兴趣度;

所述按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度,并根据各时段内的预定用户兴趣度,计算除当前时段外所有时段的预定用户历史兴趣度具体为:

根据如下公式(2)计算所述预定用户的历史兴趣度:

其中,i(ui,cj)表示预定用户ui对预定类别视频cj的历史兴趣度,it(ui,cj)表示在预设时段t内预定用户ui对预定类别视频cj的兴趣度,β是时间衰减系数。

第二计算模块330:用于获取各预设时段内所述预定类别视频预定用户的观看次数大于或等于预设阈值的时段数量,并根据所述时段数量和各时段间所述预定类别视频预定用户的观看次数的增长比例,计算降权因子;

可选的,所述获取各预设时段内所述预定类别视频预定用户的观看次数大于预设阈值的时段数量,并根据时段数量和所述预定类别视频预定用户的观看次数的增长比例,计算降权因子具体为:

根据如下公式(3)计算所述降权因子:

其中,表示预定类别视频cj的突发事件降权因子,γ表示调节系数,表示在预设时段t内预定类别视频cj的观看总次数,threshold表示预设阈值,i(.)为示性函数,表示在预设时段t内预定类别视频cj的所有用户观看次数大于或等于预设阈值threshold,则函数取值为1,否则为0,t表示预设时段数量。

降权模块340:用于通过所述降权因子对所述预定用户历史兴趣度降权以获得热点事件降权后的所述预定用户历史兴趣度。

可选的,所述通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度具体为:

根据如下公式(4)计算降权后所述预定用户历史兴趣度:

其中,i(ui,cj)表示预定用户ui对预定类别视频cj的历史兴趣度,表示预定类别视频cj的突发事件降权因子,i'(ui,cj)表示降权后所述预定用户ui历史兴趣度。

可选的,所述降权模块340还包括:

根据热点视频降权后所述预定用户的历史兴趣度,在当前时段推送所述预定类别视频中相关的直播视频。

本发明实施例中所描述的用户兴趣度计算服务器可以获取所有用户观看数据后,计算用户兴趣度,并对所述用户兴趣度中热点事件降权,根据降权后的用户兴趣度为每个用户准确合理的推送直播视频。

图4是本发明一实施例提供的用户兴趣度计算服务器结构的示意图。所述服务器,为提供计算服务的设备,通常指具有较高计算能力,通过网络提供给多个用户使用的计算机。如图4所示,该实施例的服务器4包括:存储器410、处理器420以及系统总线430,所述存储器410包括存储其上的可运行的程序4101,本领域技术人员可以理解,图4中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图4对终端设备的各个构成部件进行具体的介绍:

存储器410可用于存储软件程序以及模块,处理器420通过运行存储在存储器410的软件程序以及模块,从而执行终端的各种功能应用以及数据处理。存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

在存储器410上包含视频合集方法的可运行程序4101,所述可运行程序4101可以被分割成一个或多个模块/单元,所述一个或多个模块/单元被存储在所述存储器410中,并由处理器420执行,以对热点事件降权获得用户真实兴趣度,所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序6101在所述服务器6中的执行过程。例如,所述计算机程序6101可以被分割为获取模块、第一计算模块、第二计算模块和降权模块。

处理器620是服务器的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器410内的软件程序和/或模块,以及调用存储在存储器410内的数据,执行终端的各种功能和处理数据,从而对终端进行整体监控。可选的,处理器420可包括一个或多个处理单元;优选的,处理器420可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器420中。

系统总线430是用来连接计算机内部各功能部件,可以传送数据信息、地址信息、控制信息,其种类可以是例如pci总线、isa总线、vesa总线等。处理器420的指令通过总线传递至存储器410,存储器410反馈数据给处理器420,系统总线430负责处理器420与存储器410之间的数据、指令交互。当然系统总线430还可以接入其他设备,例如网络接口、显示设备等。

所述服务器应至少包括cpu、芯片组、内存、磁盘系统等,其他构成部件在此不再赘述。

在本发明实施例中,该终端所包括的处理器420执行的可运行程序具体为:.

一种用户兴趣度计算方法,包括:

分别获取各预设时段内预定类别视频的预定用户观看次数和所有类别视频的预定用户观看次数;

按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度,并根据各时段内的预定用户兴趣度,计算除当前时段外所有时段的预定用户历史兴趣度;

获取各预设时段内所述预定类别视频预定用户的观看次数大于或等于预设阈值的时段数量,并根据所述时段数量和各时段间所述预定类别视频预定用户的观看次数的增长比例,计算降权因子;

通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度。

可选的,所述按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度具体为:

分别获取各预设时段内所有用户观看预定类别视频的次数和所有类别视频的次数;

根据如下公式(1)计算预定类别视频预定用户兴趣度:

其中,表示在预设时段t内预定类别视频cj的用户观看次数,nt表示在预设时段t内所有类别视频的用户观看次数,表示在预设时段t内预定类别视频cj所有用户的观看次数,mt表示所有类别视频所有用户的观看次数,it(ui,cj)表示预定用户ui对预定类别视频cj的兴趣度。

可选的,所述按时段顺序分别计算各预设时段内所述预定类别视频的预定用户兴趣度,并根据各时段内的预定用户兴趣度,计算除当前时段外所有时段的预定用户历史兴趣度具体为:

根据如下公式(2)计算所述预定用户的历史兴趣度:

其中,i(ui,cj)表示预定用户ui对预定类别视频cj的历史兴趣度,it(ui,cj)表示在预设时段t内预定用户ui对预定类别视频cj的兴趣度,β是时间衰减系数。

可选的,所述获取各预设时段内所述预定类别视频预定用户的观看次数大于预设阈值的时段数量,并根据时段数量和所述预定类别视频预定用户的观看次数的增长比例,计算降权因子具体为:

根据如下公式(3)计算所述降权因子:

可选的,所述通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度具体为:

根据如下公式(4)计算降权后所述预定用户历史兴趣度:

其中,i(ui,cj)表示预定用户ui对预定类别视频cj的历史兴趣度,表示预定类别视频cj的突发事件降权因子,i'(ui,cj)表示降权后所述预定用户ui历史兴趣度。

可选的,所述通过所述降权因子对所述预定用户历史兴趣度降权以获得热点视频降权后的所述预定用户历史兴趣度还包括:

根据热点视频降权后所述预定用户的历史兴趣度,在当前时段推送所述预定类别视频中相关的直播视频。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1