基于霍克斯过程的节目质量评价方法与流程

文档序号:11628865阅读:618来源:国知局
基于霍克斯过程的节目质量评价方法与流程

本发明涉及节目质量评价技术领域,具体地说,涉及一种基于霍克斯过程的节目质量评价方法,该方法对用户收视节目行为建模,并用数据计算的方法评价节目质量的算法,通过对用户收视行为建模,可以排除用户收视意愿、节目类型、频道偏好和用户偏好等因素来得到对节目质量的客观评价。



背景技术:

传统的对节目质量的评价是通过统计调查节目的收视率来实现的,而这种方法不能排除用户收视意愿、节目类型、频道偏好和用户偏好等因素的干扰,不能得到对节目质量的较为客观的质量评价。具体来说,这些干扰包括了用户本身的收视意愿、节目播出所在的时间、节目播出的频道、节目的类型、该节目受大众喜爱的程度、用户本身的换台习惯等,这些因素都会干扰节目的质量评价。例如,在晚上八点某综合类电视频道播出的电视剧,收视率可能会比某卫视下午播出的某个节目收视率高,但是并不能以此简单地认为该电视剧的节目质量更高,那是因为可能这一综合类电视频道是被人们更偏爱的一个频道,晚上八点也是大多数人有空来看电视的时间,收视率高是理所当然的,然而别的节目可能质量更高,收视率却稍低,所以收视率这种评价方式不够准确。再比如说,因为喜欢看综艺节目的人比喜欢看戏曲节目的人多,所以综艺节目的收视率一般比戏曲节目要高,但并不能以此说明一个综艺节目的质量比一个戏曲节目的质量高,这就是节目类型所导致的干扰。还有,因为某一卫视的收视率高,用户看完某一卫视的节目后可能正好换台到附近的频道,这样会导致附近频道的收视率增高,这就是用户的换台习惯造成的影响。正是上述这些原因,一个客观的节目质量评价算法应该能排除各种因素的干扰,来得到对节目质量的较为客观准确的质量评价。

基于对用户收视行为进行建模的方法来评价节目质量的方法由于在建模时考虑了用户收视意愿、节目类型、频道偏好和用户偏好等因素,将这些因素表达为模型的各个参数,可以将影响节目收视的“节目质量”因素与其他因素区分出来,因此能得到更为客观的节目质量评价。

点过程是一类用空间中的点表示随机事件发生的随机模型。时序点过程是点过程中的一类,点所在的时间域是实数域的一部分,其中事件被表示为时间域上的点。时序点过程模型近年来得到比较广泛的应用,尤其是在用户收视行为数据的建模和挖掘方面;随着双向机顶盒和智能电视等具有收视采集功能的终端的普及,已实现大规模采集用户的收视行为的功能,包括其发生时刻和具体的行为信息。简单点过程是点与点之间不会重合的点过程,例如当点所在的空间是时间域则每个点的出现时刻都不一样,同一个时刻不可能同时出现两个点(不能在同一时刻发生两件事情)。对于简单点过程而言,确定了其条件强度函数的形式后,则这个点过程就确定了。

选择合适的点过程形式,然后结合用户收视的应用场景确定参数,可以完成对用户收视行为的建模。目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。



技术实现要素:

针对现有技术中存在的上述不足,本发明的目的是提供一种基于霍克斯过程的节目质量评价方法,该方法将上述用户行为视为随机事件,用时序点过程对用户收视行为进行建模。

为实现上述目的,本发明是通过以下技术方案实现的。

一种基于霍克斯过程的节目质量评价方法,包括如下步骤:

步骤a,数据预处理:将用户收视行为的记录作为原始数据,并将原始数据处理为用户收视事件序列;

步骤b,在用户收视事件序列的基础上,利用霍克斯过程建立用户收视事件序列模型,随机初始化该模型的条件强度函数各项参数值,并通过最小窗梯度下降算法求解模型的各项参数;

步骤c,随机打乱用户收视事件序列模型的用户数据顺序,并根据最小窗口的大小将用户数据分成多个数据块;

步骤d,提取一个数据块进行处理:

-步骤d1,将该数据块的用户数据代入目标函数的各项参数的梯度公式中,计算该数据块中各项参数的梯度值;

-步骤d2,根据步骤d1中得到的各项参数的梯度和学习速率更新数据块中各项参数的参数值,使得对数损失函数变小;

步骤e,判断是否所有数据块均已处理:

如果否:则返回步骤d;

如果是,则进入步骤f;

步骤f,判断是否达到迭代次数:

如果否,则返回步骤c;

如果是,则进入步骤g;

步骤g,得到具有节目的收视质量和节目类型收视质量的最终用户收视事件序列模型。

优选地,所述步骤a具体包括如下子步骤:

步骤a1,将一个用户的一次收视行为视为时间轴上的一个点,那么该用户在一段时间内的所有收视行为就视为一个点过程;

步骤a2,把一个用户的一次收视行为视作发生在该用户收视某次节目起始时刻的一个事件,这样该用户在一段时间内收视行为的点过程就作为时间轴上的一个用户收视事件序列;

优选地,所述用户收视行为包括:用户编号、节目编号、节目名称、节目类型、频道编号、频道名称、观看起始时间和/或观看终止时间;所述一个事件包括:事件发生的时间、用户观看的节目、节目类型和节目所在的频道。

优选地,所述步骤b具体为:

利用霍克斯过程建立的用户收视事件序列模型,其条件强度函数λu(t)为:

式中:

用户u的用户收视事件序列中的第j个事件;

用户u的用户收视事件序列中的第j个事件发生的时间;

用户u的用户收视事件序列中第j个事件对应的节目;

用户u的用户收视事件序列中第j个事件对应节目的节目类型;

用户u的用户收视事件序列中第j个事件对应节目所在的频道;

μu:用户u本身想看电视的意愿,该参数的参数值大于0;

节目受大众欢迎的程度,该参数的参数值大于0;

节目类型受大众欢迎的程度,该参数的参数值大于0;

用户u对频道的偏好,该参数的参数值大于0;

用户u的换台习惯,从频道换到频道的概率,该参数的参数值大于0;

g(t):衰减函数,表示随着时间t的推移,用户u收视兴趣的衰减程度。

优选地,所述步骤c中,根据最小窗口的大小将用户数据分成多个数据块的方法,包括如下步骤:

步骤c1,随机打乱所有用户数据的顺序;

步骤c2,将打乱后的用户数据分成多个数据块,其中每个数据块的用户数量等于最小窗口的大小。

优选地,所述步骤d中,针对对数损失函数计算数据块中各项参数的梯度,所述对数损失函数l(θ)为:

其中:

θ为数据块中各项参数的合集;

表示用户u的用户收视事件序列中的第i个事件发生的时间;

tu表示用户u的用户收视事件序列的总时间。

优选地,所述步骤d中,根据各项参数的梯度和学习速率更新数据块中各项参数的参数值的方法,包括如下步骤:

步骤d1,计算各项参数的更新值:每一项参数的更新值为该参数的梯度乘以学习速率;

步骤d2,更新各项参数值:每一项更新后的参数值为该参数的原值减去该参数的更新值。

优选地,窗口大小、学习速率以及迭代次数根据原始数据的数据量设定。

本发明提供的基于霍克斯过程的节目质量评价方法,利用hawkes(霍克斯)过程来模拟用户u的收视行为,与现有技术相比,本发明具有如下有益效果:

1、本发明利用霍克斯过程来建模用户u的收视行为,分离了收视意愿、节目类型、用户频道偏好、换台习惯与节目质量对其收视节目行为的影响,可以得到较为客观的节目质量的评价。

2、本发明提供的用户收视行为模型的条件强度函数,包含了用户u本身想看电视的意愿μu、用户u对频道c的偏好节目p受大众的欢迎程度hp、节目p所属节目类型k受大众的欢迎程度lk以及用户u的换台习惯

3、本发明将霍克斯过程的模型引入到了用户收视行为建模中,物理意义符合常理。

4、本发明利用最小窗梯度下降算法进行模型各项参数的求解,各项参数能够很快地收敛,得到节目p的收视质量参数hp。

5、本发明利用最小窗梯度下降算法进行模型参数的求解,各项参数能够很快地收敛,得到节目p所属节目类型k的收视质量参数lk。

附图说明

通过阅读参照附图的详细描述,本发明的其它特征、目的和优点将会变得更加明显。

图1为用户的收视行为示意图。

图2为用户收视行为的条件强度函数示意图。

图3为本发明方法流程图。

具体实施方式

下面对本发明的具体实施方式进行详细地说明。以下算法将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。

本实施例提供了一种基于霍克斯过程的节目质量评价方法,包括如下步骤:

步骤a,数据预处理:将用户收视行为的记录作为原始数据,并将原始数据处理为用户收视事件序列;

步骤b,在用户收视事件序列的基础上,利用霍克斯过程建立用户收视事件序列模型,随机初始化该模型的条件强度函数各项参数值,并通过最小窗梯度下降算法求解模型的各项参数;

步骤c,随机打乱用户收视事件序列模型的用户数据顺序,并根据最小窗口的大小将用户数据分成多个数据块;

步骤d,提取一个数据块进行处理:

-步骤d1,计算数据块中各项参数的梯度;

-步骤d2,根据步骤d1中得到的各项参数的梯度和学习速率更新数据块中各项参数的参数值,使得对数损失函数变小;

步骤e,判断是否所有数据块均已处理:

如果否:则返回步骤d;

如果是,则进入步骤f;

步骤f,判断是否达到迭代次数:

如果否,则返回步骤c;

如果是,则进入步骤g;

步骤g,得到具有节目的收视质量和节目类型收视质量的最终用户收视事件序列模型。

具体为:

首先,本实施中的原始数据是用户观看行为的记录,比如用户编号、节目编号、节目名称、节目类型、频道编号、频道名称、观看起始时间与观看终止时间等,应用算法之前需要对这些原始数据进行预处理操作,将一个用户的一次收视行为视为时间轴上的一个点,那么一个用户在一段时间内的所有收视行为就是一个点过程。然后把一个用户的一次收视行为视作发生在他观看某次节目起始时刻的一个事件,一个事件包括四个组成部分:事件发生的时间、用户观看的节目、节目类型和节目所在的频道,这样一个用户在一段时间内收视行为点过程就是时间轴上的一个用户收视事件序列。

在这个事件序列的基础上利用霍克斯过程的理论建立用户收视事件序列模型,一个用户收视事件序列模型的条件强度函数为:

然后通过最小窗梯度下降算法,利用一群用户的收视行为事件序列,最小化对数损失函数,即可求算出符合这群用户收视行为的条件强度函数的各项参数。

本实施例中,需要根据实际用户数据(原始数据)的情况来设置相应的迭代次数、窗口大小和学习速率。

指数核函数g(t)为g(t)=ωe-ωt,式中:

ω:指数核函数的衰减速率,该参数的参数值大于0;

e:自然常数,该参数值约等于2.71828;

t:衰减时间,该参数的参数值大于0。

记θ=(μ,h,l,r,α,ω)为数据块中各项参数的合集。本实施例提供的用户收视事件序列模型的对数损失函数可以写作:

下面给出对数损失函数l(θ)中各个参数的梯度。

用户u本身想看电视的意愿μu

用户u对频道m的偏好

节目m受大众欢迎的程度hm:

节目m所属的节目类型n受大众欢迎的程度ln:

用户u的换台习惯,从频道c1换到频道c2的概率

指数核函数g(t)的参数ω:

如图3所示的方法流程图,在每一次迭代的每一个最小窗口中都利用学习速率和各参数的梯度更新所有参数,一定的迭代次数后,对数损失函数l(θ)便能收敛,各项参数也能得到稳定值。在得到的各参数中,hp便表示的是节目p的质量评价,lk表示的是节目p所属节目类型k的收视质量评价。

本实施例提供的基于霍克斯过程的节目质量评价方法,将用户收视行为的原始数据抽象成点过程,只包含用户观看的时间点、节目编号、节目类型和频道编号;排除了用户收视意愿、用户偏好、频道偏好等主客观因素对节目质量评价的影响;排除了节目类型等客观因素对节目质量评价的影响;利用霍克斯过程对每个用户收视节目的行为建模。同时,本实施例还使用最小窗梯度下降算法,通过对用户数据的计算,得到所建立模型的各项参数,从而实现对节目质量和节目类型的评价。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1