一种视频点击满意度的确定方法及装置与流程

文档序号:15359291发布日期:2018-09-05 00:26阅读:305来源:国知局

本发明涉及互联网技术领域,特别是涉及一种视频点击满意度的确定方法及装置。



背景技术:

随着互联网运用的发展,网络用户的交互作用得以体现,用户既是网络内容的浏览者,也是网络内容的创造者。目前,标题作弊、低质的用户原创内容(ugc,usergeneratedcontent)视频充斥在各视频网站。视频上传者通过诱导性标题吸引用户点击,而视频内容与标题的关联性不大;更有的视频上传者,上传一些时长较长的视频,通过将标题和海报图伪装成正在院线上映的影片,欺骗用户,获得用户点击的行为,这类作弊视频影响了正常视频的播放,并对用户的体验造成了严重的影响。

现有技术中,通过平均播放时长(awt,averagewatchtime)、中值播放时长(mwt,medianwatchtime)等统计排序特征,虽然能从一定程度上识别这类作弊视频,但还达不到预期的效果。一般而言,视频质量越高,用户观看时长越长,这两个特征虽然在一定程度上反应了用户对视频的满意度,但是,awt和mwt与视频时长有关,视频时长越长,用户的平均观看时长越长。因此,通过awt和mwt这两个特征,并不能有效衡量用户对视频播放的满意度。

因此,如何衡量用户对视频播放的满意度是目前有待解决的技术问题。



技术实现要素:

本发明实施例所要解决的技术问题是提供一种视频点击满意度的确定方法,以解决现有技术中不能有效的衡量用户对视频播放满意度的问题。

相应的,本发明实施例还提供了一种视频点击满意度的确定装置,用以保证上述方法的实现及应用。

为了解决上述问题,本发明是通过如下技术方案实现的:

第一方面提供一种频点击满意度的确定方法,所述方法包括:

按照视频时长确定目标视频的留存得分;

将所述留存得分与预先确定对应视频时长的平均留存得分进行归一化处理,得到对应视频时长上的归一化留存得分;

根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低。

第二方面提供一种视频满意度的确定装置,所述装置包括:

第一确定模块,用于按照视频时长确定目标视频的留存得分;

处理模块,用于将所述留存得分与预先确定对应视频时长的平均留存得分进行归一化处理,得到对应目标视频的归一化留存得分;

第二确定模块,用于确根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低。

与现有技术相比,本发明实施例包括以下优点:

本发明实施例中,先按照视频时长确目标视频的留存得分;并将所述留存得分与预先确定对应视频时长的平均留存得分进行归一化处理,得到对应视频时长的归一化留存得分;最后,根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低。也就是说,如果归一化处理留存得分的高,则说明用户该视频的满意度就高,相反的就低,还可以以满意度的高低来评估该目标视频质量的好坏,以及该目标视频是否为作弊视频等。从而解决了现有技术中不能有效的衡量用户对目标视频播放满意度的问题。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

图1是本发明实施例提供的一种视频点击满意度的确定方法的流程图;

图2是本发明实施例提供的一种用户平均观看时长的留存分布曲线的示意图;

图3是本发明实施例提供的一种视频点击满意度的确定方法的另一流程图;

图4是本发明实施例提供的一种视频点击满意度的确定装置的结构框图;

图5是本发明实施例提供的一种视频点击满意度的确定装置的另一结构框图;

图6是本发明实施例提供的预先确定模块的结构示意图;

图7是本发明实施例提供的第一确定模块的结构示意图;

图8是本发明实施例提供的一种视频点击满意度的确定装置的另一结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1,为本发明实施例提供一种视频点击满意度的确定方法的流程图;具体可以包括如下步骤:

步骤101:按照视频时长确定目标视频的留存得分;

该实施例中,后台服务器按照视频时长确定一个目标视频的留存得分,该实施例是对播放视频时长为t的同一个目标视频的留存分布曲线,具体包括:

1)统计所述预设时间内视频时长为t的一个目标视频的所有用户点击行为;

其中,所述用户点击行为包括:用户点击时长或用户观看时长,该实施例中,用户点击行为又可以称为网站内每个视频时长上所有视频的用户点击行为,或者,网站外每个视频时长上所有视频的用户点击行为。

其中,对于网站内的每个视频时长上所有视频,在用户点击播放视频过程中,后台服务器可以获取该用户点击(这种情况下,用户点击可以理解为观看)该视频的观看时间,所述观看时长,就是用户观看视频的时间。其获取该用户观看视频的时间,对于本领域技术人员来说,已是熟知技术,在此不再赘述。

而对于其他网站上的视频,后服务器通常很难获取到用户点击每个视频时长上所有视频的观看时长,基于此,本实施例中,对于其他站点的视频,使用用户点击时长来近似等于用户观看时长,其中,用户点击时长定义为,从接收到用户点击搜索结果到下次接收到所述用户点击搜索结果页上的操作之间的时间间隔。

该实施例中,预设时间内是根据需要设定的,可以设置为3天,7天,10天或30天等。

在该实施例中,视频时长,就是播放目标视频所需要的时间。比如30秒的目标视频,60秒的目标视频,或120秒的目标视频等。视频时长为t的目标视频是指,20秒的目标视频a等。

该步骤中,比如,后台服务器统计7天内的时长为30s的一个目标视频a所有用户点击行为。

2)确定所述目标视频的用户点击行为的累积概率密度分布曲线;

该实施例中,后台服务器根据某个目标视频的所有用户点击行为,可以得到用户观看时长或用户点击时长的累积概率密度分布曲线(cdf,cumulativedistributionfunction),其得到cdf的过程,对于本领域技术人员来说,已是熟知技术,在此不再赘述。

3)根据所述累积概率密度分布曲线得到用户点击行为留存分布曲线;

该步骤中,后台服务器通过公式(1)可以得到用户点击行为的留存分布曲线,其公式(1)为:

retention(t)=1-cdf(t),t∈[0,duration](1)

其中,retention(t)为用户点击行为的留存分布曲线,cdf为用户点击行为的累积概率密度分布曲线,duration为视频时长,此处视频时长可以表示为t。

4)根据所述用户点击行为的留存分布曲线和视频时长t,计算目标视频时长为t视频的留存得分。

该步骤中,后台服务器可以通过下述公式(2)计算视频时长为t的留存得分(rs,retentionscore);其公式(2)为:

其中,retention(t)为一个目标视频的用户点击行为的留存分布曲线,duration为视频时长。

该公式(2)的物理意义为留存分布曲线的平均高度。

其一种留存分布曲线的示意图如图2所示,图2为本发明实施例提供的一种用户点击行为(具体可以是用户观看时长或用户平均点击时长)的留存分布曲线的示意图。

如图2所示,图2中的横坐标为目标视频的播放时长(即视频时长),纵坐标为视频时长为t的一个目标视频的留存率,图2中以视频时长为3000s的一个目标视频的留存分布曲线为例。

步骤102:将所述留存得分与预先确定对应视频时长的平均留存得分进行归一化处理,得到对应视频时长的归一化留存得分;

该实施例中,归一化处理的方式包括但不限于此下述两种:

一种是,将所述留存得分减去对应视频时长的平均留存得分,并将得到的差值作为归一化留存得分;

也就是说,归一化的留存得分表示为rs–ars_t,其中,rs为视频时长为t的留存得分;ars_t为也为视频时长为t的平均留存得分。

另一种为:将所述留存得分除以对应视频时长的平均留存得分,并将得到的商作为归一化留存得分。归一化的留存得分还可以表示为rs/ars_t,其中,rs为视频时长为t的留存得分;ars_t为视频时长为t的平均留存得分。

步骤103:根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低。

该实施例中,后台服务器可以根据归一化留存得分的高低来判断用户对目标视频播放的满意度,也就是说,如果归一化留存得分高,说明该目标视频的质量高,用户对该目标视频的点击率高,或播放次数多,即对该目标视频比较满意,从而确定该目标视频并非作弊视频,相反的,如果归一化留存得分低,说明该目标视频的质量低,说明用户对该目标视频的点击率低,或播放次数少,即对该目标视频不满意,从而确定该目标视频可能是作弊视频。

本发明实施例中,先按照视频时长确定目标视频的留存得分;并将所述留存得分与对应视频时长的平均留存得分进行归一化处理,得到视频时长的归一化留存得分;最后,根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低。也就是说,如果归一化处理留存得分的高,则说明用户该目标视频的满意度就高,相反的就低,还可以以满意度的高低来评估该目标视频质量的好坏,以及该目标视频是否为作弊视频等。从而解决了现有技术中不能有效的衡量用户对目标视频播放满意度的问题。

还请参阅图3,为本发明实施例提供的一种视频点击满意度的确定方法的另一流程图,所述方法包括:

步骤301:预先确定每个视频时长上所有视频的平均留存得分;

该步骤中,确定每个视频时长上所有视频的平均留存得分与确定目标视频的留存得分类似,其不同之处,在于,先确定视频时长相同的所有视频的用户点击行为,具体包括:

其中,后台服务器确定平均留存得分的一种方式为:

1)统计预设时间内每个视频时长上所有视频的用户点击行为,所述用户点击行为包括点用户击时长或用户观看时长,其中,用户点击时长为:从接收到用户点击搜索结果到下次接收到所述用户点击搜索结果页上的操作之间的时间间隔;

该实施例中,用户点击行为又可以包括网站内每个视频时长上所有视频的用户点击行为,或者网站外每个时长上所有视频的用户点击行为。其中,对于网站内的每个视频时长上所有视频,在用户点击播放视频过程中,后台服务器可以获取该用户点击(这种情况下,用户点击可以理解为观看)该视频的观看时间,其具体的获取过程对于本领域技术人员来说,已是熟知技术,在此不再赘述。

而对于其他网站上的视频,后服务器通常很难获取到用户点击每个视频时长上所有视频的观看时长,基于此,本实施例中,对于其他站点的视频,使用用户点击时长来近似等于用户观看时长,其中,用户点击时长定义为,从接收到用户点击搜索结果到下次接收到所述用户点击搜索结果页上的操作之间的时间间隔。

该实施例中,预设时间内是根据需要设定的,可以设置为3天,7天,10天或30天等。

在该实施例中,视频时长,就是播放整个视频所需要的时间。比如30秒的视频,60秒的视频,或120秒的视频等。每个视频时长上所有视频是指,比如,20秒的视频a和视频b等。

再比如,该步骤中,后台服务器分别统计7天内的时长为30s的视频a和视频b的所有用户点击行为。

2)确定每个视频时长上所述用户点击行为的平均累积概率密度分布曲线;

该实施例中,对于站内的视频,后台服务器确定每个视频时长上所有视频的用户观看时长,可以得到观看时长的平均累积概率密度分布曲线(acdf,averagecumulativedistributionfunction);

同理,对于站外的视频,后台服务器确定每个视频时长上所有视频的用户点击时长,可以得到用户点击时长的平均累积概率密度分布曲线acdf,其具体的实现过程与站内视频的用户观看时长的平均累积概率密度分布曲线acdf相似,具体详见上述,在此不再赘述。

3)根据每个视频时长上所述平均累积概率密度分布曲线得到对于用户点击行为的平均留存分布曲线;

该步骤中,后台服务器通过公式(3)可以得到用户点击行为的平均留存分布曲线,其公式(3)为:

average_retention(t)=1–acdf(t)t∈[0,duration](3)

其中,average_retention(t)为用户点击行为的平均留存分布曲线,acdf为用户点击行为的平均累积概率密度分布曲线,duration为视频时长。

4)根据所述用户点击行为的平均留存分布曲线和对应的视频时长,计算每个视频时长上所有视频的平均留存得分。

该步骤中,后台服务器可以通过下述公式(4)计算平均留存得分(ars_t,averageretentionscoretime);其公式(4)为:

其中,average_retention(t)为视频时长相同的不同视频的用户点击行为(包括用户观看时长或用户平均点击时长)的平均留存分布曲线,duration为视频时长。该公式(4)的物理意义为平均留存分布曲线的平均高度。

步骤302:按照视频长度确定目标视频的留存得分;

步骤303:将所述留存得分与对应视频时长的平均留存得分进行归一化处理,得到对应视频时长上的归一化留存得分;

步骤304:根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低;

该实施例中,步骤302至步骤304与步骤101至步骤103相同,具体详见上述,在此不再赘述。

步骤305:判断所述归一化留存得分是否大于等于预设阈值;如果是,执行步骤306;如果否,执行步骤307;

该实施例中,后台服务器还可以对判断归一化留存得分是否大于等于预设阈值,如果是,说明该用户对目标视频播放的满意度就高,反之,说明说明该用户对目标视频播放的满意度就低。

步骤306;确定用户对所述目标视频的满意度高;

步骤307:确定所述用户对所述目标视频的满意度低。

本发明实施例中,基于用户的点击行为,计算出用户观看时长的留存得分,并对该留存得分进行归一化处理,以及将归一化处理后的留存得分在于设定的阈值进行比较,消除了留存得分在视频时长上的偏置,使得不同时长的目标视频的留存得分具有可比较性。从而提高了用户对目标视频的满意程度的精度,进一步,还提高了识别作弊视频、低质视频的效率。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图4,示出了本发明实施例提供的一种视频满意度的确定的结构框图,具体可以包括如下模块:第一确定模块41,处理模块42和第二确定模块43,其中,

第一确定模块41,用于按照视频时长确定目标视频的留存得分;

处理模块42,用于将所述留存得分与预先确定对应视频时长的平均留存得分进行归一化处理,得到所述目标视频的归一化留存得分;

第二确定模块43,用于确根据所述归一化留存得分的高低确定用户对所述目标视频满意度的高低。

可选的,在另一实施例中,该实施例在上述实施例的基础上,所述装置还可以包括:预先确定模块51,其结构示意图如图5所示,其中,

预先确定模块51,用于预先确定每个视频时长上所有视频的平均留存得分。

可选的,在另一实施例中,该实施例在上述实施例的基础上,所述预先确定模块51包括:第一统计模块61,第一密度分布曲线确定模块62,第一留存分布曲线确定模块63和第一计算模块64,其结构示意图如图6所示,其中,

第一统计模块61,用于统计预设时间内每个视频时长上所有视频的用户点击行为,所述用户点击行为包括用户点击时长或用户观看时长,其中,用户点击时长为:从接收到用户点击搜索结果到下次接收到所述用户点击搜索结果页上的操作之间的时间间隔;

第一密度分布曲线确定模块62,用于确定每个视频时长上所述用户点击行为的平均累积概率密度分布曲线;

第一留存分布曲线确定模块63,用于根据每个视频时长上所述平均累积概率密度分布曲线得到对应用户点击行为的平均留存分布曲线;

第一计算模块64,用于根据所述用户点击行为的平均留存分布曲线和对应的视频时长,计算每个视频时长上所有视频的平均留存得分。

所述第一计算模块按照下述公式计算每个视频时长上所有视频的平均留存得分:

其中,average_retention(t)为视频时长相同的不同视频的用户点击行为的平均留存分布曲线,duration为视频时长。

可选的,在另一实施例中,该实施例在上述实施例的基础上,所述第一确定模块41包括:第二统计模块71,第二分布曲线确定模块72,第二留存确定模块73和第二计算模块74,其结构示意图如图7所示,其中,

第二统计模块71,用于统计所述预设时间内视频时长为t的一个目标视频的所有用户点击行为;

第二分布曲线确定模块72,用于确定所述目标视频的用户点击行为的累积概率密度分布曲线;

第二留存确定模块73,用于根据所述累积概率密度分布曲线得到用户点击行为的留存分布曲线;

第二计算模块74,用于根据所述用户点击行为的留存分布曲线和视频时长t,计算视频时长t的留存得分。

可选的,在另一实施例中,该实施例在上述实施例的基础上,所述第二计算模块按照下述公式计算,视频时长t的留存得分:

其中,retention(t)为一个目标视频的用户点击行为的留存分布曲线,duration为视频时长。

可选的,在另一实施例中,该实施例在上述实施例的基础上,所述处理模块包括42:第一处理模块和/或第二处理模块(图中未示),其中,

第一处理模块,用于将所述留存得分减去对应视频时长为t的平均留存得分,并将得到的差值作为归一化留存得分;

第二处理模块,用于将所述留存得分除以对应视频时长为t的平均留存得分,并将得到的商作为归一化留存得分。

可选的,在另一实施例中,该实施例在上述实施例的基础上,所示装置还可以包括:判断模块81,第三确定模块82和第四确定模块83,其结构示意图如图8所示,图8以在图5的基础上为例,其中,

判断模块81,用于判断所述归一化留存得分是否大于等于预设阈值;

第三确定模块82,用于在所述判断模块81判断所述归一化留存得分大于等于预设阈值时,确定用户对所述目标视频的满意度高;

第四确定模块83,用于在所述判断模块81判断所述归一化留存得分小于所述预设阈值时,确定所述用户对所述目标视频的满意度低。

可选的,所述装置可以集成在后台服务器中,也可以集成在网络服务器中,或者独立部署,本实施例不做限制。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种视频点击满意度的确定方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1