一种视频满意度确定方法及装置与流程

文档序号:15625791发布日期:2018-10-09 22:56

本发明属于计算机技术领域,特别是涉及一种视频满意度确定方法及装置。



背景技术:

随着计算机技术的不断发展,视频平台中的视频越来越多,视频搜索也得到了更加广泛的应用。在视频搜索中,移动终端经常会基于用户对搜索结果中各个视频的满意度,对搜索结果进行排序。作为视频排序的重要参数,如何确定用户对视频的满意度成为人们广泛关注的问题。

现有技术中,通常是基于固定时长阈值30秒(second,s)来确定用户对该视频是否满意。具体的,在用户对视频的点击时长大于30s时,确定用户对该视频满意。

但是,由于每个视频的时长不同,相对于时长较长的视频点击时长很容易达到30s,但是对于此类视频观看30s并不能说明用户对视频满意,进而会出现将用户不满意的视频确定为用户满意的视频,相应地,对于时长较短的视频,有可能视频时长都没有达到30s,对于此类视频用户的点击时长很难达到固定时长阈值,进而会将用户满意的视频确定为用户不满意的视频,因此,现有技术中的视频满意度确定方法准确度较低,确定效果较差。



技术实现要素:

本发明提供一种视频满意度确定方法及装置,以便解决基于固定时长阈值判断用户对视频的满意度,导致的准确度较低,确定效果较差的问题。

依据本发明的第一方面,提供了一种视频满意度确定方法,该方法包括:

获取目标用户对目标视频的播放操作的时长参数;所述时长参数包括所述目标用户在所述播放操作中,对所述目标视频的播放时长或点击时长;

根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值;所述属性参数至少包括所述目标视频的时长;

根据所述时长参数阈值以及所述时长参数,确定所述目标用户对所述目标视频是否满意;

其中,所述预设时长参数阈值函数是预先确定的反映视频的时长与时长参数阈值对应关系的函数,所述预设时长参数阈值函数中,时长参数阈值为因变量,视频的时长为自变量。

可选的,在所述获取目标用户对目标视频的播放操作的时长参数的步骤之前,所述方法还包括:

根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息;所述样本历史播放信息至少包括样本视频的时长以及历史时长参数;

基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集;

根据每个样本数据集中每条样本历史播放信息包括的历史时长参数,确定至少一个预设时长阈值函数。

可选的,所述基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集,包括:

在所述样本历史播放信息包括样本视频的时长以及历史时长参数时,将包含的样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集;

在所述样本历史播放信息包括样本视频的时长、历史播放端类型以及历史时长参数时,将包含的历史播放端类型相同且样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集。

可选的,所述根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息的步骤,包括:

根据每个样本视频对应的样本日志,确定每个样本视频对应的至少一条历史播放信息;

获取每个样本视频对应的至多m条历史播放信息,得到每个样本视频对应的样本历史播放信息;所述m为预先定义的每个样本视频对应的样本历史播放信息的最大条数。

可选的,所述根据每个样本数据集中每条样本历史播放信息包括的历史时长参数,确定至少一个预设时长阈值函数的步骤,包括:

将每个对应的样本视频的时长大于第一时长阈值的样本数据集,确定为第一样本数据集,将每个对应的样本视频的时长不大于第一时长阈值的样本数据集,确定为第二样本数据集;

计算每个第一样本数据集中历史时长参数的第一四分位数,将所述第一四分位数和所述第一样本数据集对应的样本视频的时长作为第一样本点,得到多个第一样本点;

计算每个第二样本数据集中历史时长参数的第三四分位数,将所述第三四分位数和所述第二样本数据集对应的样本视频的时长作为第二样本点,得到多个第二样本点;

根据所述多个第一样本点以及所述多个第二样本点,构建所述至少一个预设时长阈值函数。

可选的,当所述样本数据集中包括样本视频时长相同的样本历史播放信息时,所述根据所述多个第一样本点以及所述多个第二样本点,构建所述至少一个预设时长阈值函数的步骤,包括:

利用所述多个第一样本点以及所述多个第二样本点进行线性拟合,得到预设时长阈值函数。

可选的,当所述样本数据集中包括样本视频时长相同且历史播放端类型相同的样本历史播放信息时,所述至少一个预设的时长参数阈值函数至少包括:与PC端对应的第一预设时长参数阈值函数和与移动端对应的第二预设时长参数阈值函数;

所述根据所述多个第一样本点以及所述多个第二样本点,构建所述至少一个预设时长阈值函数的步骤,包括:

利用对应的历史播放端类型为PC端的第一样本点和对应的历史播放端类型为PC端的第二样本点进行线性拟合,得到第一预设时长参数阈值函数;

利用对应的历史播放端类型为移动端的第一样本点和对应的历史播放端类型为移动端的第二样本点进行线性拟合,得到第二预设时长参数阈值函数。

可选的,所述属性参数为所述目标视频的时长;

所述根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值的步骤,包括:

若所述目标视频的时长在所述预设时长参数阈值函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述预设时长参数阈值函数中,得到所述目标视频对应的时长参数阈值。

可选的,所述属性参数为所述目标视频的时长以及所述目标视频在所述播放操作中对应的播放端类型,所述播放端类型至少包括电脑PC端和移动端;

所述根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值的步骤,包括:

确定所述目标视频在所述播放操作中对应的播放端类型,得到目标播放端类型;

将与所述目标播放端类型相对应的预设时长参数阈值函数确定为目标函数;

若所述目标视频的时长在所述目标函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述目标函数中,得到所述目标视频对应的时长参数阈值。

依据本发明的第二方面,提供了一种视频满意度确定装置,该装置包括:

获取模块,用于获取目标用户对目标视频的播放操作的时长参数;所述时长参数包括所述目标用户在所述播放操作中,对所述目标视频的播放时长或点击时长;

第一确定模块,用于根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值;所述属性参数至少包括所述目标视频的时长;

第二确定模块,用于根据所述时长参数阈值以及所述时长参数,确定所述目标用户对所述目标视频是否满意;

其中,所述预设时长参数阈值函数是预先确定的反映视频的时长与时长参数阈值对应关系的函数,所述预设时长参数阈值函数中,时长参数阈值为因变量,视频的时长为自变量。

可选的,其特征在于,所述装置还包括:

第三确定模块,用于根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息;所述样本历史播放信息至少包括样本视频的时长以及历史时长参数;

划分模块,用于基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集;

第四确定模块,用于根据每个样本数据集中每条样本历史播放信息包括的历史时长参数,确定至少一个预设时长阈值函数。

可选的,其特征在于,所述划分模块,用于:

在所述样本历史播放信息包括样本视频的时长以及历史时长参数时,将包含的样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集;

在所述样本历史播放信息包括样本视频的时长、历史播放端类型以及历史时长参数时,将包含的历史播放端类型相同且样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集。

可选的,其特征在于,所述第三确定模块,用于:

根据每个样本视频对应的样本日志,确定每个样本视频对应的至少一条历史播放信息;

获取每个样本视频对应的至多m条历史播放信息,得到每个样本视频对应的样本历史播放信息;所述m为预先定义的每个样本视频对应的样本历史播放信息的最大条数。

可选的,其特征在于,所述第四确定模块,包括:

确定子模块,用于将每个对应的样本视频的时长大于第一时长阈值的样本数据集,确定为第一样本数据集,将每个对应的样本视频的时长不大于第一时长阈值的样本数据集,确定为第二样本数据集;

第一计算子模块,用于计算每个第一样本数据集中历史时长参数的第一四分位数,将所述第一四分位数和所述第一样本数据集对应的样本视频的时长作为第一样本点,得到多个第一样本点;

第二计算子模块,用于计算每个第二样本数据集中历史时长参数的第三四分位数,将所述第三四分位数和所述第二样本数据集对应的样本视频的时长作为第二样本点,得到多个第二样本点;

构建子模块,用于根据所述多个第一样本点以及所述多个第二样本点,构建所述至少一个预设时长阈值函数。

可选的,其特征在于,当所述样本数据集中包括样本视频时长相同的样本历史播放信息时,所述构建子模块,用于:

利用所述多个第一样本点以及所述多个第二样本点进行线性拟合,得到预设时长阈值函数。

可选的,其特征在于,当所述样本数据集中包括样本视频时长相同且历史播放端类型相同的样本历史播放信息时,所述至少一个预设的时长参数阈值函数至少包括:与PC端对应的第一预设时长参数阈值函数和与移动端对应的第二预设时长参数阈值函数;

所述构建子模块,用于:

利用对应的历史播放端类型为PC端的第一样本点和对应的历史播放端类型为PC端的第二样本点进行线性拟合,得到第一预设时长参数阈值函数;

利用对应的历史播放端类型为移动端的第一样本点和对应的历史播放端类型为移动端的第二样本点进行线性拟合,得到第二预设时长参数阈值函数。

可选的,其特征在于,所述属性参数为所述目标视频的时长;

所述第一确定模块,用于:

若所述目标视频的时长在所述预设时长参数阈值函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述预设时长参数阈值函数中,得到所述目标视频对应的时长参数阈值。

可选的,所述属性参数为所述目标视频的时长以及所述目标视频在所述播放操作中对应的播放端类型,所述播放端类型至少包括电脑PC端和移动端;

所述第一确定模块,用于:

确定所述目标视频在所述播放操作中对应的播放端类型,得到目标播放端类型;

将与所述目标播放端类型相对应的预设时长参数阈值函数确定为目标函数;

若所述目标视频的时长在所述目标函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述目标函数中,得到所述目标视频对应的时长参数阈值。

针对在先技术,本发明具备如下优点:

可以获取目标用户对目标视频的播放操作的时长参数,然后根据目标视频的属性参数以及至少一个预设时长参数阈值函数,确定目标视频对应的时长参数阈值,最后,会根据时长参数阈值以及时长参数,确定目标用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,会根据目标视频的属性参数确定目标视频对应的时长参数阈值,保证不同的目标视频的判断依据是根据自身属性确定的,进而提高确定视频满意度的准确度。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是本发明实施例一提供的一种视频满意度确定方法的步骤流程图;

图2-1是本发明实施例二提供的一种视频满意度确定方法的步骤流程图;

图2-2是本发明实施例二提供的一种第一曲线示意图;

图2-3是本发明实施例二提供的另一种第一曲线示意图;

图3是本发明实施例三提供的一种视频满意度确定装置的框图;

图4是本发明实施例四提供的一种视频满意度确定装置的框图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

实施例一

图1是本发明实施例一提供的一种视频满意度确定方法的步骤流程图,如图1所示,该方法可以包括:

步骤101、获取目标用户对目标视频的播放操作的时长参数。

本发明实施例中,该时长参数可以包括目标用户在播放操作中,对目标视频的播放时长或点击时长。其中,播放时长是指目标视频被目标用户打开的时间点与目标视频被目标用户关闭的时间点之间的时长,点击时长是指目标视频被目标用户打开的时间点与目标用户的下一次行为的时间点之间的时长,具体的,该行为可以是目标用户点击下一个结果,或者利用新的关键词重新搜索视频,或者退出视频搜索,等等。

示例的,假设用户“张三”在2018年2月1日的8:00打开视频A,开始播放,之后,张三又在2018年2月1日的8:20打开了视频B,同时播放视频A和视频B,直到2018年2月1目的8:22关闭视频A,那么可以确定视频A的点击时长为20分钟,播放时长为22分钟。

具体的,当该时长参数为播放时长时,可以从视频应用的后台获取目标用户打开目标视频时,生成的行为日志,提取该行为日志中的时间戳,进而得到目标视频被目标用户打开的时间点,获取目标用户关闭目标视频时,生成的行为日志,提取该行为日志中的时间戳,进而得到目标视频被目标用户关闭的时间点,计算打开的时间点和关闭的时间点之间的时长,进而得到时长参数;相应地,当该时长参数为点击时长时,可以从视频应用的后台获取目标用户打开目标视频时,生成的行为日志,提取该行为日志中的时间戳,进而得到目标视频被目标用户打开的时间点,获取目标用户的下一次行为,生成的行为日志,提取该行为日志中的时间戳,进而得到目标用户执行下一次行为的时间点,计算打开的时间点和执行下一次行为的时间点之间的时长,进而得到时长参数,实际应用中,可以根据实际需求选择以点击时长或播放时长作为时长参数,本发明实施例对此不作限定。

步骤102、根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值。

本发明实施例中,该属性参数至少包括目标视频的时长,该属性参数还可以包括目标视频在播放操作中对应的播放端类型,本发明实施例对此不作限定。进一步地,预设时长参数阈值函数可以是预先确定的可以反映视频的时长与时长参数阈值对应关系的函数,该预设时长参数阈值函数中,时长参数阈值为因变量,视频的时长为自变量。具体的,当属性参数仅包括目标视频的时长时,可以预先确定一个预设时长参数阈值函数;当属性参数包括目标视频的时长以及目标视频在播放操作中对应的播放端类型时,可以预先确定与不同的播放端类型对应的预设时长参数阈值函数。

具体的,不同的目标视频的属性参数可能不同,因此,每个目标视频对应的时长参数阈值可能不同,而每个目标视频对应的时长参数阈值是根据目标视频的属性参数确定的,因此,该时长参数阈值能够表示当目标用户对目标视频满意时的时长参数。

步骤103、根据所述时长参数阈值以及所述时长参数,确定所述用户对所述目标视频是否满意。

本发明实施例中,可以在时长参数不小于时长参数阈值时,确定用户对目标视频满意。由于时长参数阈值是根据目标视频的属性参数确定的,能够表示当目标用户对目标视频满意时的时长参数,因此,以该时长参数阈值作为判断依据,可以更加准确的确定出目标用户是否对目标视频满意。

综上所述,本发明实施例一提供的视频满意度确定方法,会先获取目标用户对目标视频的播放操作的时长参数,然后根据目标视频的属性参数以及至少一个预设时长参数阈值函数,确定目标视频对应的时长参数阈值,最后,会根据时长参数阈值以及时长参数,确定目标用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,会根据目标视频的属性参数确定目标视频对应的时长参数阈值,保证不同的目标视频的判断依据是根据自身属性确定的,进而提高确定视频满意度的准确度。

实施例二

图2-1是本发明实施例二提供的一种视频满意度确定方法的步骤流程图,如图2-1所示,该方法可以包括:

步骤201、根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息。

具体的,步骤201可以包括:

步骤2011、根据每个样本视频对应的样本日志,确定每个样本视频对应的至少一条历史播放信息。

本步骤中,历史播放信息可以至少包括样本视频的时长以及历史时长参数,该历史时长参数可以包括历史播放时长或历史点击时长。进一步地,历史播放信息中还可以包括其他内容,比如,包括样本视频的历史播放端类型,每个样本视频对应的每条历史播放信息表示该样本视频被用户播放的一次记录,历史播放信息可以体现样本视频在该次播放中具体是在哪个类型的播放端播放的以及具体的点击时长或播放时长。

具体的,在确定每个样本视频对应的至少一条历史播放信息时,可以先从视频平台的后台获取该样本视频对应的日志,得到该视频对应的样本日志,该样本视频对应的日志可以是该样本视频从进入视频平台以来累计的所有日志,也可以是该样本视频在某个时间段内累计的日志,本发明实施例对此不作限定。然后,可以按照样本日志生成的时间顺序,逐一对每条样本日志进行分析,一般,用户针对视频的每个行为都会产生的日志,日志通常会包括点击时间点,被点击视频的ID,被点击视频对应的播放端类型,以及该被点击视频的时长,本步骤中,可以根据每条样本日志中的点击时间点、被点击的视频ID、被点击视频对应的播放端类型,确定该条日志对应的用户的具体行为。示例的,以历史播放信息包括样本视频的历史播放端类型、样本视频的时长以及历史时长参数,且历史时长参数为播放时长为例,假设样本视频a对应的第一条样本日志1中表示样本视频a在2018年1月15目的20:00在移动端被打开,样本视频a对应的第二条样本日志2中表示样本视频a在2018年1月15目的20:02在移动端被关闭,那么可以生成样本视频a对应的历史播放信息A,假设样本视频a的ID为001,时长为40分钟,该历史播放信息A可以表示为:

platform_id(移动端)\t doc_id(001)\t duration(40min)\t playtime(2min);

其中,platform_id表示样本视频在该次播放中的播放端类型,doc_id表示样本视频的ID,duration表示样本视频的时长,playtime表示样本视频在该次播放中的播放时长。

步骤2012、获取每个样本视频对应的至多m条历史播放信息,得到每个样本视频对应的样本历史播放信息。

本步骤中,m为预先定义的每个样本视频对应的样本历史播放信息的最大条数。其中,m的具体数值可以是开发人员根据实际经验设定的,由于有些样本视频会有大量的点击行为,进而会有对应的大量的样本日志,这样,相较于点击行为较少的样本视频,这些拥有大量点击行为的样本视频的历史播放信息所占据的比重会较大,导致数据分布不均衡,进而会导致根据数据确定的预设时长函数不准确,本发明实施例中,通过限定每个样本视频对应的历史播放信息的最大条数,可以提高数据的均衡性,进而提高最终确定出的预设时长函数的准确性。

具体在获取时,如果该样本视频对应的所有历史播放信息的条数不大于m,则获取该样本视频对应的所有历史播放信息,得到该样本视频对应的样本历史播放信息,如果该样本视频对应的所有历史播放信息的条数大于m,则从该样本视频对应的所有历史播放信息中随机选择m条历史播放信息,作为该样本视频对应的样本历史播放信息。当然,还可以采取其他获取方式,本发明实施例对此不作限定,只要保证选取的条数不大于m即可。

步骤202、基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集。

具体的,可以在所述样本历史播放信息包括样本视频的时长以及历史时长参数时,采用划分方式一:将包含的样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集。也可以在所述样本历史播放信息包括样本视频的时长、历史播放端类型以及历史时长参数时,采用划分方式二:将包含的历史播放端类型相同且样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集。

由于视频平台中视频内容的体积较为庞大,因此,本步骤中,按照时长划分数据集时,可以以秒作为样本视频的时长的单位进行划分。示例的,以采用划分方式一为例,可以将包含的样本视频的时长秒数为10s的样本历史播放信息添加至数据集1中,将包含的样本视频的时长秒数为11s的样本历史播放信息添加至数据集2中…将包含的样本视频的时长秒数为2700s的样本历史播放信息添加至数据集Z中,得到多个样本数据集。以采用划分方式二为例,可以将包含的样本视频的时长秒数为10s且历史播放端类型为PC端的样本历史播放信息添加至数据集1’中,将包含的样本视频的时长秒数为11s且历史播放端类型为PC端的样本历史播放信息添加至数据集2’中...将包含的样本视频的时长秒数为2700s且历史播放端类型为PC端的样本历史播放信息添加至数据集Z’中,得到多个样本数据集。

由于在划分数据集时,是针对所有样本视频对应的样本历史播放信息,整体数据量较为庞大,因此可以采取分桶算法来实现样本数据集的划分,以提高样本数据集划分的效率。分桶算法指的是根据数据的哈希值将数据分发到各个不同的桶中,从而完成数据的分桶过程,桶即为样本数据集。其中,分桶算法中所采用的哈希函数可以是根据数据类型选择的。

步骤203、根据每个样本数据集中每条样本历史播放信息包括的历史时长参数,确定至少一个预设时长阈值函数。

具体的,步骤203可以包括:

步骤2031、将每个对应的样本视频的时长大于第一时长阈值的样本数据集,确定为第一样本数据集,将每个对应的样本视频的时长不大于第一时长阈值的样本数据集,确定为第二样本数据集。

本步骤中,该第一时长阈值可以是开发人员根据实际经验设定的,示例的,该第一时长阈值可以为10s。假设样本数据集1~样本数据集10对应的样本视频时长不大于10s,假设样本数据集11~样本数据集3000对应的样本视频时长大于10s,那么可以将样本数据集11~样本数据集确定为第一样本,将数据集3000样本数据集1~样本数据集10确定为第二样本数据集。

步骤2032、计算每个第一样本数据集中历史时长参数的第一四分位数,将所述第一四分位数和所述第一样本数据集对应的样本视频的时长作为第一样本点,得到多个第一样本点。

本步骤中,在计算第一样本数据集中历史时长参数的第一四分位数时,可以先将该第一样本数据集中每条样本历史播放信息中的历史时长参数按照从大到小的次序排列,以该历史时长参数为播放时长为例,可以将该第一样本数据集中每条样本历史播放信息中的播放时长按照从小到大的次序排列成一个数列,然后将该数列中的第(n+1)/4个数确定为该第一样本数据集中历史时长参数的第一四分位数。进一步地,假设第一样本数据集23中历史时长参数的第一四分位数为10,第一样本数据集23对应的样本视频的时长为30s,那么可以将(20,23)确定为第一样本数据集23对应的第一样本点。

步骤2033、计算每个第二样本数据集中历史时长参数的第三四分位数,将所述第三四分位数和所述第二样本数据集对应的样本视频的时长作为第二样本点,得到多个第二样本点。

本步骤中,在计算第二样本数据集中历史时长参数的第三四分位数时,可以先将该第二样本数据集中每条样本历史播放信息中的历史时长参数按照从大到小的次序排列,以该历史时长参数为播放时长为例,可以将该第二样本数据集中每条样本历史播放信息中的播放时长按照从小到大的次序排列成一个数列,然后将该数列中的第3(n+1)/4个数确定为该第二样本数据集中历史时长参数的第三四分位数。进一步地,假设第二样本数据集9中历史时长参数的第三四分位数为3,第二样本数据集9对应的样本视频的时长为9s,那么可以将(3,9)确定为第二样本数据集23对应的第三样本点。

当样本视频的时长较短时,如果继续采用第一四分位数作为样本点,会导致后续过程中,容易将用户针对该样本视频的误点击判断为用户对该视频满意,示例的,对于时长为9s的视频,它的第一四分位只有3s,而用户的误点击很容易达到3s的播放时长,如果以第一四分位作为标准,很容易将该误点击确定为一次对该视频的满意的观看。本发明实施例中,以第三四分位作为第二样本数据集的样本点,可以避免后续过程中出现判断不准确的问题

步骤2034、根据所述多个第一样本点以及所述多个第二样本点,构建所述至少一个预设时长阈值函数。

具体的,当样本数据集中包括样本视频时长相同的样本历史播放信息时,步骤2034可以通过下述子步骤(1)来实现:

子步骤(1):利用所述多个第一样本点以及所述多个第二样本点进行线性拟合,得到预设时长阈值函数。

本步骤中,可以先以样本视频的时长为参考坐标系的横轴,以历史时长参数的第一四分数或第三四分位数为坐标系的纵轴,在该参考坐标系中确定出每个第一样本点以及每个第二样本点,然后将各个第一样本点和第二样本点依次连接,得到第一曲线,然后对该第一曲线进行解析,得到预设时长阈值函数,在具体实现时,可以采用MATLAB应用进行解析,本发明实施例对此不作限定。

需要说明的是,由于实际应用场景中,时长过长的视频的数量较少,因此随着样本视频时长的增长,第一曲线可能会出现较大的波动,示例的,图2-2是本发明实施例二提供的一种第一曲线示意图,从图2-2中可以看出,第一曲线的后半段部分由明显的波动,因此,在得到第一曲线之后,可以将该第一曲线中波动较大的部分截断,只保留正常波动的部分进行解析,示例的,图2-3是本发明实施例二提供的另一种第一曲线示意图,从图2-3中可以看出,在截断第一曲线的部分之后,第一曲线变得平缓。

当样本数据集中包括样本视频时长相同且历史播放端类型相同的样本历史播放信息时,步骤2034可以通过下述子步骤(2)~子步骤(3)来实现:

子步骤(2):利用对应的历史播放端类型为PC端的第一样本点和对应的历史播放端类型为PC端的第二样本点进行线性拟合,得到第一时长参数阈值函数。

由于针对视频的行为主要产生于移动端和PC端,其他端的较少,统计意义不大,因此,本发明实施例中,播放端类型可以包括移动端和PC端,当然,在本发明的另一可选实施例中,播放端类型还可以包括其他端,比如,电视端,等等。

进一步地,第一样本点对应的第一样本数据集对应的历史播放端类型,即为该第一样本点对应的历史播放端类型,因此,可以在参考坐标系中确定出每个基于对应的历史播放端类型为PC端的第一样本数据集计算得到的第一样本点,以及基于对应的历史播放端类型为PC端的第二样本数据集计算得到的第二样本点,然后将确定出来的各个点依次连接,得到第二曲线,接着对该第二曲线进行解析,得到与PC端对应的第一预设时长参数阈值函数。

子步骤(3):利用对应的历史播放端类型为移动端的第一样本点和对应的历史播放端类型为移动端的第二样本点进行线性拟合,得到第二时长参数阈值函数。

本步骤中,可以在参考坐标系中确定出每个基于对应的历史播放端类型为移动端的第一样本数据集计算得到的第一样本点,以及基于对应的历史播放端类型为移动端的第二样本数据集计算得到的第二样本点,然后将确定出来的各个点依次连接,得到第三曲线,接着对该第三曲线进行解析,得到与移动端对应的第二预设时长参数阈值函数。

由于用户在PC端和移动端的行为特性有明显的差别,在PC端的可能会同时进行其他操作,比如浏览网页,进而会导致在PC端的时长参数普遍大于在移动端的时长参数,示例的,开发人员通过预先统计,统计出PC端的播放时长以及点击时长的平均值分别为574.91s以及805.29s,而574.91,移动端的播放时长以及点击时长的平均值分别为515.82s以及662.35s,可以看出PC端的时长参数普遍大于在移动端的时长参数。因此,本发明实施例中,针对不同的播放端类型确定与播放端类型对应的预设时长参数阈值函数可以提高预设时长参数阈值函数的准确度,进而提高确定视频满意度的准确度。

需要说明的是,由于用户在使用终端的过程中,可能会在播放的视频的同时,浏览其他网页,这样,就会导致点击时长对于用户实际对视频的意愿的代表性较差,因此,优选的,采用播放时长作为历史时长参数,可以更精准的确定目标用户对目标视频是否满意。需要说明的,在实际的应用场景中,由于各个视频平台可能是相互独立的,即就是,视频平台A的开发人员可能无法获取到的视频平台B的所有后台数据,获取其他视频平台内的视频的播放时长的难度较大,因此,实际应用中,开发人员可以对本视频平台内的视频采用播放时长作为历史时长参数,对于其他视频平台内的视频采用点击时长作为历史时长参数。进一步地,在确定预设时长参数阈值函数时,可以预先基于播放时长确定出与PC端对应的第一预设时长参数阈值函数,再基于点击时长确定出与PC端对应的第一预设时长参数阈值函数,基于播放时长确定出与移动端对应的第二预设时长参数阈值函数,再基于点击时长确定出与移动端对应的第二预设时长参数阈值函数,进而得到四组预设时长参数阈值函数,进而方便同时确定用户对本平台内的视频以及其他平台内的视频的满意度。

步骤204、获取目标用户对目标视频的播放操作的时长参数。

具体的,本步骤的实现方式可以参考上述步骤101,本发明实施例在此不做赘述。

步骤205、根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值。

具体的,当样本数据集中包括样本视频时长相同的样本历史播放信息时,即就是,通过上述步骤201~步骤203预先确定出了一个预设时长参数阈值函数时,该属性参数可以包括目标视频的时长,相应地,步骤205可以通过下述步骤2051实现:

步骤2051、若所述目标视频的时长在所述预设时长参数阈值函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述预设时长参数阈值函数中,得到所述目标视频对应的时长参数阈值。

示例的,假设目标视频的时长为2000s,该预设时长参数阈值函数的自变量取值范围为[1,2500],那么可以将2000s代入该预设时长参数阈值函数中,得到该目标视频对应的时长参数阈值。

当样本数据集中包括样本视频时长相同且历史播放端类型相同的样本历史播放信息时,即就是,通过上述步骤201~步骤203预先确定出了与PC端对应的第一预设时长参数阈值函数以及与移动端对应的第二预设时长参数阈值函数时,该属性参数可以包括目标视频的时长以及目标视频在本次播放操作中对应的播放端类型,相应地,步骤205可以通过下述步骤实现:

步骤2052、确定所述目标视频在所述播放操作中对应的播放端类型,得到目标播放端类型。

本步骤中,可以从视频平台的后台数据中,获取该播放操作对应的日志,通过提取该日志中的关键字段,确定目标视频在该播放操作中对应的播放端类型,进而得到目标播放端类型。

步骤2053、将与所述目标播放端类型相对应的预设时长参数阈值函数确定为目标函数。

示例的,假设目标播放端类型为PC端,可以可以将与PC端对应的第一时长参数阈值函数确定为目标函数。

步骤2054、若所述目标视频的时长在所述目标函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述目标函数中,得到所述目标视频对应的时长参数阈值。

需要说明的是,当目标视频的时长不在预设时长参数阈值函数的自变量取值范围内时,可以将该预设时长参数阈值函数的因变量最大值,即就是最大时长参数阈值确定为目标视频对应的时长参数阈值。

步骤206、根据所述时长参数阈值以及所述时长参数,确定所述目标用户对所述目标视频是否满意。

具体的,本步骤的实现方式可以参考上述步骤103,本发明实施例在此不做赘述。

在本发明的另一可选实施例中,在基于预设时长参数阈值函数确定用户的满意度之后,还可以采用人工评判的方式,以部分视频为评判对象,统计这些视频在基于预设时长参数阈值函数确定用户的满意度的方式下以及基于传统的固定时长阈值来确定用户的满意度的方式下的确定效果,以便于进一步对本发明中的方法进行改进。具体的,可以统计这些视频在基于预设时长参数阈值函数确定用户的满意度的方式下以及基于传统的固定时长阈值来确定用户的满意度的方式下,被确定为不满意的点击数在所有点击数中的占比,然后,基于两种方式对应的占比差大于0.2的视频以及该视频对应的搜索关键词,人工判断这些视频的质量是否满足对应的搜索关键字,如果满足则确定占比低的确定方式胜出,如果不满足则确定占比高的确定方式胜出,经过具体实验,可以得出本发明实施例提供的基于预设时长参数阈值函数确定用户的满意度的方法胜出率在92%左右。

综上所述,本发明实施例二提供的视频满意度确定方法,会先根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息,然后基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集,并基于数据集确定至少一个预设时长阈值函数,接着获取目标用户对目标视频的播放操作的时长参数,然后根据目标视频的属性参数以及至少一个预设时长参数阈值函数,确定目标视频对应的时长参数阈值,最后,会根据时长参数阈值以及时长参数,确定目标用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,会根据目标视频的属性参数确定目标视频对应的时长参数阈值,保证不同的目标视频的判断依据是根据自身属性确定的,进而提高确定视频满意度的准确度。

实施例三

图3是本发明实施例三提供的一种视频满意度确定装置的框图,如图3所示,该装置30可以包括:

获取模块301,用于获取目标用户对目标视频的播放操作的时长参数;所述时长参数包括所述目标用户在所述播放操作中,对所述目标视频的播放时长或点击时长;

第一确定模块302,用于根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值;所述属性参数至少包括所述目标视频的时长;

第二确定模块303,用于根据所述时长参数阈值以及所述时长参数,确定所述目标用户对所述目标视频是否满意;

其中,所述预设时长参数阈值函数是预先确定的反映视频的时长与时长参数阈值对应关系的函数,所述预设时长参数阈值函数中,时长参数阈值为因变量,视频的时长为自变量。

综上所述,本发明实施例三提供的视频满意度确定装置,获取模块会先获取目标用户对目标视频的播放操作的时长参数,然后第一确定模块会根据目标视频的属性参数以及至少一个预设时长参数阈值函数,确定目标视频对应的时长参数阈值,最后,第二确定模块会根据时长参数阈值以及时长参数,确定目标用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,会根据目标视频的属性参数确定目标视频对应的时长参数阈值,保证不同的目标视频的判断依据是根据自身属性确定的,进而提高确定视频满意度的准确度。

实施例四

图4是本发明实施例三提供的一种视频满意度确定装置的框图,如图4所示,该装置40可以包括:

获取模块401,用于获取目标用户对目标视频的播放操作的时长参数;所述时长参数包括所述目标用户在所述播放操作中,对所述目标视频的播放时长或点击时长;

第一确定模块402,用于根据所述目标视频的属性参数以及至少一个预设时长参数阈值函数,确定所述目标视频对应的时长参数阈值;所述属性参数至少包括所述目标视频的时长;

第二确定模块403,用于根据所述时长参数阈值以及所述时长参数,确定所述目标用户对所述目标视频是否满意;

其中,所述预设时长参数阈值函数是预先确定的反映视频的时长与时长参数阈值对应关系的函数,所述预设时长参数阈值函数中,时长参数阈值为因变量,视频的时长为自变量。

可选的,上述装置40还包括:

第三确定模块404,用于根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息;所述样本历史播放信息至少包括样本视频的时长以及历史时长参数;

划分模块405,用于基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集;

第四确定模块406,用于根据每个样本数据集中每条样本历史播放信息包括的历史时长参数,确定至少一个预设时长阈值函数。

可选的,上述划分模块405,用于:

在所述样本历史播放信息包括样本视频的时长以及历史时长参数时,将包含的样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集;

在所述样本历史播放信息包括样本视频的时长、历史播放端类型以及历史时长参数时,将包含的历史播放端类型相同且样本视频的时长相同的样本历史播放信息添加至同一数据集,得到多个样本数据集。

可选的,上述第三确定模块404,用于:

根据每个样本视频对应的样本日志,确定每个样本视频对应的至少一条历史播放信息;

获取每个样本视频对应的至多m条历史播放信息,得到每个样本视频对应的样本历史播放信息;所述m为预先定义的每个样本视频对应的样本历史播放信息的最大条数。

可选的,上述第四确定模块406,包括:

确定子模块,用于将每个对应的样本视频的时长大于第一时长阈值的样本数据集,确定为第一样本数据集,将每个对应的样本视频的时长不大于第一时长阈值的样本数据集,确定为第二样本数据集;

第一计算子模块,用于计算每个第一样本数据集中历史时长参数的第一四分位数,将所述第一四分位数和所述第一样本数据集对应的样本视频的时长作为第一样本点,得到多个第一样本点;

第二计算子模块,用于计算每个第二样本数据集中历史时长参数的第三四分位数,将所述第三四分位数和所述第二样本数据集对应的样本视频的时长作为第二样本点,得到多个第二样本点;

构建子模块,用于根据所述多个第一样本点以及所述多个第二样本点,构建所述至少一个预设时长阈值函数。

可选的,当所述样本数据集中包括样本视频时长相同的样本历史播放信息时,上述构建子模块,用于:

利用所述多个第一样本点以及所述多个第二样本点进行线性拟合,得到预设时长阈值函数。

可选的,当所述样本数据集中包括样本视频时长相同且历史播放端类型相同的样本历史播放信息时,所述至少一个预设的时长参数阈值函数至少包括:与PC端对应的第一预设时长参数阈值函数和与移动端对应的第二预设时长参数阈值函数;

上述构建子模块,用于:

利用对应的历史播放端类型为PC端的第一样本点和对应的历史播放端类型为PC端的第二样本点进行线性拟合,得到第一预设时长参数阈值函数;

利用对应的历史播放端类型为移动端的第一样本点和对应的历史播放端类型为移动端的第二样本点进行线性拟合,得到第二预设时长参数阈值函数。

可选的,所述属性参数为所述目标视频的时长;

所述第一确定模块402,用于:

若所述目标视频的时长在所述预设时长参数阈值函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述预设时长参数阈值函数中,得到所述目标视频对应的时长参数阈值。

可选的,所述属性参数为所述目标视频的时长以及所述目标视频在所述播放操作中对应的播放端类型,所述播放端类型至少包括电脑PC端和移动端;

所述第一确定模块402,用于:

确定所述目标视频在所述播放操作中对应的播放端类型,得到目标播放端类型;

将与所述目标播放端类型相对应的预设时长参数阈值函数确定为目标函数;

若所述目标视频的时长在所述目标函数的自变量取值范围内,将所述目标视频的时长作为自变量,代入所述目标函数中,得到所述目标视频对应的时长参数阈值。

综上所述,本发明实施例四提供的视频满意度确定装置,第三确定模块会先根据每个样本视频对应的样本日志,确定每个样本视频对应的样本历史播放信息,然后划分模块会基于每个样本视频的时长,将每个样本视频对应的样本历史播放信息划分至多个样本数据集,第四确定模块会基于数据集确定至少一个预设时长阈值函数,接着获取模块会获取目标用户对目标视频的播放操作的时长参数,然后第一确定模块会根据目标视频的属性参数以及至少一个预设时长参数阈值函数,确定目标视频对应的时长参数阈值,最后,第二确定模块会根据时长参数阈值以及时长参数,确定目标用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,会根据目标视频的属性参数确定目标视频对应的时长参数阈值,保证不同的目标视频的判断依据是根据自身属性确定的,进而提高确定视频满意度的准确度。

对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。

在此提供的视频满意度确定方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的视频中背景音乐的识别方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1