一种视频搜索方法及装置与流程

文档序号:16248561发布日期:2018-12-11 23:48阅读:174来源:国知局
一种视频搜索方法及装置与流程

本申请涉及计算机领域,特别涉及一种视频搜索方法及装置。

背景技术

在视频搜索中,当用户输入查询词搜索视频时,搜索引擎返回与该查询词相关的视频,然而由于返回的视频量非常大,若把质量差的视频并排到靠前的位置返回给用户,会直接影响用户的搜索效果及降低用户体验。

可见,如何进行视频搜索,提高搜索效果和用户体验成为问题。



技术实现要素:

为解决上述技术问题,本申请实施例提供一种视频搜索方法及装置,以达到提高质量高的视频的展示机会,进而提高搜索效果和用户体验的目的,技术方案如下:

一种视频搜索方法,包括:

响应搜索视频请求,获取查询词;

获取视频名称中包含所述查询词的视频,作为目标视频;

利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,所述质量评估模型为预先利用训练视频的视频质量水平参数和视频特征参数训练得到的模型;

选取质量评估结果高于设定质量阈值的视频,作为搜索结果。

优选的,所述质量评估模型的训练过程,包括:

获取各个训练视频的视频质量水平参数和视频特征参数;

利用各个所述训练视频的视频质量水平参数和视频特征参数,训练质量评估模型,得到训练后的质量评估模型。

优选的,所述获取各个所述训练视频的视频质量水平参数,包括:

获取各个所述训练视频的视频时长及观看时长;

若各个所述训练视频的观看时长大于第一预设阈值或观看时长与视频时长的比值大于第二预设阈值,则确定各个所述训练视频的点击行为是长点击行为,并统计预设时间内,各个所述训练视频的长点击行为的次数;

确定各个所述训练视频的长点击行为的次数所属的次数区间段,作为视频质量水平参数。

优选的,所述获取各个所述训练视频的视频特征参数,包括:

获取各个所述训练视频的属性信息及视频上传者的统计信息;

将各个所述训练视频的属性信息及视频上传者的统计信息作为视频特征参数。

优选的,所述质量评估模型为树模型gbdt。

一种视频搜索装置,包括:

第一获取模块,用于响应搜索视频请求,获取查询词;

第二获取模块,用于获取视频名称中包含所述查询词的视频,作为目标视频;

质量评估模块,用于利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,所述质量评估模型为预先利用训练视频的视频质量水平参数和视频特征参数训练得到的模型;

选取模块,用于利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,所述质量评估模型为预先利用训练视频的视频质量水平参数和视频特征参数训练得到的模型。

优选的,还包括:质量评估模型训练模块,用于获取各个训练视频的视频质量水平参数和视频特征参数,及利用各个所述训练视频的视频质量水平参数和视频特征参数,训练质量评估模型,得到训练后的质量评估模型。

优选的,所述质量评估模型训练模块具体用于:

获取各个所述训练视频的视频时长及观看时长;

若各个所述训练视频的观看时长大于第一预设阈值或观看时长与视频时长的比值大于第二预设阈值,则确定各个所述训练视频的点击行为是长点击行为,并统计预设时间内,各个所述训练视频的长点击行为的次数;

确定各个所述训练视频的长点击行为的次数所属的次数区间段,作为视频质量水平参数。

优选的,所述质量评估模型训练模块具体用于:

获取各个所述训练视频的属性信息及视频上传者的统计信息;

将各个所述训练视频的属性信息及视频上传者的统计信息作为视频特征参数。

优选的,所述质量评估模型为树模型gbdt。

与现有技术相比,本申请的有益效果为:

在本申请中,通过响应搜索视频请求,获取查询词,及获取视频名称中包含所述查询词的视频,作为目标视频,及利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,及选取质量评估结果高于设定质量阈值的视频,作为搜索结果,可以提高质量较高的视频的展示机会,进而可以提高搜索效果和用户体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请提供的视频搜索方法的一种流程图;

图2是本申请提供的质量评估模型的训练过程的一种流程图;

图3是本申请提供的获取训练视频的视频质量水平参数的一种流程图;

图4是本申请提供的获取训练视频的视频特征参数的一种流程图;

图5是本申请提供的视频搜索装置的一种逻辑结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例公开了一种视频搜索方法,通过响应搜索视频请求,获取查询词,及确定与所述查询词相关的视频,及利用预先训练的质量评估模型,对所述查询词相关的各个视频进行质量评估,得到质量评估结果,及按照质量评估结果由高至低的顺序,选择前设定数目的视频,优先选择质量高的视频作为搜索结果,提高了质量高的视频的展示机会。

接下来对本申请的视频搜索方法进行介绍,请参见图1,该方法包括:

步骤s11、响应搜索视频请求,获取查询词。

本实施例中,用户可以在搜索页面上输入查询词,发起视频搜索请求,视频搜索装置则响应用户发起的搜索视频请求,获取查询词。

步骤s12、获取视频名称中包含所述查询词的视频,作为目标视频。

本实施例中,可以采用现有的搜索方式,获取视频名称中包含所述查询词的视频。

步骤s13、利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果。

所述质量评估模型为预先利用训练视频的视频质量水平参数和视频特征参数训练得到的模型。

可以理解的是,视频质量水平参数可以直接反映视频的质量,视频特征参数与视频质量相关,可以从侧面反映视频的质量,因此本实施例利用视频质量水平参数和视频特征参数对质量评估模型进行训练,保证质量评估模型能够实现对视频的质量的评估。

步骤s14、选取质量评估结果高于设定质量阈值的视频,作为搜索结果。

可以理解的是,选取质量评估结果高于设定质量阈值的视频,作为搜索结果,可以保证搜索结果为视频质量较高的视频。

需要说明的是,质量评估结果可以存入视频质量库,后续进行视频搜索时,可以直接调用视频质量库中的质量评估结果,并选取质量评估结果高于设定质量阈值的视频,作为搜索结果,可以节省搜索时间,提高搜索效率。

在本申请中,通过响应搜索视频请求,获取查询词,及获取视频名称中包含所述查询词的视频,作为目标视频,及利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,及选取质量评估结果高于设定质量阈值的视频,作为搜索结果,可以提高质量较高的视频的展示机会,进而可以提高搜索效果和用户体验。

本实施例中,质量评估模型具体可以为但不局限于模型gbdt。

在本申请的另一个实施例中,对质量评估模型的训练过程进行介绍,请参见图2,可以包括以下步骤:

步骤s21、获取各个训练视频的视频质量水平参数和视频特征参数。

本实施例中,视频质量水平参数可以直接反映视频的质量,视频特征参数可以从侧面反映视频的质量。

步骤s22、利用各个所述训练视频的视频质量水平参数和视频特征参数,训练质量评估模型,得到训练后的质量评估模型。

本实施例中,训练视频的视频质量水平参数可以直接反映视频的质量。训练视频的视频特征参数为与视频质量相关的特征参数,可以从侧面反映视频的质量,因此本实施例利用视频质量水平参数和视频特征参数两个参数对质量评估模型进行训练,可以保证训练得到的质量评估模型可以更加准确、全面的对视频质量进行评估。

在本申请的另一个实施例中,对获取各个训练视频的视频质量水平参数进行介绍,请参见图3,可以包括以下步骤:

步骤s31、获取各个训练视频的视频时长及观看时长。

可以理解的是,视频时长指的是训练视频本身的时长,观看时长指的是用户点击训练视频后,训练视频播放的时长。

步骤s32、若各个所述训练视频的观看时长大于第一预设阈值或观看时长与视频时长的比值大于第二预设阈值,则确定各个所述训练视频的点击行为是长点击行为,并统计预设时间内,各个所述训练视频的长点击行为的次数。

由于用户对视频的搜索点击行为能反映视频的质量,如,对于质量差无价值的视频,用户点击进入后,观看会发现质量差,没有价值,不是想要的结果就会很快跳出,这种视频的用户观看时长普遍较低,而对于质量高、有价值的视频,用户点击进入后,观看会发现质量高、有价值,会较长时间的观看,这种高质量的视频的用户观看时长普遍较高,因此通过确定搜索点击行为是否为长点击行为来进一步确定视频质量水平参数。

需要说明的是,第一预设阈值和第二预设阈值可以基于所有视频的观看时长分部和观看时长与视频时长的比值分布进行设置。第一预设阈值具体可以包括但不局限于40秒,第四预设阈值具体可以包括但不局限于0.2。

当然,可以将观看时长小于第三预设阈值或观看时长与视频时长的比值小于第四预设阈值的训练视频的点击行为确定为短点击行为。同样的,第三预设阈值和第四预设阈值可以基于所有视频的观看时长分部和观看时长与视频时长的比值分布进行设置。第三预设阈值具体可以包括但不局限于120秒,第二预设阈值具体可以包括但不局限于0.8。

其中,预设时间可以灵活设置,如,具体可以设置为7天。

步骤s33、确定各个所述训练视频的长点击行为的次数所属的次数区间段,作为视频质量水平参数。

需要说明的是,可以预先长点击行为的次数进行范围划分,划分的结果即为不同的次数区间段,如,将长点击行为的次数0划分为一个区间,记为区间段0[0];将长点击行为的次数1-10划分为一个区间,记为区间段1[1,10];将长点击行为的次数11-100划分为一个区间,记为区间段2[11-100];……将长点击行为的次数不小于1000的划分为一个区间,记为区间段n[1000,more]。

基于预先对长点击行为的次数进行范围划分,确定的区间段,可以确定各个所述训练视频的长点击行为的次数所属的次数区间段。

现举例对确定各个所述训练视频的长点击行为的次数所属的次数区间段,作为视频质量水平参数进行说明,例如,若训练视频的长点击行为的次数等于0,则可以确定其所属的次数区间段为区间段0[0];若训练视频的长点击行为的次数小于等于10,则可以确定其所属的次数区间段为区间段1[1,10];若训练视频的长点击行为的次数小于等于100,则可以确定其所属的次数区间段为区间段2[11-100],……若训练视频的长点击行为的次数不小于1000,则可以确定其所属的次数区间段为区间段n[1000,more]。

确定各个所述训练视频的长点击行为的次数所属的次数区间段,作为视频质量水平参数,可以减少训练的计算量,提高训练速度。

当然,本实施例中也可以直接确定各个所述训练视频的长点击行为的次数,作为视频质量水平参数。

直接确定各个所述训练视频的长点击行为的次数,作为视频质量水平参数,可以保证视频质量水平参数的全面性,从而保证训练样本的多样性,进而可以保证训练的质量评估模型更加准确。

在本申请的另一个实施例中,对获取训练视频的视频特征值视频特征参数进行介绍,请参见图4,可以包括以下步骤:

步骤s41、获取训练视频的属性信息及视频上传者的统计信息。

对于一些新进入搜索系统的视频,没有用户点击行为,不能直接评估其视频质量,然而可以根据同种类型的视频,其被用户点击的行为具有相似性,用户点击行为计算的视频质量也相似;另外,短期内同一用户的兴趣品味相对比较稳定,其上传的视频具有一定的相似性,积累的用户行为也有相似性,来确定视频的属性信息,及视频上传者的统计信息作为特征,对视频进行初步的质量评估。

可以理解的是,训练视频的属性信息指的是训练视频本身固有的属性信息,如,视频来源网站、频道、时长等。

视频上传者的统计信息可以包括上传者近期上传的视频量、平均点击时长比、长点击占比、短点击占比、平均曝光量点击量等。

步骤s42、将所述训练视频的属性信息及视频上传者的统计信息作为视频特征参数。

本实施例将训练视频的属性信息及视频上传者的统计信息两个信息作为视频特征参数,可以保证视频特征参数更加全面,从而保证训练样本的多样性,进而可以保证训练的质量评估模型更加准确。

下面对本申请实施例提供的视频搜索装置进行描述,下文描述的视频搜索装置与上文描述的视频搜索方法可相互对应参照。

请参见图5,其示出了本申请提供的视频搜索装置的一种逻辑结构示意图,视频搜索装置包括:第一获取模块11、第二获取模块12、质量评估模块13和选取模块14。

第一获取模块11,用于响应搜索视频请求,获取查询词。

第二获取模块12,用于获取视频名称中包含所述查询词的视频,作为目标视频。

质量评估模块13,用于利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,所述质量评估模型为预先利用训练视频的视频质量水平参数和视频特征参数训练得到的模型。

选取模块14,用于利用预先训练的质量评估模型,对各个所述目标视频进行质量评估,得到质量评估结果,所述质量评估模型为预先利用训练视频的视频质量水平参数和视频特征参数训练得到的模型。

上述视频搜索装置还可以包括:质量评估模型训练模块,用于获取各个训练视频的视频质量水平参数和视频特征参数,及利用各个所述训练视频的视频质量水平参数和视频特征参数,训练质量评估模型,得到训练后的质量评估模型。

本实施例中,所述质量评估模型训练模块具体可以用于:

获取各个所述训练视频的视频时长及观看时长;

若各个所述训练视频的观看时长大于第一预设阈值或观看时长与视频时长的比值大于第二预设阈值,则确定各个所述训练视频的点击行为是长点击行为,并统计预设时间内,各个所述训练视频的长点击行为的次数;

确定各个所述训练视频的长点击行为的次数所属的次数区间段,作为视频质量水平参数。

本实施例中,所述质量评估模型训练模块具体可以用于:

获取各个所述训练视频的属性信息及视频上传者的统计信息;

将各个所述训练视频的属性信息及视频上传者的统计信息作为视频特征参数。

本实施例中,所述质量评估模型具体可以为但不局限于树模型gbdt。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

以上对本申请所提供的一种视频搜索方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1