一种视频搜索方法和装置与流程

文档序号:15851345发布日期:2018-11-07 10:00阅读:173来源:国知局
一种视频搜索方法和装置与流程

本发明涉及互联网技术领域,特别是涉及一种视频搜索方法和一种视频搜索装置。

背景技术

随着视频网站规模的发展,视频网站搜索引擎索引库中的视频内容也越来越丰富,同一个搜索查询词下可召回的视频量越来越多。

传统视频搜索引擎通过相关性,点击量等维度对召回的视频排序,并以瀑布流等形式返回给用户最优的topn个视频,用户通过下滑或翻页浏览,选择符合意图的视频并点击观看。

但是,当用户输入的查询词较为泛化时,会召回很多视频,当这些视频结果有不同的主题且不同用户关注点不一样时,用户需要在传统的瀑布流结果中一条条分辨,找到符合自己需求的视频,这样会消耗用户更多时间和精力,增加了用户选择成本,用户搜索体验较一般。



技术实现要素:

鉴于上述问题,本发明实施例提出了一种视频搜索方法和相应的一种视频搜索装置。

为了解决上述问题,本发明实施例公开了一种种视频搜索方法,包括:

基于用户输入的视频搜索关键词,获取一个或多个第一搜索结果;

判断是否需要针对所述一个或多个第一搜索结果生成视频标签;

若是,则生成视频标签;

展现所述一个或多个第一搜索结果和所述视频标签;

当接收到用户针对视频标签的搜索请求时,基于所述视频标签,从所述一个或多个第一搜索结果中选择出第二搜索结果;

展现所述第二搜索结果。

优选的,还包括:

若不需要针对所述一个或多个第一搜索结果生成视频标签,则展现所述一个或多个第一搜索结果。

优选的,每个第一搜索结果具有至少一个属性标签;

所述判断是否需要针对所述一个或多个第一搜索结果生成视频标签的步骤包括:

统计所有第一搜索结果的属性标签的种类;

判断属性标签的种类的数量是否大于预设数量n;

若是,则判定需要针对所述一个或多个第一搜索结果生成视频标签;其中,所述视频标签为所有属性标签中,数量排名前n个属性标签的集合,所述n为正整数。

优选的,基于所述视频标签,从所述一个或多个第一搜索结果中选择出第二搜索结果的步骤包括:

将所述视频标签分别与每个第一搜索结果的属性标签进行匹配;

若存在至少一个匹配项,则将匹配的第一搜索结果确定为第二搜索结果。

优选的,所述属性标签通过如下方式生成:

获取所述视频的日志标签,和/或,内容标签;

判断所述日志标签,和/或,所述内容标签是否与预置的限定标签集存在匹配项;

若是,则将所述日志标签,和/或,所述内容标签作为所述视频的属性标签。

相应的,本发明实施例公开了一种视频搜索装置,包括:

获取模块,用于基于用户输入的视频搜索关键词,获取一个或多个第一搜索结果;

判断模块,用于判断是否需要针对所述一个或多个第一搜索结果生成视频标签;

生成模块,用于生成视频标签;

展现模块,用于展现所述一个或多个第一搜索结果和所述视频标签;

选择模块,用于当接收到用户针对视频标签的搜索请求时,基于所述视频标签,从所述一个或多个第一搜索结果中选择出第二搜索结果;

所述展现模块,还用于展现所述第二搜索结果。

优选的,若不需要针对所述一个或多个第一搜索结果生成视频标签,所述展现模块还用于展现所述一个或多个第一搜索结果。

优选的,每个第一搜索结果具有至少一个属性标签;

所述判断模块包括:

统计子模块,用于统计所有第一搜索结果的属性标签的种类;

属性标签种类数量判断子模块,用于判断属性标签的种类的数量是否大于预设数量n;

判定子模块,用于判定需要针对所述一个或多个第一搜索结果生成视频标签;其中,所述视频标签为所有属性标签中,数量排名前n个属性标签的集合,所述n为正整数。

优选的,选择模块包括:

匹配子模块,用于将所述视频标签分别与每个第一搜索结果的属性标签进行匹配;

确定子模块,用于若存在至少一个匹配项,则将匹配的第一搜索结果确定为第二搜索结果。

优选的,所述属性标签通过如下方式生成:

获取所述视频的日志标签,和/或,内容标签;

判断所述日志标签,和/或,所述内容标签是否与预置的限定标签集存在匹配项;

若是,则将所述日志标签,和/或,所述内容标签作为所述视频的属性标签。

本发明实施例包括以下优点:

在本发明实施例中,先基于用户输入的视频搜索关键词,获取一个或多个第一搜索结果,再判断是否需要针对所述一个或多个第一搜索结果生成视频标签,若是,则生成视频标签,并展现所述一个或多个第一搜索结果和所述视频标签,当接收到用户针对视频标签的搜索请求时,基于所述视频标签,从所述一个或多个第一搜索结果中选择出一个或多个第二搜索结果,最后,展现所述一个或多个第二搜索结果。这样,通过在线实时智能生成搜索结果的视频标签,帮助用户筛选感兴趣的分类主题内容,还可以帮助用户快速有效定位到自己感兴趣的视频,有助于拓展用户兴趣,发现新内容,提升点击率和搜索导流率,同时,也提升了用户的搜索效率和用户体验。

附图说明

图1是本发明的一种视频搜索方法实施例的步骤流程图;

图2是本发明的一种视频搜索装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1,示出了本发明的一种视频搜索方法实施例的步骤流程图,具体可以包括如下步骤:

步骤101,基于用户输入的视频搜索关键词,获取一个或多个第一搜索结果;

在实际应用中,用户可以通过浏览器在视频网站上进行视频搜索、观看,也可以通过客户端进行视频搜索、观看。不管是浏览器还是客户端,都具有搜索栏,用户可以通过在搜索栏内输入搜索关键词来进行视频搜索。

用户在搜索栏输入搜索关键词后,可以通过“回车键”,或者点击“搜索”按键等方式触发搜索引擎进行搜索,然后搜索引擎就可以返回与搜索关键词相关的搜索结果。

搜索结果的数量则取决于关键词的范围,比如,关键词的字数较多,或者关键词的语义较窄,那么搜索结果的数量就可能较少,甚至没有;而关键词的字数较少,或者关键词的语义较泛,那么搜索结果的数量就可能较多了。

步骤102,判断是否需要针对所述一个或多个第一搜索结果生成视频标签;

当搜索引擎获取到一个或多个搜索结果后,是否需要马上向用户展现获取到的一个或多个搜索结果,取决于是否需要针对获取到的一个或多个搜索结果生成视频标签。

在本发明一种优选实施例中,每个第一搜索结果具有至少一个属性标签。比如,用户输入搜索关键词“周杰伦”,搜索得到了100个结果,有的搜索结果是新闻,那么该搜索结果的属性标签可以是“新闻”,有的搜索结果是歌曲,那么该搜索结果的属性标签可以是“歌曲”,还有的搜索结果是新闻视频,那么该搜索结果的属性标签可以是“新闻”、“视频”等等。也就是说,每个搜索结果至少具有一个属性标签,而属性标签的数量可以没有上限,也可以设置上限,比如5个、6个,这个可以根据实际需求进行设置,本发明实施例对此不作限制。

在本发明一种优选实施例中,所述属性标签通过如下方式生成:

获取所述视频的日志标签,和/或,内容标签;

采用预置的限定标签集对所述日志标签,和/或,所述内容标签进行过滤,得到所述视频的属性标签。

具体而言,视频的属性标签可以在离线的环境下生成。日志标签是基于用户的视频搜索日志生成的,内容标签是基于视频的文本内容生成的,然后采用预置的限定标签集对日志标签,和/或,内容标签进行过滤,就可以得到视频的属性标签了。

其中,预置的限定标签集可以自动生成,也可以是人工生成,还可以是先自动生成,然后人工进行筛选。而限定标签集中标签的数量可以根据实际需求进行设置,比如1000个标签、2000个标签,或者其它数量的标签。另外,限定标签集中的标签是不包含重复的标签。

需要说明的是,在实际应用中,会出现没有日志标签的情况,比如,用户清理了日志,那么自然就无法获取日志标签了,这种情况下,属性标签就是内容标签了,内容标签同理;如果日志标签和内容标签都存在,那么属性标签就可以同时包括日志标签和内容标签了。

在本发明一种优选实施例中,所述日志标签通过如下方式生成:

获取用户的视频搜索日志;

对所述视频搜索日志进行分词处理,得到一个或多个关键词;

对所述一个或多个关键词进行过滤;

将过滤后的关键词作为所述视频的日志标签。

具体而言,不管用户是在浏览器还是客户端上进行视频搜索时,用户在进行视频搜索的时候在本地都会生成搜索日志,然后就可以对搜索日志进行分词处理,得到一个或多个字或词,再将无意义的字或词过滤掉,比如“的”、“在”等等,将过滤后得到的一个或多个关键词作为视频的日志标签。

比如,用户通过搜索“周杰伦的最新单曲mv”得到某个视频,在本地生成了一条搜索日志为“周杰伦的最新单曲mv”,通过分词处理得到“周杰伦”、“的”、“最新”、“单曲”、“mv”五个字/词,将这五个字/词进行过滤,去掉“的”后,就可以得到“周杰伦”、“最新”、“单曲”、“mv”四个关键词,所以,将这四个关键词作为该视频的日志标签。

在本发明一种优选实施例中,所述内容标签通过如下方式生成:

获取所述视频的文本信息;

对所述文本信息进行分词处理,得到一个或多个关键词;

对所述一个或多个关键词进行过滤;

将过滤后的关键词作为所述视频的内容标签。

具体而言,文本信息可以包括视频的标题和内容简介,用户观看完视频后,就可以对文本信息进行分词处理,得到一个或多个字或词,再将无意义的字或词过滤掉,比如“的”、“在”等等,将过滤后得到的一个或多个关键词作为视频的内容标签。

在本发明一种优选实施例中,所述采用预置的限定标签集对所述日志标签,和/或,所述内容标签进行过滤,得到所述视频的属性标签的步骤包括:

判断所述日志标签,和/或,所述内容标签是否与所述限定标签集存在匹配项;

若是,则将所述日志标签,和/或,所述内容标签作为所述视频的属性标签。

具体而言,为了避免出现违反法律等情况的标签,在获得了视频的日志标签和内容标签后,需要采用限定标签集对日志标签和内容标签进行过滤,即,将日志标签,和/或,内容标签与限定标签集进行匹配,如果日志标签,和/或,内容标签不是限定标签集中的标签,那么是不能作为视频的属性标签。

比如,某个视频的日志标签、内容标签为“小猪佩奇”、“玩具”,将“小猪佩奇”、“玩具”与限定标签集进行匹配,通过匹配得知,“小猪佩奇”与限定标签集存在匹配项,“玩具”与限定标签集不存在匹配项,因此,该视频的属性标签为“小猪佩奇”。

所述判断是否需要针对所述一个或多个第一搜索结果生成搜索标签的步骤包括:

统计所有第一搜索结果的属性标签的种类;

判断属性标签的种类的数量是否大于预设数量n;

若是,则判定需要针对所述一个或多个第一搜索结果生成视频标签;其中,所述视频标签为所有属性标签中,数量排名前n个属性标签的集合,所述n为正整数。

例如,用户输入搜索关键词“周杰伦”,得到100个搜索结果,100个搜索结果中,有的搜索结果具有一个属性标签,有的搜索结果具有多个属性标签,将所有搜索结果的所有属性标签进行统计,然后过滤掉重复的属性标签,如果过滤后的属性标签的种类的数量大于1且大于预设数量,比如100个搜索结果总共具有6个属性标签,预设数量为2,那么就判定需要针对这100个搜索结果生成视频标签。

需要说明的是,视频标签为所有属性标签中,数量排名前n个属性标签的集合,n为正整数。比如,100个搜索结果总共具有6个属性标签,预设数量为2,那么就从这6个属性标签里选择出数量最多的2个属性标签作为这100个搜索结果的视频标签。而6个属性标签中,各个属性标签的数量则可以通过对100个搜索结果的属性标签进行统计得知,例如,搜索结果a包括a、b、c三个属性标签,搜索结果b包括c一个属性标签,搜索结果c包括a、c两个属性标签,搜索结果d包括a、d两个属性标签,那么a的数量就是3,b的数量就是1,c的数量就是3,d的数量就是1。

当然,属性标签的种类的预设数量可以根据实际需求进行设置,本发明实施例对此不作限制。

步骤103,若是,则生成视频标签;

当确定需要针对一个或多个第一搜索结果生成视频标签时,则生成视频标签。

在本发明一种优选实施例中,若不需要针对所述一个或多个第一搜索结果生成视频标签,则展现所述一个或多个第一搜索结果。

比如,过滤后的属性标签的种类的数量为1,即100个搜索结果的属性标签全部相同,比如100个搜索结果全部为“歌曲”,那么,就判定不需要针对一个或多个第一搜索结果生成视频标签。因此,直接展现一个或多个第一搜索结果。

另外,在展现一个或多个第一搜索结果时,可以按一定的规则对所有的搜索结果进行先排序再展现,也可以直接进行展现,本发明实施例对此不作限制。

步骤104,展现所述一个或多个第一搜索结果和所述视频标签;

在展现一个或多个第一搜索结果和视频标签时,可以在一个或多个第一搜索结果的前面显示视频标签,比如“您是不是要找:xxx、xx”,其中“xxx、xx”即为视频标签,“xxx、xx”的数量即为视频标签的数量。

另外,在展现一个或多个第一搜索结果和视频标签时,可以按一定的规则对所有的搜索结果和视频标签进行先排序再展现,也可以直接进行展现,本发明实施例对此不作限制。

步骤105,当接收到用户针对视频标签的搜索请求时,基于所述视频标签,从所述一个或多个第一搜索结果中选择出第二搜索结果;

如果用户点击了视频标签中的标签,则从一个或多个第一搜索结果中选择出具有该标签的结果,作为第二搜索结果。

在本发明一种优选实施例中,所述基于所述视频标签,从所述一个或多个第一搜索结果中选择出第二搜索结果的步骤包括:

将所述视频标签分别与每个第一搜索结果的属性标签进行匹配;

若存在至少一个匹配项,则将匹配的第一搜索结果确定为第二搜索结果。

具体而言,将用户点击的视频标签与每个第一搜索结果的属性标签进行匹配,如果某个第一搜索结果的属性标签中包括用户点击的视频标签,那么就将该第一搜索结果作为第二搜索结果了。

需要说明的是,如果只有一个第一搜索结果,那么,第二搜索结果的数量最多就是一个了;如果有多个第一搜索结果,那么,第二搜索结果的数量也可以是多个了。

步骤106,展现所述第二搜索结果。

在挑选出一个或多个第二搜索结果后,就可以展现给用户了。而且,在展现一个或多个第二搜索结果时,可以按一定的规则对所有的搜索结果进行先排序再展现,也可以直接进行展现,本发明实施例对此不作限制。

在本发明实施例中,先基于用户输入的视频搜索关键词,获取一个或多个第一搜索结果,再判断是否需要针对所述一个或多个第一搜索结果生成视频标签,若是,则生成视频标签,并展现所述一个或多个第一搜索结果和所述视频标签,当接收到用户针对视频标签的搜索请求时,基于所述视频标签,从所述一个或多个第一搜索结果中选择出一个或多个第二搜索结果,最后,展现所述一个或多个第二搜索结果。这样,通过在线实时智能生成搜索结果的视频标签,帮助用户筛选感兴趣的分类主题内容,还可以帮助用户快速有效定位到自己感兴趣的视频,有助于拓展用户兴趣,发现新内容,提升点击率和搜索导流率,同时,也提升了用户的搜索效率和用户体验。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图2,示出了本发明的一种视频搜索装置实施例的结构框图,具体可以包括如下模块:

获取模块201,用于基于用户输入的视频搜索关键词,获取一个或多个第一搜索结果;

判断模块202,用于判断是否需要针对所述一个或多个第一搜索结果生成视频标签;

生成模块203,用于生成视频标签;

展现模块204,用于展现所述一个或多个第一搜索结果和所述视频标签;

选择模块205,用于当接收到用户针对视频标签的搜索请求时,基于所述视频标签,从所述一个或多个第一搜索结果中选择出第二搜索结果;

所述展现模块,还用于展现所述第二搜索结果。

在本发明一种优选实施例中,若不需要针对所述一个或多个第一搜索结果生成视频标签,所述展现模块还用于展现所述一个或多个第一搜索结果。

在本发明一种优选实施例中,每个第一搜索结果具有至少一个属性标签;

所述判断模块包括:

统计子模块,用于统计所有第一搜索结果的属性标签的种类;

属性标签种类数量判断子模块,用于判断属性标签的种类的数量是否大于预设数量n;

判定子模块,用于判定需要针对所述一个或多个第一搜索结果生成视频标签;其中,所述视频标签为所有属性标签中,数量排名前n个属性标签的集合,所述n为正整数。

在本发明一种优选实施例中,选择模块包括:

匹配子模块,用于将所述视频标签分别与每个第一搜索结果的属性标签进行匹配;

确定子模块,用于若存在至少一个匹配项,则将匹配的第一搜索结果确定为第二搜索结果。

在本发明一种优选实施例中,所述属性标签通过如下方式生成:

获取所述视频的日志标签,和/或,内容标签;

判断所述日志标签,和/或,所述内容标签是否与预置的限定标签集存在匹配项;

若是,则将所述日志标签,和/或,所述内容标签作为所述视频的属性标签。

在本发明一种优选实施例中,所述日志标签通过如下方式生成:

获取用户的视频搜索日志;

对所述视频搜索日志进行分词处理,得到一个或多个关键词;

对所述一个或多个关键词进行过滤;

将过滤后的关键词作为所述视频的日志标签。

在本发明一种优选实施例中,所述内容标签通过如下方式生成:

获取所述视频的文本信息;

对所述文本信息进行分词处理,得到一个或多个关键词;

对所述一个或多个关键词进行过滤;

将过滤后的关键词作为所述视频的内容标签。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种视频搜索方法和一种视频搜索装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1