一种视频搜索方法及装置与流程

文档序号:13804887阅读:121来源:国知局
一种视频搜索方法及装置与流程

本发明涉及互联网信息技术领域,更具体的说,是涉及一种视频搜索方法及装置。



背景技术:

随着视频网络应用的普及和发展,涌现出很多视频网站,方便用户在视频网站上搜索视频进行观看,极大丰富了用户的生活。

目前,视频网站允许用户搜索视频所采用的视频搜索方法主要是在接收到用户的搜索请求后,对该搜索请求进行解析,并在解析结果命中预设的配置文件中的某一个标签时,从命中的标签所对应的索引字段内确定出符合用户的搜索请求的全部视频结果,进而将确定出来的全部视频结果显示给用户。然而,由于配置文件中包含的多个标签之间相互独立,且每个标签都具有与之对应的索引字段,导致采用现有的视频搜索方法搜索视频时,无法同时命中对应解析结果的所有标签,从而使得最终确定出来的视频结果只是属于命中的一个标签所对应索引字段内的视频结果,降低了配置文件中标签的利用率,进而降低了视频结果的召回率。



技术实现要素:

有鉴于此,本发明提供了一种视频搜索方法及装置,提高了配置文件中标签的利用率,进而提高了视频结果的召回率。

为实现上述目的,本发明提供如下技术方案:

一种视频搜索方法,包括:

在接收到用户的视频搜索请求时,对所述视频搜索请求进行解析,获得解析结果;

根据所述解析结果,从索引字段中匹配出对应所述解析结果的字段,所述索引字段是对包含的全部标签进行信息整合后生成的;

根据对应所述解析结果的字段,从视频库中匹配出对应所述字段的视频,作为视频搜索结果。

优选地,所述索引字段生成的过程包括:

获取多个标签,每一个标签包含标签类型和标签相关信息;

利用每一个标签的标签类型,将全部所述标签归类到对应的实体类型,所述实体类型的个数至少为一个;

将每一个所述实体类型中具有相同所述标签相关信息的标签进行去重,并将去重后获得的标签相关信息作为一个索引子字段;

依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段;

将存储了所述关联关系的全部索引子字段进行排列组合,生成所述索引字段。

优选地,所述依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段,包括:

当目标实体类型为第一实体类型时,将所述视频库中每一个视频的视频信息内的标签字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述标签字段与所述索引子字段是否相同;

若所述标签字段与所述索引子字段相同,生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段。

优选地,所述依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段,包括:

当所述目标实体类型为第二实体类型时,对所述视频库中每一个视频的视频信息内的特定字段进行分词,生成至少一个特定子字段;

将全部所述特定子字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述特定子字段与所述索引子字段是否相同;

若所述特定子字段与所述索引子字段相同,生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段。

优选地,所述根据所述解析结果,从索引字段中匹配出对应所述解析结果的字段,包括:

根据所述解析结果,从索引字段中匹配出对应所述解析结果的索引子字段。

优选地,所述根据对应所述解析结果的字段,从视频库中匹配出对应所述字段的视频,作为视频搜索结果,包括:

根据对应所述解析结果的索引子字段,从所述视频库中匹配出与所述索引子字段具有关联关系的视频,作为所述视频搜索结果。

优选地,在所述获取多个标签之后,还包括:

接收标签处理指令,对与所述标签处理指令对应的标签进行处理操作,所述处理操作包括增加、删除、修改和查询中任意一项或多项的组合。

一种视频搜索装置,包括:

解析模块,用于在接收到用户的视频搜索请求时,对所述视频搜索请求进行解析,获得解析结果;

字段匹配模块,用于根据所述解析结果,从索引字段中匹配出对应所述解析结果的字段,所述索引字段是对包含的全部标签进行信息整合后生成的;

视频匹配模块,用于根据对应所述解析结果的字段,从视频库中匹配出对应所述字段的视频,作为视频搜索结果。

优选地,所述装置还包括:

获取模块,用于获取多个标签,每一个标签包含标签类型和标签相关信息;

归类模块,用于利用每一个标签的标签类型,将全部所述标签归类到对应的实体类型,所述实体类型的个数至少为一个;

去重模块,用于将每一个所述实体类型中具有相同所述标签相关信息的标签进行去重,并将去重后获得的标签相关信息作为一个索引子字段;

生成模块,用于依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段;

排列组合模块,用于将存储了所述关联关系的全部索引子字段进行排列组合,生成所述索引字段。

优选地,所述生成模块包括:

第一判断单元,用于当目标实体类型为第一实体类型时,将所述视频库中每一个视频的视频信息内的标签字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述标签字段与所述索引子字段是否相同;

第一生成单元,用于在所述第一判断单元判断出所述标签字段与所述索引子字段相同之后,生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段。

优选地,所述生成模块包括:

分词单元,用于当所述目标实体类型为第二实体类型时,对所述视频库中每一个视频的视频信息内的特定字段进行分词,生成至少一个特定子字段;

第二判断单元,用于将全部所述特定子字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述特定子字段与所述索引子字段是否相同;

第二生成单元,用于在所述第二判断单元判断出所述特定子字段与所述索引子字段相同之后,生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段。

优选地,所述字段匹配模块包括:

字段匹配子模块,用于根据所述解析结果,从索引字段中匹配出对应所述解析结果的索引子字段。

优选地,所述视频匹配模块包括:

视频匹配子模块,用于在所述字段匹配子模块根据所述解析结果,从索引字段中匹配出对应所述解析结果的索引子字段之后,根据对应所述解析结果的索引子字段,从所述视频库中匹配出与所述索引子字段具有关联关系的视频,作为所述视频搜索结果。

经由上述的技术方案可知,与现有技术相比,本发明提供了一种视频搜索方法及装置,通过将获得的解析结果与对全部标签进行信息整合而生成的索引字段进行匹配,可以在提高全部标签利用率的基础上,扩大解析结果的匹配范围,从而增加了呈现给用户的视频搜索结果的数量,可见,利用对所含全部标签进行信息整合而生成的索引字段,完成对解析结果的匹配,可以有效解决因多个标签之间相互独立,且各自具有与之对应的索引字段而导致的无法同时命中对应解析结果的所有标签的问题,从而在充分利用全部标签的基础上,提高视频的召回率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种视频搜索方法的方法流程图;

图2为本发明实施例提供的一种索引字段的生成方法的方法流程图;

图3为本发明实施例提供的另一种索引字段的生成方法的方法流程图;

图4为本发明实施例提供的另一种视频搜索方法的方法流程图;

图5为本发明实施例提供的一种视频搜索装置的结构示意图;

图6为本发明实施例提供的一种索引字段的生成装置的结构示意图;

图7为本发明实施例提供的另一种索引字段的生成装置的结构示意图;

图8为本发明实施例提供的另一种视频搜索装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种视频搜索方法,请参见附图1,所述方法具体包括以下步骤:

s101:在接收到用户的视频搜索请求时,对所述视频搜索请求进行解析,获得解析结果;

具体的,用户的视频搜索请求可以是用户根据其想要搜索的视频而输入的与该视频内容相关的且符合预置输入规则的文字,例如视频内容中出现的某一关键词、视频名称、视频来源国家等其中的任意一种或多种组合,预置输入规则可以根据不同视频网站而设定不同的输入规则,在此不作限定。

对接收到的视频搜索请求进行解析,可以快速识别出用户的搜索意图,从而提高视频搜索的速率,其中,对视频搜索请求进行解析的方法可以是对接收到的视频搜索请求进行分词处理,以获得解析结果,如对视频搜索请求“灾难片”进行分词处理,得到“灾难”和“片”这两个词汇,作为本次视频搜索的解析结果,用于后续在视频网站中执行相关匹配操作。

s102:根据所述解析结果,从索引字段中匹配出对应所述解析结果的字段,所述索引字段是对包含的全部标签进行信息整合后生成的;

具体的,索引字段可以预先建立,主要用来存放对全部标签进行信息整合后所得到的全部字段,从而在获得了解析结果后,可以直接从该索引字段中进行匹配,间接实现了从包含的全部标签中一一进行匹配的目的,有效解决了因每次搜索只能从一个标签中进行查询而导致的无法同时命中对应解析结果的所有标签的问题,提高了视频召回率;同时,由于视频网站中只建立了一个索引字段,用来与解析结果进行匹配,从而缩减了索引字段与解析结果进行匹配这一过程所需的时间,提高了视频搜索效率。

从索引字段中匹配出对应s101中获得的解析结果的字段的匹配方法可以是从索引字段中匹配出与解析结果相同的字段。仍以“灾难”和“片”这两个解析结果为例进行具体阐述,预先建立的索引字段中包含“喜剧”、“温情”、“赛车”、“灾难”和“运动”这五个字段,则将“灾难”和“片”分别与索引字段中所包含的全部字段进行一一匹配,从而获得与解析结果“灾难”相同的字段“灾难”,因此,将该字段“灾难”作为本次视频搜索中对应解析结果的字段,用于后续的视频匹配操作。

将解析结果与索引字段进行匹配的顺序可以是按照索引字段内包含的全部字段的排列顺序从前至后依次顺序匹配,也可以是从后至前依次逆序匹配。

若索引字段中无法匹配出与解析结果相对应的字段,此时,可以生成一个搜索失败信息,以便及时提示用户视频网站中没有符合其输入的视频搜索请求的视频结果。其中,生成的搜索失败信息可以是表示没有任何搜索结果的信息,如“搜索结果为0”,也可以是表示本次视频搜索失败的信息,如“视频搜索失败”。

s103:根据对应所述解析结果的字段,从视频库中匹配出对应所述字段的视频,作为视频搜索结果;

具体的,索引字段中包含对应解析结果的字段,则证明能够从视频网站中的视频库中匹配出对应解析结果的一个或多个视频。其中,视频库可以预先建立,主要用于存放视频,且视频库中的视频与索引字段中的字段存在对应关系,从而能够根据解析结果所对应的字段,快速从该视频库中匹配出与该字段存在对应关系的全部视频,作为最终的视频搜索结果,以便后续呈现给用户。

举例说明,利用解析后获得的解析结果“汽车”从预先建立的包含“喜剧”、“温情”、“汽车”、“灾难”和“运动”这五个字段的索引字段中进行一一匹配,从而匹配出索引字段中的“汽车”字段作为本次视频搜索中对应解析结果的字段,进而依据该“汽车”字段从视频库中匹配出与之具有对应关系的“视频a”、“视频b”和“视频c”,作为视频搜索结果,最终呈现给用户,提高了从视频库中一次性搜索出视频搜索结果的数量占比,即提高了视频的召回率。

需要说明的是,视频库中存放的视频可以是视频的相关链接地址、视频相关海报图片、视频简介等其中一个或多个的组合。相应的,最终呈现给用户的搜索结果为观看视频的相关链接地址、视频相关海报图片、视频简介等其中一个或多个的组合。

本发明实施例所公开的一种视频搜索方法,通过将获得的解析结果与对全部标签进行信息整合而生成的索引字段进行匹配,可以在提高全部标签利用率的基础上,扩大解析结果的匹配范围,从而增加了呈现给用户的视频搜索结果的数量,可见,利用对所含全部标签进行信息整合而生成的索引字段,完成对解析结果的匹配,可以有效解决因多个标签之间相互独立,且各自具有与之对应的索引字段而导致的无法同时命中对应解析结果的所有标签的问题,从而在充分利用全部标签的基础上,提高视频的召回率。

根据获得的解析结果,从索引字段中匹配出对应该解析结果的字段是对于快速从视频库中匹配出对应视频比较重要的一步,而预先生成的索引字段则是影响匹配出对应解析结果的字段这一步骤的重要因素。因此,如何快速、准确生成索引字段也是本方案所关注的一个重点。

故针对图1所对应实施例中的s102,如图2所示,本发明实施例公开了一种索引字段的生成方法,所述方法具体包括以下步骤:

s201:获取多个标签,每一个标签包含标签类型和标签相关信息;

具体的,标签主要用来反映视频本身的特点,其中,标签所包含的标签类型主要用来从多个维度表明标签所反映视频本身归属的分类,如“喜剧”、“言情”、“美国”、“日语”等等;标签所包含的标签相关信息可以是依据视频内容而从多个维度设置的关键词,如从视频名称这一维度设置的关键词“速度与激情”,从视频上映年代这一维度设置的关键词“2016年”,从视频导演这一维度设置的关键词“张艺谋”等等,每一个在视频上打上的标签都包含标签类型与标签相关信息,从而有利于快速将搜索范围具体化,以加快搜索速度。

针对同一个视频,可以为其打上多个不同的标签,以实现从多个维度上体现该视频的特点;相应的,视频打上的标签的来源也可以是多个,如豆瓣标签、饮食大全标签等等。

多个标签的获取方式本方案并不限定,可以是利用网络爬虫从各个标签来源上获取。

s202:利用每一个标签的标签类型,将全部所述标签归类到对应的实体类型,所述实体类型的个数至少为一个;

具体的,视频网站中可以预先建立多个不同实体类型,主要用于存放获取到的标签,每一个实体类型可以为频道类型、版本类型、地区类型、语言类型、媒体类型、普通标签类型等其中的任意一个,存放的实体类型与获取到的标签自身具有的标签类型之间具有关联关系,从而可以依据每一个标签所具有的标签类型,快速将其归类到与之具有关联关系的实体类型中,从而为后续建立索引子字段提供基础数据。

举例说明,获取到的标签分别为“标签a”、“标签b”、“标签c”、“标签d”和“标签e”,其中,“标签a”的标签类型为“喜剧”,“标签b”的标签类型为“美国”,“标签c”的标签类型为“灾难”,“标签d”的标签类型为“日语”,“标签e”的标签类型为“湖南卫视”,而预先建立的实体类型包括“频道类型”、“版本类型”、“地区类型”、“语言类型”和“媒体类型”,则可以依据标签类型“喜剧”、“灾难”与实体类型“频道类型”之间的关联关系,快速将“标签a”和“标签c”归到实体类型“频道类型”中,依据标签类型“美国”与实体类型“地区类型”之间的关联关系,快速将“标签b”归到实体类型“地区类型”中,依据标签类型“日语”与实体类型“语言类型”之间的关联关系,快速将“标签d”归到实体类型“语言类型”中,依据标签类型“湖南卫视”与实体类型“媒体类型”之间的关联关系,快速将“标签e”归到实体类型“媒体类型”中。

s203:将每一个所述实体类型中具有相同所述标签相关信息的标签进行去重,并将去重后获得的标签相关信息作为一个索引子字段;

具体的,由于归属于同一个实体类型中的多个标签可能具有相同的标签相关信息,因此,需要对从多个来源获取到的具有相同标签相关信息的标签进行去重处理,从而实现对多个标签的归类融合,仅保留下一个标签相关信息作为索引子字段。

举例说明,实体类型“语言类型”中包括“标签a”、“标签b”和“标签c”,其中,“标签a”的标签相关信息为“冒险”,“标签b”的标签相关信息为“友谊”,“标签c”的标签相关信息为“冒险”,对标签相关信息“冒险”进行去重,从而获得了“冒险”和“友谊”这两个标签相关字段,并将它们分别作为一个索引子字段,用于后续建立索引字段。

s204:当目标实体类型为第一实体类型时,将所述视频库中每一个视频的视频信息内的标签字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述标签字段与所述索引子字段是否相同,若是,则执行s205,若否,则执行s206;

具体的,视频库中每一个视频都具有包含自身特点的视频信息,该视频信息包含一个或多个标签来源为其打上的标签相关字段,即标签字段;而第一实体类型是指所含每一个索引子字段,即去重后得到的标签相关信息,与视频库中视频所含视频信息内的标签字段一致的实体类型,从而可以通过判断标签字段与索引子字段是否相同,快速实现在属于第一实体类型的全部实体类型中,依次确定出视频库中每一个视频所对应的索引子字段的目的。其中,目标实体类型为任意一个实体类型。

s205:生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段,并执行s207;

具体的,若判断出标签字段与索引子字段相同,建立该索引子字段与视频之间的关联关系,以便后续快速匹配出视频库中对应用户的视频搜索请求的全部视频。

s206:生成视频搜索失败信息。

s207:将存储了所述关联关系的全部索引子字段进行排列组合,生成所述索引字段;

具体的,将保存了关联关系的全部索引子字段进行排列组合,可以获得一个完整的索引字段,作为后续解析结果与视频库中视频之间的连接,从而在自动整合全部标签的基础上,提高呈现给用户的视频数量与视频搜索效率。其中,存储了所述关联关系的全部索引子字段的排列组合方式本方案不做限定,可以是按照索引子字段获得的先后顺序进行排列组合。

以上步骤s204~步骤s205仅仅是本发明实施例公开的“依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段”过程的一种优选的实现方式,有关此过程的具体实现方式可根据实际需求任意设置,在此不做限定。

本发明实施例中,通过将获取到的多个标签按照标签类型归类到各自对应的实体类型中,便于后续针对同一实体类型采用相同的建立方式建立视频与对应索引子字段之间的关联关系,加快了索引字段的生成速度,对每一个实体类型中的全部标签进行去重以获得不同的标签相关信息作为索引子字段,可以实现多个标签的归类融合,确保了排列组合生成的索引字段的全面性,间接提高了视频召回率。而在目标实体类型为第一实体类型,且判断出标签字段与索引子字段相同时,建立该标签字段所对应的视频与索引子字段之间的关联关系,并存储,能够有效加快视频的搜索速率,从而有效提升视频搜索效率。

在上述附图2所对应实施例中的s201之后,还包括:

接收标签处理指令,对与所述标签处理指令对应的标签进行处理操作,所述处理操作包括增加、删除、修改和查询中任意一项或多项的组合;

具体的,标签处理指令可以是开发人员针对当前获取到的标签所要执行的处理操作而设定的指令,如“标签增加指令”、“标签删除指令”、“标签修改指令”和“标签查询指令”,有利于提高索引字段的准确度。

本发明实施例中,通过接收标签处理指令,并对与该标签处理指令对应的标签进行处理操作,可以提高索引字段的准确度,进而提高视频搜索的精度,有效降低视频搜索失败的发生概率。

针对图1所对应实施例中的s102,如图3所示,本发明实施例公开了另一种索引字段的生成方法,所述方法具体包括以下步骤:

s301:获取多个标签,每一个标签包含标签类型和标签相关信息。

s302:利用每一个标签的标签类型,将全部所述标签归类到对应的实体类型,所述实体类型的个数至少为一个。

s303:将每一个所述实体类型中具有相同所述标签相关信息的标签进行去重,并将去重后获得的标签相关信息作为一个索引子字段。

s304:当所述目标实体类型为第二实体类型时,对所述视频库中每一个视频的视频信息内的特定字段进行分词,生成至少一个特定子字段,并执行s305;

具体的,第二实体类型可以是指所含每一个索引子字段,即去重后得到的标签相关信息,与视频库中视频所含视频信息内的标签字段不一致的实体类型,从而无法利用视频信息内的标签字段匹配出对应的索引子字段。此时,可以对视频库中每一个视频自身具有的视频信息内的特定字段进行分词,利用生成的特定子字段与属于第二实体类型的每一个实体类型中的全部索引子字段进行一一匹配,进而增大匹配机率,以提高每一个索引子字段所对应的视频库中视频的数量,间接提高视频召回率。

视频信息内的特定字段可以是视频名称、视频中的语言字段、播放媒体字段等。

s305:将全部所述特定子字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述特定子字段与所述索引子字段是否相同,若是,则执行s306,若否,则执行s307;

具体的,将分词后生成的每一个特定子字段依次与目标实体类型所含每一个索引子字段进行对比,从而可以通过判断特定子字段与索引子字段是否相同,快速实现在属于第二实体类型的全部实体类型中,依次确定出视频库中每一个视频所对应的索引子字段的目的。

s306:生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段,并执行s308。

s307:生成视频搜索失败信息。

s308:将存储了所述关联关系的全部索引子字段进行排列组合,生成所述索引字段。

以上步骤s304~步骤s306仅仅是本发明实施例公开的“依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段”过程的一种优选的实现方式,有关此过程的具体实现方式可根据实际需求任意设置,在此不做限定。

本发明实施例中,通过将获取到的多个标签按照标签类型归类到各自对应的实体类型中,便于后续针对同一实体类型采用相同的建立方式建立视频与对应索引子字段之间的关联关系,加快了索引字段的生成速度,对每一个实体类型中的全部标签进行去重以获得不同的标签相关信息作为索引子字段,可以实现多个标签的归类融合,确保了排列组合生成的索引字段的全面性,间接提高了视频召回率。而在目标实体类型为第二实体类型,且判断出分词后的特定子字段与索引子字段相同时,建立该特定子字段所对应的视频与索引子字段之间的关联关系,并存储,能够有效加快视频的搜索速率,从而有效提升视频搜索效率。

在上述附图2所对应实施例的基础上,本发明实施例公开了另一种视频搜索方法,请参见附图4,所述方法具体包括以下步骤:

s401:在接收到用户的视频搜索请求时,对所述视频搜索请求进行解析,获得解析结果。

s402:根据所述解析结果,从索引字段中匹配出对应所述解析结果的索引子字段,所述索引字段是对包含的全部标签进行信息整合后生成的。

s403:根据对应所述解析结果的索引子字段,从所述视频库中匹配出与所述索引子字段具有关联关系的视频,作为视频搜索结果;

具体的,索引字段由多个索引子字段组成,而每一个索引子字段与视频库中的视频之间建立有关联关系,因此,可以依据获得的解析结果,从索引字段中进行匹配,从而确定出与之相同的索引子字段,进而再依据该索引子字段所存储的关联关系,快速从视频库中匹配出与之具有关联关系的全部视频,作为最终需要呈现给用户的视频搜索结果。

本发明实施例所公开的一种视频搜索方法,通过将获得的解析结果与对全部标签进行信息整合而生成的索引字段进行匹配,可以确定出与之对应的索引子字段,以便利用匹配出的索引子字段预先存储的关联关系,快速从视频库中匹配出对应该索引子字段的全部视频,从而加快了视频搜索的速率,有效提升了用户的搜索体验。

本发明实施例公开了一种视频搜索装置,请参见附图5,包括:

解析模块501,用于在接收到用户的视频搜索请求时,对所述视频搜索请求进行解析,获得解析结果;

字段匹配模块502,用于根据所述解析结果,从索引字段中匹配出对应所述解析结果的字段,所述索引字段是对包含的全部标签进行信息整合后生成的;

视频匹配模块503,用于根据对应所述解析结果的字段,从视频库中匹配出对应所述字段的视频,作为视频搜索结果。

本发明实施例所公开的一种视频搜索装置,通过字段匹配模块502将解析模块501获得的解析结果与对全部标签进行信息整合而生成的索引字段进行匹配,可以在提高全部标签利用率的基础上,扩大解析结果的匹配范围,从而增加了视频匹配模块503呈现给用户的视频搜索结果的数量,可见,利用对所含全部标签进行信息整合而生成的索引字段,完成对解析结果的匹配,可以有效解决因多个标签之间相互独立,且各自具有与之对应的索引字段而导致的无法同时命中对应解析结果的所有标签的问题,从而在充分利用全部标签的基础上,提高视频的召回率。

本发明实施例提供的各个模块的工作过程,请参照附图1所对应的方法流程图,具体工作过程不再赘述。

在上述附图5所对应实施例的基础上,本发明实施例公开了一种索引字段的生成装置,请参见附图6,包括:

获取模块601,用于获取多个标签,每一个标签包含标签类型和标签相关信息;

归类模块602,用于利用每一个标签的标签类型,将全部所述标签归类到对应的实体类型,所述实体类型的个数至少为一个;

去重模块603,用于将每一个所述实体类型中具有相同所述标签相关信息的标签进行去重,并将去重后获得的标签相关信息作为一个索引子字段;

生成模块604,用于依据所述视频库中每一个视频的视频信息和所述实体类型,生成所述视频库中每一个视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段;

排列组合模块605,用于将存储了所述关联关系的全部索引子字段进行排列组合,生成所述索引字段。

其中,所述第一生成模块604具体包括:

第一判断单元6041,用于当目标实体类型为第一实体类型时,将所述视频库中每一个视频的视频信息内的标签字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述标签字段与所述索引子字段是否相同;

第一生成单元6042,用于在所述第一判断单元6041判断出所述标签字段与所述索引子字段相同之后,生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段。

本发明实施例中,通过归类模块602将获取模块601获取到的多个标签按照标签类型归类到各自对应的实体类型中,便于后续针对同一实体类型采用相同的建立方式建立视频与对应索引子字段之间的关联关系,加快了索引字段的生成速度,去重模块603对每一个实体类型中的全部标签进行去重以获得不同的标签相关信息作为索引子字段,可以实现多个标签的归类融合,确保了组合生成的索引字段的全面性,间接提高了视频召回率。而在目标实体类型为第一实体类型,且第一判断单元6041判断出标签字段与索引子字段相同时,第一生成单元6042建立该标签字段所对应的视频与索引子字段之间的关联关系,并存储,能够有效加快视频的搜索速率,从而有效提升视频搜索效率。

本发明实施例提供的各个模块的工作过程,请参照附图2所对应的方法流程图,具体工作过程不再赘述。

在上述附图5所对应实施例的基础上,本发明实施例公开了另一种索引字段的生成装置,请参见附图7,包括:

获取模块601,归类模块602,去重模块603,生成模块604,排列组合模块605;

其中,所述生成模块604具体包括:

分词单元6043,用于当所述目标实体类型为第二实体类型时,对所述视频库中每一个视频的视频信息内的特定字段进行分词,生成至少一个特定子字段;

第二判断单元6044,用于将全部所述特定子字段与所述目标实体类型所含每一个所述索引子字段进行对比,判断所述特定子字段与所述索引子字段是否相同;

第二生成单元6045,用于在所述第二判断单元5044判断出所述特定子字段与所述索引子字段相同之后,生成所述视频与对应所述索引子字段之间的关联关系,并存储在对应所述索引子字段。

本发明实施例中,通过归类模块602将获取模块601获取到的多个标签按照标签类型归类到各自对应的实体类型中,便于后续针对同一实体类型采用相同的建立方式建立视频与对应索引子字段之间的关联关系,加快了索引字段的生成速度,去重模块603对每一个实体类型中的全部标签进行去重以获得不同的标签相关信息作为索引子字段,可以实现多个标签的归类融合,确保了组合生成的索引字段的全面性,间接提高了视频召回率。而在目标实体类型为第二实体类型,且第二判断单元6044判断出分词后的特定子字段与索引子字段相同时,第二生成单元6045建立该特定子字段所对应的视频与索引子字段之间的关联关系,并存储,能够有效加快视频的搜索速率,从而有效提升视频搜索效率。本发明实施例提供的各个模块的工作过程,请参照附图3所对应的方法流程图,具体工作过程不再赘述。

在上述附图4所对应实施例的基础上,本发明实施例公开了另一种视频搜索装置,请参见附图8,包括:

解析模块501,字段匹配模块502,视频匹配模块503;

其中,所述字段匹配模块502包括:字段匹配子模块5021,用于根据所述解析结果,从索引字段中匹配出对应所述解析结果的索引子字段。

所述视频匹配模块503包括:视频匹配子模块5031,用于在所述字段匹配子模块5021根据所述解析结果,从索引字段中匹配出对应所述解析结果的索引子字段之后,根据对应所述解析结果的索引子字段,从所述视频库中匹配出与所述索引子字段具有关联关系的视频,作为呈现给用户的视频搜索结果。

本发明实施例所公开的一种视频搜索装置,通过字段匹配子模块5021将获得的解析结果与对全部标签进行信息整合而生成的索引字段进行匹配,可以确定出与之对应的索引子字段,以便视频匹配子模块5031利用匹配出的索引子字段预先存储的关联关系,快速从视频库中匹配出对应该索引子字段的全部视频,从而加快了视频的搜索速率,有效提升了用户的搜索体验。

本发明实施例提供的各个模块的工作过程,请参照附图4所对应的方法流程图,具体工作过程不再赘述。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1