一种基于倒排索引的粗细粒度视频检索方法_2

文档序号:9274715阅读:来源:国知局
视频库构建出完整的倒排索引文件;
[0042] 其中,倒排索引文件主要包括两个表,即词汇表以及倒排列表;在词汇表中存放着 视觉词典中的关键视觉词汇;在倒排列表中存放着与该关键视觉词汇对应的视频信息;在 初始时刻,倒排列表为空。
[0043] T2、视频检索阶段
[0044] 在视频检索阶段又分为视频粗粒度检索和视频细粒度检索,具体步骤包括:
[0045] (T2. 1)、基于倒排索引文件的视频粗粒度检索
[0046] (T2. 1. 1)、按照步骤(Tl. 1. 1)~步骤(Tl. 1. 4)所述的方法提取待检索视频q的 k = 4个关键视觉词汇;
[0047] (T2. 1. 2)、利用这k = 4个关键视觉词汇在倒排索引文件中进行查找,找到与这k 个词汇匹配的所有视频,并将找到的视频依次标记为视频h,i = 1,2,…,n,n表示找到的 视频总个数;
[0048] 在本实施例中,设视频库中存放有N= 100条时间长短不一的视频,其中内容涵盖 新闻、体育、动画短片、电影预告、娱乐、音乐MV等多种类型。
[0049] 设倒排索引文件中词汇表大小分别设定为250, 500,1000,1500,关键词数量设定 为4,通过上面所述步骤,对100部视频建立倒排索引;
[0050]
[0051] 表 1
[0052] 通过实验结果可以看出,如表1所示,随着词汇表的大小不断增大,视频利用词汇 表进行分类以及词频统计越可能出现误差,因此准确率在下降。因为随着词汇表的增大。另 外,随着词汇表的大小不断增大,词频统计时间增大,查询一部视频的所用时间在在增加。 但是,随着词汇表减小,检索获得的候选视频数量也在增加,而后续的细粒度检索比对次数 就会增多,效率就会下降。因此,综合准确率、平均用时以及候选视频数量三个因素考虑,词 汇表大小为250时,其检索效果最好。
[0053] 其次,基于上面实验结果,我们将词汇表大小定为250,同时关键词数量选择1、4、 8和12四组进行实验,其检索结果如表2所示;
[0054]
[0055] 表 2
[0056] 通过实验得出的数据结果我们可以看出,随着关键词数量的不断增大,候选视频 数量增多,因此查准率在不断提高。综合准确率与候选视频数量综合因素考虑,我们将关键 词数量设定为4。
[0057] 经过实验分析当选择词汇表大小为250、关键词数量为4时,可以产生比较好的检 索结果,为细粒度的精确查找做好准备
[0058] (T2. 2)、基于改进的BLAST算法的视频指纹细粒度检索
[0059] (T2. 2. 1)、设置窗口滑动步长N;在本实施例中,窗口滑动步长设为N= 16bit ;
[0060] (T2. 2. 2)、对待检索的视频q和视频1^进行窗口值计算
[0061] 设置一滑动窗口,滑动窗口的起始位置为视频比的第一位,即滑动窗口第一位在 视频h的第一位上,将该滑动窗口分别在待检索的视频q以及视频h i上从起始位置向后滑 动至末尾,每次滑动的长度为窗口滑动步长N,并计算出每次滑动时,滑动窗口所覆盖的二 进制序列的值作为窗口值,并依次排列,构成窗口值序列;
[0062] (T2. 2. 3)、比对待检索的视频q与视频比的窗口值;
[0063] 将视频比与待检索视频q的窗口值序列的位置点同时从第一位依次向后移动,直 到位置点前出现相同的窗口值为止,以视频匕、待检索视频q窗口值相同的位置点为基准即 对齐,比对视频h、待检索视频q该位置点前后的所有窗口值,并统计相似度,将视频指纹比 以及相似度作为检索结果返回。
[0064] 本实施例中,设输入的待检索视频q为:00001100001100000000110010101001101 11001 ;设定一个滑动步长为16bit的滑动窗口,滑动窗口在待检索视频q的每一个位置上 都有一个对应的>进制序列和其对应十进制整数,如表3所不;
[0065]

[0066] 表 3
[0067] 对于候选视频数据库中选出的相似视频,利用16bit的窗口进行窗口值的计算, 并以相同的步长在相似视频上滑动,在进行匹配时,如果相似视频的某一位置的窗口值与 待检索视频q的某一窗口值相等,则继续比较该窗口值的前后部分,直到两条序列比对完 成,最后统计出相似程度,返回结果。
[0068] 设候选视频数据库内存储的一个相似视频为:00011111110100001100001100000 0001100101010011011100100000111,对其定义同样的匹配串的窗口,开始计算相似视频的 窗口位置在8时的窗口值为2036,没有一个待匹配串的窗口位置与之相等,于是将窗口后 移lbit,继续计算,直到计算到位置为16的窗口值为12480,发现它和待匹配的窗口位置9 的窗口值相等,那么再继续比较该位置之后的窗口值与待检索视频q的位置9之后的窗口 值是否相等,以此类推,直至完成两条视频指纹的比较,得出两条视频指纹的相似度为止。
[0069] 尽管上面对本发明说明性的【具体实施方式】进行了描述,以便于本技术领域的技术 人员理解本发明,但应该清楚,本发明不限于【具体实施方式】的范围,对本技术领域的普通技 术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些 变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
【主权项】
1. 一种基于倒排索引的粗细粒度视频检索方法,其特征在于,包括以下步骤: (1) 、对整个视频库构建倒排索引文件 (1. 1)、设视频库中存放有N条视频;利用镜头分割技术对第一条视频进行关键帧提 取,再通过SURF算法提取该条视频关键帧中的特征点; (1. 2)、利用预先训练的视觉词典对所有特征点进行分类处理:计算每个特征点与视觉 词典中所有词汇的欧氏距离,将每个特征点划分到欧氏距离最小的词汇中,再统计每个词 汇类别中特征点个数,并将特征点个数作为该词汇在视频中出现的频率。 (1. 3)、统计出视觉词典中所有词汇在视频中出现的频率,提取频率最高的k个词汇作 为视频的关键视觉词汇,并存入到倒排索引文件的词汇表中,同时将这k个词汇对应的视 频信息存入到倒排索引文件的倒排列表中; (1.4)、按照步骤(I. 1)~步骤(1.4)所述的方法,继续对视频库中的下一条视频进行 处理,直到第N条视频,从而对整个视频库构建出完整的倒排索引文件; (2) 、视频检索 (2. 1)、基于倒排索引文件的视频粗粒度检索 (2. I. 1)、按照步骤(I. 1)~步骤(1. 3)所述的方法提取待检索视频q的k个关键视觉 词汇; (2. 1. 2)、利用这k个关键视觉词汇在倒排索引文件中进行查找,找到与这k个词汇匹 配的所有视频,并将找到的视频依次标记为视频匕,i = 1,2,. . .,n,n表示找到的视频总个 数; (2. 2)、基于改进的BLAST算法的视频细粒度检索 (2. 2. 1)、设置窗口滑动步长N ; (2. 2. 2)、对待检索的视频q和视频1^进行窗口值计算 '设置一滑动窗口,滑动窗口的起始位置为视频匕的第一一位,即滑动窗口第一位在视 频比的第一位上,将该滑动窗口分别在待检索的视频q以及视频h 从起始位置向后滑动 至末尾,每次滑动的长度为窗口滑动步长N,并计算出每次滑动时,滑动窗口所覆盖的二进 制序列的值作为窗口值,并依次排列,构成窗口值序列; (2. 2. 3)、比对待检索的视频q与视频Iii的窗口值; 将视频h与待检索视频q的窗口值序列的位置点同时从第一位依次向后移动,直到位 置点前出现相同的窗口值为止,以视频匕、待检索视频q窗口值相同的位置点点为基准即对 齐,比对视频h、待检索视频q该位置点前后的所有窗口值,并统计相似度,将视频指纹比以 及相似度作为检索结果返回。2. 根据权利要求1所述的基于倒排索引的粗细粒度视频检索方法,其特征在于,所述 的倒排索引文件包括两个表,即词汇表以及倒排列表;在词汇表中存放着视觉词典中的关 键视觉词汇;在倒排列表中存放着与该关键视觉词汇对应的视频信息;在初始时刻,倒排 列表为空。
【专利摘要】本发明公开了一种基于倒排索引的粗细粒度视频检索方法,通过分层分粒度的检索方式对视频进行检索比对。首先利用倒排索引算法对视频数据库中的所有视频建立倒排索引表,再在检索阶段通过倒排索引技术计算获得相应的候选视频集以此缩小精确查找范围,完成粗粒度的查找,有效的降低了视频检索的时间开销;其次,基于改进的BLAST算法进行视频细粒度检索,从而在视频数据库中快速找到与待检索的视频相匹配的视频,通过对待检索视频和查找视频的相似度统计,进而得到检索结果,具有视频查找快速、准确和实时等特点。
【IPC分类】G06F17/30
【公开号】CN104991953
【申请号】CN201510427283
【发明人】徐杰, 吴鹏
【申请人】成都纽捷那科技有限公司
【公开日】2015年10月21日
【申请日】2015年7月20日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1