视频指纹快速检索方法

文档序号:6599835阅读:166来源:国知局
专利名称:视频指纹快速检索方法
技术领域
本发明涉及视频指纹领域,特别涉及一种视频指纹快速检索方法。
背景技术
视频指纹是一种软件识别、提取、压缩视频的技术,可以使产生的唯一的“指纹”来 代表一个视频文件。视频指纹是一个新兴的技术,已经证明可以有效应用于音频数据预处 理、哈希值的比较和数字水印等领域。视频指纹分析可以基于任何视觉的视频特征,包括 (但不限于),视频流中的关键帧序列分析,色彩和运动的变化等特征。一般来说,数字视频 数据可以直接从文件中剥离出来,然后基于哈希值进行压缩。基于哈希值比较进行视频文 件匹配的方法是有缺点的。因为,视频文件的匹配,只能依据视频数据文件或视频数据文件 中的一部分中的数据完全相等。大部分情况下,不同的视频编码和数字处理可能会导致视 频数字数据的微小改动,但是这种改变不会影响视频本身感知性(也就是人的视觉是感觉 不到的)。因此,即使当两个视频片断是感性相同,当采用哈希值比较方法时,很可能失败。 此外,如果想通过给出一些视频片段来识别一个视频也是不可能的。可以看出,这种基于哈 希值比较的方法同样是不可能用于视频的相似匹配。数字视频指纹识别可以依据“指纹”来 识别视频,视频文件可以是不同的分辨率(更大或更小),也可以略加修改(对帧片段进行 模糊、旋转、裁剪、加速、减速、插入元素)。视频指纹技术可以从视频文件中提取的可以唯一 标识视频文件的特征,并存储这些特征。这样,就可以后通过比较提取的视频指纹来识别视 频内容。对于数字视频数据,音频和视频都可以提取指纹,根据不同的应用领域会有不同的 意义。一个视频指纹建立涉及使用专门的解码器对视频数据进行解码,然后应用特征提取 算法提取视频的特征。视频指纹相对比原来的源文件内容,要少了很多。因此可以很容易 在数据库中储存。他们可能被视为一种有损压缩的极端形式,不能用来重建原始视频内容。 视频指纹与数字水印不同。数字水印是在视频内容中插入一个唯一的标识。也即是说,数 字水印技术要改变视频文件的内容,为了识别视频文件,数字水必须被插入到视频文件中。 以后,任何人任何时间都可以在视频文件中更改或删除数字水印。而视频指纹,可以识别任 何内容,不管文件之前是否被更改过。考虑到现有的视频数量庞大,随着视频由用户上传的 网站大量涌现,视频指纹识别技术面临着巨大的可扩展性的挑战。随着视频网络的发展,视频节目呈海量增长之势,如何高效且有效地检索或监管 视频内容成为一个重要的问题。视频指纹技术的出现为视频内容的监管和检索提供了一种 高效且有效的方法。视频指纹技术中的关键技术是(1)视频指纹的提取;和(2)视频指纹 的检索。视频指纹的检索方法是否有效,直接决定了视频指纹检索的效率和精度。在2002年的视觉信息最新进展国际会议上(Proceedings of Recent Advances in VisualInformation Systems 2002),Oostveen 和 Kalker 等人在《视频指纹的特征 提取方法禾口数据库策略〉〉(Feature Extraction and a Database Strategy for Video Fingerprinting)这篇文章中,提出了一种视频指纹检索方法。该检索方法有下面几个特 点(1)被用于检索的指纹文件是一个指纹片段,而数据库中则是大量的指纹文件;(2)采用的计算方法是将数据库中的大量的指纹文件做成哈希表,然后进行快速的检索;(3)若 对数据库中的每个候选指纹片段与被用于检索的指纹片段进行汉明(Hamming)距离计算的话,则运算很大。
而在实际应用中,碰到的情况与之相反,也就是说用于检索的指纹文件是一个指 纹文件,而数据库中包含的则是一些指纹片段,例如反动、暴力、色情、诽谤等之类的违规视 频片段。在此基础上,本发明提出一种基于线段检测的视频指纹检索系统。这里的视频指 纹既可以是视频中的视频信号的指纹,也可以是视频中的音频信号的指纹,它们被统称为 是视频指纹。有鉴于此,本领域技术人员针对上述问题,提供了一种视频指纹快速检索方法。方法内容本发明提供了一种视频指纹快速检索方法,克服了现有技术的困难,以达到快速 检索大量指纹片段,提高视频指纹检索的效率和精度的目的。本发明采用如下技术方案本发明的一种视频指纹快速检索方法,其特征在于包括以下步骤A)将视频片段库中的每个视频片段提取指纹特征,并以指纹特征建立数据库;B)根据数据库建立哈希表;C)加载被检索视频文件,然后提取指纹特征;D)进行基于线段检测的指纹快速检索。优选地,所述步骤A)中,所述提取指纹特征包括提取音频指纹特征或提取视频指 纹特征。优选地,所述步骤B)中,所述哈希表的键值是数据库中的指纹文件的子指纹。优选地,所述步骤B)中,所述子指纹是32比特的二进制数。优选地,所述步骤B)中,所述哈希表的值是指向文件号集合的指针。优选地,所述步骤B)中,所述文件号集合包括对应键值的指纹文件的文件号。优选地,所述步骤D)中,包括以下步骤Dl)建立坐标系,其横轴为数据库中的文件号,纵轴为被检索的视频指纹文件的子 指纹;D2)通过哈希表的快速取值,形成坐标系中的若干线段;D3)扫描该坐标系中的所有线段,将间隔距离小于K的线段连接成一个线段,得到 的线段的集合称为L ;D4)在L内,过滤掉所有长度小于T的线段,得到过滤后的线段的集合FL ;D5)根据FL中一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在文 件号所对应的数据库中的指纹文件的距离d,执行步骤D8);D6)判断FL中是否还有剩余线段,若是,则执行步骤D7),若否,则被检索的视频指 纹文件不是目标文件,程序结束;D7)根据FL中剩余的一条线段的纵轴范围,计算被检索的视频指纹文件和该线段 所在文件号所对应的数据库中的指纹文件的距离d,执行步骤D8);D8)判断d是否小于阈值D,若是,则被检索的视频指纹文件是目标文件,程序结 束;若否,则执行步骤D6);
其中,K是一个预先给定的阈值,且K > 0 ;L为算法步骤过程中,将间隔距离小于K的线段连接成一个线段,得到的线段的集合;T是预先给定的常数,且T > 0 ;在L内,过滤掉所有长度小于T的线段,得到过滤 后的线段的集合称为FL;d为根据FL中一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在文 件号所对应的数据库中的指纹文件的距离;D是预先给定的阈值,且D > 0。优选地,所述步骤D)中,所述距离d是汉明距离。由于采用了上述技术,本发明能快速检索大量指纹片段,提高视频指纹检索的效 率和精度。以下结合附图及实施例进一步说明本发明。


图1为本发明的视频指纹快速检索方法的流程图;图2为本发明的视频指纹快速检索方法的实施例流程图;图3为本发明中哈希表的实施例图;图4为本发明中进行线段检测的实施例图。附图标记A为准备阶段,B为线段检测阶段,C为验证阶段,D为哈希表,E为用于被检索的视 频指纹文件,F为文件ID,G为过滤后的线段,H为过滤后的线段。
具体实施例方式下面通过图1至4来介绍本发明的一种具体实施例。如图1至4所示,本发明的一种视频指纹快速检索方法,包括以下步骤A)将视频片段库中的每个视频片段提取指纹特征,并以指纹特征建立数据库;B)根据数据库建立哈希表;C)加载被检索视频文件,然后提取指纹特征;D)进行基于线段检测的指纹快速检索。所述步骤A)中,所述提取指纹特征包括提取音频指纹特征或提取视频指纹特征。所述步骤B)中,所述哈希表的键值是数据库中的指纹文件的子指纹,所述子指纹 是32比特的二进制数;所述哈希表的值是指向文件号集合的指针,所述文件号集合包括对 应键值的指纹文件的文件号。所述步骤D)中,包括以下步骤Dl)建立坐标系,其横轴为数据库中的文件号,纵轴为被检索的视频指纹文件的子 指纹;D2)通过哈希表的快速取值,形成坐标系中的若干线段;D3)扫描该坐标系中的所有线段,将间隔距离小于K的线段连接成一个线段,得到 的线段的集合称为L ;
D4)在L内,过滤掉所有长度小于T的线段,得到过滤后的线段的集合FL ;D5)根据FL中一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在文件号所对应的数据库中的指纹文件的距离d,执行步骤D8);D6)判断FL中是否还有剩余线段,若是,则执行步骤D7),若否,则被检索的视频指纹文件不是目标文件,程序结束;D7)根据FL中剩余的一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在文件号所对应的数据库中的指纹文件的距离d,执行步骤D8);D8)判断d是否小于阈值D,若是,则被检索的视频指纹文件是目标文件,程序结束;若否,则执行步骤D6)。其中,K是一个预先给定的阈值,且K > 0 ;L为算法步骤过程中,将间隔距离小于K的线段连接成一个线段,得到的线段的集合;T是预先给定的常数,且!" > 0 ;在L内,过滤 掉所有长度小于T的线段,得到过滤后的线段的集合称为FL ;d为根据FL中一条线段的纵 轴范围,计算被检索的视频指纹文件和该线段所在文件号所对应的数据库中的指纹文件的 距离;D是预先给定的阈值,且D > 0。所述步骤D)中,所述距离d是汉明距离。汉明距离就是信息论中,两个等长字符 串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字 符串变换成另外一个字符串所需要替换的字符个数。实际使用中,如图2至4所示本发明的具体实施例流程包括以下步骤1)将视频片段库中的每个视频片段进行指纹特征提取,这些指纹文件称为是数据 库;2)在数据库上建立哈希表,其特征在于哈希表的键值(key)是数据库中的指纹文 件的子指纹,通常是一个32比特的二进制数,但不局限于是32比特;哈希表的值(value) 是一个指针,该指针指向一个文件号(id)集合;该文件号集合是包含相应键值的指纹文件 的文件号的集合。该集合中的元素具有唯一性,也就是说不存在重复的文件号。3)在进行检索的时候,首先加载用于被检索的视频文件,然后进行指纹特征提 取;4)按下面的步骤进行基于线段检测的指纹快速检索5)以被检索的视频指纹文件的子指纹为纵轴,以数据库中的文件号为横轴,形成 坐标系;6)通过哈希表的快速取值,形成坐标系中的若干线段;7)扫描该坐标系中的所有线段,将间隔距离小于K的线段连接成一个线段,得到 的线段的集合称为L ;8)在L内,过滤掉所有长度小于T的线段,得到过滤后的线段的集合FL ;9)根据FL中每条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在 文件号所对应的数据库中的指纹文件的距离d,这里的距离指的是汉明距离(Hamming distance);10)若d小于某个阈值D,则被检索的视频指纹文件被认为是目标文件,返回之;11)否则,回到9)直到退出。与现有技术相比,本发明能快速检索大量指纹片段,提高视频指纹检索的效率和精度。 综上可知,由于采用了上述技术,本发明与现有技术相比,本发明能快速检索大量 指纹片段,提高视频指纹检索的效率和精度。以上所述的实施例仅用于说明本发明的技术 思想及特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,不能 仅以本实施例来限定本发明的专利范围,即凡依本发明所揭示的精神所作的同等变化或修 饰,仍落在本发明的专利范围内。
权利要求
一种视频指纹快速检索方法,其特征在于包括以下步骤A)将视频片段库中的每个视频片段提取指纹特征,并以指纹特征建立数据库;B)根据数据库建立哈希表;C)加载被检索视频文件,然后提取指纹特征;D)进行基于线段检测的指纹快速检索。
2.如权利要求1所述的视频指纹快速检索方法,其特征在于所述步骤A)中,所述提 取指纹特征包括提取音频指纹特征或提取视频指纹特征。
3.如权利要求1所述的视频指纹快速检索方法,其特征在于所述步骤B)中,所述哈 希表的键值是数据库中的指纹文件的子指纹。
4.如权利要求3所述的视频指纹快速检索方法,其特征在于所述步骤B)中,所述子 指纹是32比特的二进制数。
5.如权利要求1所述的视频指纹快速检索方法,其特征在于所述步骤B)中,所述哈 希表的值是指向文件号集合的指针。
6.如权利要求5所述的视频指纹快速检索方法,其特征在于所述步骤B)中,所述文 件号集合包括对应键值的指纹文件的文件号。
7.如权利要求1、2、4、6中任意一项所述的视频指纹快速检索方法,其特征在于所述 步骤D)中,包括以下步骤Dl)建立坐标系,其横轴为数据库中的文件号,纵轴为被检索的视频指纹文件的子指纹;D2)通过哈希表的快速取值,形成坐标系中的若干线段;D3)扫描该坐标系中的所有线段,将间隔距离小于K的线段连接成一个线段,得到的线 段的集合称为L ;D4)在L内,过滤掉所有长度小于T的线段,得到过滤后的线段的集合FL ; D5)根据FL中一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在文件号 所对应的数据库中的指纹文件的距离d,执行步骤D8);D6)判断FL中是否还有剩余线段,若是,则执行步骤D7),若否,则被检索的视频指纹文 件不是目标文件,程序结束;D7)根据FL中剩余的一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在 文件号所对应的数据库中的指纹文件的距离d,执行步骤D8);D8)判断d是否小于阈值D,若是,则被检索的视频指纹文件是目标文件,程序结束;若 否,则执行步骤D6);其中,K是一个预先给定的阈值,且K > O ;L为算法步骤过程中,将间隔距离小于K的线段连接成一个线段,得到的线段的集合; T是预先给定的常数,且T > O ;在L内,过滤掉所有长度小于T的线段,得到过滤后的 线段的集合称为FL ;d为根据FL中一条线段的纵轴范围,计算被检索的视频指纹文件和该线段所在文件号 所对应的数据库中的指纹文件的距离; D是预先给定的阈值,且D > O。
8.如权利要求7所述的视频指纹快速检索方法,其特征在于所述步骤D)中,所述距离d是汉 明距离。
全文摘要
本发明揭示了一种视频指纹快速检索方法,包括以下步骤A)将视频片段库中的每个视频片段提取指纹特征,并以指纹特征建立数据库;B)根据数据库建立哈希表;C)加载被检索视频文件,然后提取指纹特征;D)进行基于线段检测的指纹快速检索,本发明能快速检索大量指纹片段,提高视频指纹检索的效率和精度。
文档编号G06K9/00GK101807208SQ201010133870
公开日2010年8月18日 申请日期2010年3月26日 优先权日2010年3月26日
发明者连惠城 申请人:上海全土豆网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1