一种基于稀疏编码的视频指纹提取方法

文档序号：9524523阅读：487来源：国知局

一种基于稀疏编码的视频指纹提取方法
【技术领域】
[0001] 本发明属于视频指纹及数据检索技术领域，更为具体地讲，设及一种基于稀疏编码的视频指纹提取方法。
【背景技术】
[0002] 视频本身包含的图像内容具有独特的时间特性与空间特性，不同视频之间存在较大的差异，而对于同一视频遭受不同攻击，其时间特性与空间特性受影响较小，运种唯一性类似于人类的指纹特征，我们把视频的运种特征称之为"视频指纹"。视频指纹作为一口新兴的视频图像处理技术，对视频内容特征提取并加工处理，进而到唯一表示视频的目的。通过对比两段视频的"指纹序列"，可W寻找出视频之间的相似性与异己性，进而实现对视频进行版权保护及内容检测。对视频指纹的提取，避免了向数字媒体中嵌入信息，破坏原信息的完整性，且实时性与准确性较好。
[0003] 自1999年Lowe提出SIFT (Scale Invariant Fea1:ure Transform)算法W来，人们可W通过在尺度空间中寻找极值点来获得图像的局部特征，运种局部特征具有良好的旋转、尺度W及仿射等不变性。2004年，Lowe针对SITF算法完善了其特征配准算法。2006 年，Bay在Lowe的算法基础之上，融入积分图像W及Harr小波，其运算效率较SIFT略胜一筹。在此基础上，Bounch通过添加区分图像滤波器学习提取SURF特征点，进而对特征点采用多普图像增强来提高特征点的区分性；杜冬梅等人在原SURF算法基础上对积分图像算法改进来减少运算时间；Lee则通过结合ASURF (Advanced Spee-Up Robust化曰化'6) W及 DCD值ominant Color Descriptor)来提升图像恢复效率。然而，在视频处理领域，往往面临着海量的数据处理，我们需要在提升指纹提取速率的同时依然维持结果的准确性W及鲁棒性，上述方法不能较好的满足运一需求。受生物信息学启发，本文尝试对SURF结果进行稀疏编码，从而只对少量的非零值进行存储计算来提升提取效率并降低存储开销。

【发明内容】

[0004] 本发明的目的在于克服现有技术的不足，提供一种基于稀疏编码的视频指纹提取方法，采用SURF算法对视频帖图像特征进行提取，并使用ti-i壯模型W及词频统计生成视频指纹，实现对视频的唯一表示。
[0005] 为实现上述发明目的，本发明一种基于稀疏编码的视频指纹提取方法，其特征在于，包括W下步骤：
[0006] (1)、构建稀疏词典
[0007] (1. 1)、利用SURF算法对预选的词典训练视频库进行提取特征点，得到训练特征点集
/ = 1.2,其中，m表示词典训练视频库中视频的个数；!W表示词典训练视频库中第i个视频的特征点集，每个特征点集表示
良示第 i个视频的第j帖中提取的特征点，其中k为视频帖的数量；
[0008] (1.2)、计算稀疏系数
[000引设训练特征点集ξ对应的稀疏系数集合关
，其中表示第i个特征点集对应的稀疏系数集；设稀疏词典B=b,，j= 1，2, 一,Ν，其中，b,为基向量，N表示稀疏词典中基向量个数；在稀疏词典训练初始阶段，初始稀疏词典B由基向量随机生成；
[0010] 将训练特征点集ξ中的!W和初始稀疏词典B代入到公式（1)中，求出!'11对应的稀疏系数集；
[0011]
[001引其中，。，0，C均为常系数，早表示稀疏系数集f3中第j个特征点，III Γ为平方差，wO为稀疏函数，运里为1范式；
[0013] (1.3)、更新稀疏词典
[0014] (1.3. 1)、将J…作为输入训练集，同矿1'对应的稀疏系数；…一起代入到公式似中，求出稀疏词典B的最优解；
(2)
[0015]
[001引其中，d为常数，Bi, ,为稀疏词典中第i行第j列值；
[0017] (1.3. 2)、利用拉格朗日对偶算法，用步骤（1.3. 1)中求出的最优解对原始稀疏词典B进行更新，更新后的稀疏词典标记为B%
[001引（1. 3. 3)、将稀疏词典护代入到公式（1)中，求解出!对应的稀疏系数;>并按照步骤（1.2)~（1.3)所述的方法进行迭代，直到第m个特征点集，得到最终更新后的稀疏词典名；
[001引（2)、稀疏编码
[0020] 利用SURF算法对待处理视频进行提取特征点，得到特征点集ζ=化，了2,…，Tm}， Tm表示待处理视频中第Μ帖提取出来的特征点集合；
[0021] 将ζ和稀疏词典i代入到公式（1)中，求出ζ对应的稀疏系数s' ；将ζ作为输入集合，采用特征符号算法求解最优解；
[0022] (3)
[002引其中，g为稀疏系数，，II II康示求1范式；
[0024] 求得的结果即为待处理视频特征点集的稀疏编码结果，记为2；.= {^，记…，^'/}，表示第Μ帖特征点对应的稀疏编码结果；
[00巧](3)、构建视觉词典并统计词频信息
[002引（3. 1)、利用步骤似所述的方法，对训练特征点集
附进行稀疏编码，再利用Kmeans聚类算法对稀疏编码结果进行聚类，聚类簇为Q个，每个聚类中屯、作为一个视觉单词，从而得到视觉词典W= {Wi，W2, ···，％};
[0027] (3. 2)、将步骤似中稀疏编码结果Tsc中每一帖的集合技与视觉词典中的视觉单词进行欧式距离计算；
C4)
[0028]
[0029]其中，v,、Vq为向量，V,表示7;中的稀疏编码后的一个特征点的向量值，Vq表示视觉词典W中的一个视觉单词的向量值；选择最小欧式距离的视觉单词，并标记为该视频帖中对应的特征点；
[0030](3. 3)、利用ti-i壯模型对每个视频帖的特征点进行词频统计，即：
[0031]
(5)
[00础其中，riMd表示视频第Μ帖包含的视觉单词数量，η康示第Μ帖包含的总的视觉单词数量，Ρ为视频帖的数量，1?表示包含视觉单词的视频帖数量；
[0033] 每一帖的统计结果生成一个直方图，横坐标为所有视觉单词，纵坐标为每个视觉单词在该帖中的统计频率；
[0034] (4)、提取视频指纹
[0035] 将步骤化3)中每一视频帖的词频统计结果均使用相似保存哈希算法转换为一串16进制的序列，从而得到每一视频帖的最简指纹，再按照视频帖在视频中的时间顺序，将最简指纹进行串联，得到视频指纹。
[0036] 本发明的发明目的是运样实现的：
[0037] 本发明基于稀疏编码的视频指纹提取方法，先通过SURF算法对预选视频帖图像特征进行提取，得到训练特征点集，通过对训练特征点集进行稀疏处理，进而得到稀疏词典；再通过SURF算法对待处理视频进行稀疏编码，从而构建出视觉词典并统计出词频信息；最后对视频的每一帖的词频统计结果均使用相似保存哈希算法转换为一串16进制的序列，从而得到每一视频帖的最简指纹，再按照视频帖在视频中的时间顺序，将最简指纹进行串联，得到视频指纹。
[0038] 同时，本发明基于稀疏编码的视频指纹提取方法还具有W下有益效果：
[0039](1)、通过SURF算法获取特征点的特征矢量，运样将特征描述符的维度由原来的 64维降到24维，SURF算法获取的特征点还具有较强的尺度、旋转、亮度等不变性；
[0040](2)、本发明是基于哺乳动物视觉图像稀疏编码原理，选用标准库训练生成稀疏词典，再根据稀疏词典对视频帖特征点进行稀疏编码，最后对编码后的非零值进行处理，从而减少视频指纹提取的存储开销与计算开销；
[0041] (3)、通过实验仿真分析，本发明依然能维持原特征点的鲁棒性，且具有较好的区分性W及准确性。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐杰;吴鹏;
技术所有人：成都纽捷那科技有限公司;
我是此专利的发明人

上一篇：一种人机交互式虹膜图像自动采集装置的制造方法
上一篇：一种公路视频巡检的里程标识牌自动识别方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。