一种基于稀疏编码的视频指纹提取方法_3

文档序号：9524523阅读：来源：国知局

点进行词频统计，即：
[0089]
(5)
[0090] 其中，riMd表示视频第Μ帖包含的视觉单词数量，η康示第Μ帖包含的总的视觉单词数量，Ρ为视频帖的数量，Πμ表示包含视觉单词的视频帖数量；
[0091] 每一帖的统计结果生成一个直方图，横坐标为所有视觉单词，纵坐标为每个视觉单词在该帖中的统计频率；
[0092]S5、提取视频指纹
[0093] 将步骤S4. 2中每一视频帖的词频统计结果均使用相似保存哈希算法转换为一串 16进制的序列，从而得到每一视频帖的最简指纹，再按照视频帖在视频中的时间顺序，将最简指纹进行串联，得到视频指纹。
[0094] 实例
[0095] 本实施例中，从优酷网中选取一段宣传视频进行仿真，对提取的17个关键帖的 SURF特征点进行稀疏编码，然后来对运些稀疏结果查找对应的视觉单词。
[0096] 对于一个稀疏特征点在1024大小的词典D中匹配到属于自己的视觉单词，平均消耗的时间记为tg。，而对于一个非稀疏特征点在同样大小的D'中匹配视觉单词平均消耗时间记为tguff。对于运个视频中的某一帖，平均包含有300个特征点，那么运部视频特征点稀疏前后的单词查找时间如表2所示。
[0097] 表2是稀疏编码前后视觉单词查找开销表；
[0098]
[0099]表 2
[0100] 从表2中可W看出，在存储上，稀疏编码结果能大大降低计算存储开销。对于总的时间开销，平均包含300个特征点的视频帖，稀疏编码时间平均为0. 302秒左右，所W计入运个时间，稀疏编码单帖查找时间开销约为0. 945秒，略快于非稀疏编码。
[0101] 在本实施例中，通过采用稀疏编码来对SURF特征点进行优化处理来提升视频指纹的生成效率。而视频指纹除了要求具备一定实时性的同时，也要具备良好的准确性与鲁棒性。原SURF特征点具有较强的尺度、旋转、亮度等不变性，对于稀疏编码结果，依然需要维持运些特性。实验中选用包含80个视频片段的视频库，每段视频播放时长约为1分钟左右，来对本发明生成的视频指纹的准确率进行仿真分析，准确率仿真结果如图5所示。
[0102] 从图5中可W看出，当查全率相同时，编码后的查准率会低于原SURF特征点，运是因为经过稀疏编码的特征点，会丢失一些信息，导致在视觉单词查找过程中出现部分特征点出现误判，导致词频统计会出现偏差。但编码后的整体性能依然接近原SURF特征点。
[0103] 对于稀疏编码结果的鲁棒性，本实施例通过调节视频的亮度、修改画面的大小、在视频画面中添加字幕和高斯模糊化画面来分析算法的抗攻击性能，如图6所示。
[0104] 图6中（a)为不同亮度下的视频攻击，化）为视频尺度攻击，（C)为高斯噪声攻击 W及字幕攻击。可W看出，对于运些视频编辑，稀疏编码后的SURF特征点依然能保留较好的鲁棒性。对于高斯噪声，当高斯噪声较大时，对于指纹提取影响也就越大，本文运里选择每个通道添加10%的高斯噪声，实验结果表明，在运种情况下视频指纹具备一定的抗攻击性。然而，对于字幕添加攻击，因为运种情况引入了新的图像信息，所化会导致图像特征点较大的变化，导致生成的指纹抗攻击能力较弱，运是由于SURF提取算法本身的特性所决定的。
[0105] 尽管上面对本发明说明性的【具体实施方式】进行了描述，W便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于【具体实施方式】的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，运些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。
【主权项】
1. 一种基于稀疏编码的视频指纹提取方法，其特征在于，包括以下步骤： (1)、构建稀疏词典 (1. 1)、利用SURF算法对预选的词典训练视频库进行提取特征点，得到训练特征点集实中，m表示词典训练视频库中视频的个数表示词典训练视频库中第i个视频的特征点集，每个特征点集表示菱示第i个视频的第j帧中提取的特征点，其中k为视频帧的数量；(1.2) 、计算稀疏系数设训练特征点集ξ对应的稀疏系数集合为表示第i 个特征点集对应的稀疏系数集；设设稀疏词典B = by j = 1，2,…，N，其中，bj为基向量，N 表示稀疏词典中基向量个数；在稀疏词典训练初始阶段，初始稀疏词典B由基向量随机生成；将训练特征点集ξ中的|(1>和初始稀疏词典B代入到公式（1)中，求出$~对应的稀疏系数集$ 5其中，。，β，c均为常系数，表示稀疏系数集；f):中第j个特征点，111 Γ为平方差， ^0 Λ稀疏函数，这里为1范式； (1.3) 、更新稀疏词典 (1. 3. 1)、耗作为输入训练集，同对应的稀疏系数;;(u -起代入到公式⑵中，求出稀疏词典B的最优解；其中，d为常数，为稀疏词典中第i行第j列值；(1. 3. 2)、利用拉格朗日对偶算法，用步骤（1. 3. 2)中求出的最优解对原始稀疏词典B 进行更新，更新后的稀疏词典标记为 (1. 3. 3)、将稀疏词典f代入到公式（1)中，求解出对应的稀疏系数并按照步骤（1. 2)~（1. 3)所述的方法进行迭代，直到第m个特征点集|(m>，得到最终更新后的稀疏词典I;: (2) 、稀疏编码利用SURF算法对待处理视频进行提取特征点，得到特征点集ζ = ，…，TM}，TM 表示待处理视频中第Μ帧提取出来的特征点集合；将ζ和稀疏词典代入到公式（1)中，求出ζ对应的稀疏系数s' ；将ζ作为输入集合，采用特征符号算法求解最优解；其中，γ为稀疏系数，111 L表示求1范式；求得的结果即为待处理视频特征点集的稀疏编码结果，记为表示第μ帧特征点点对应的稀疏编码结果；(3) 、构建视觉词典并统计词频信息 (3. 1)、利用步骤（2)所述的方法，对训练特征点集《进行稀疏编码，再利用Kmeans聚类算法对稀疏编码结果进行聚类，聚类簇为Q个，每个聚类中心作为一个视觉单词，从而得到视觉词典(3. 2)、将步骤（2)中稀疏编码结果!；。中每一帧的集合g与视觉词典中的视觉单词进行欧式距离计算；其中，Vz、Vq为向量，V z表示巧C中的稀疏编码后的一个特征点的向量值，Vq表示视觉词典W中的一个视觉单词的向量值；选择最小欧式距离的视觉单词，并标记为该视频帧中对应的特征点； (3. 3)、利用ti-idf模型对每个视频帧的特征点进行词频统计，BP :其中，nMd表示视频第Μ帧包含的视觉单词数量，n d表示第Μ帧包含的总的视觉单词数量，Ρ为视频帧的数量，ηΜ表示包含视觉单词的视频帧数量；每一帧的统计结果生成一个直方图，横坐标为所有视觉单词，纵坐标为每个视觉单词在该帧中的统计频率； (4) 、提取视频指纹将步骤（3.3)中每一视频帧的词频统计统计结果均使用相似保存哈希算法转换为一串16进制的序列，从而得到每一视频帧的最简指纹，再按照视频帧在视频中的时间顺序，将最简指纹进行串联，得到视频指纹。
【专利摘要】本发明公开了一种基于稀疏编码的视频指纹提取方法，先通过SURF算法对预选视频帧图像特征进行提取，得到训练特征点集，通过对训练特征点集进行稀疏处理，进而得到稀疏词典；再通过SURF算法对待处理视频进行稀疏编码，从而构建出视觉词典并统计出词频信息；最后对视频的每一帧的词频统计结果均使用相似保存哈希算法转换为一串16进制的序列，从而得到每一视频帧的最简指纹，再按照视频帧在视频中的时间顺序，将最简指纹进行串联，得到视频指纹。
【IPC分类】G06K9/00
【公开号】CN105279489
【申请号】CN201510674150
【发明人】徐杰, 吴鹏
【申请人】成都纽捷那科技有限公司
【公开日】2016年1月27日
【申请日】2015年10月13日

完整全部详细技术资料下载

当前第3页1 2 3