一种针对H.264压缩域的视频感知哈希算法的制作方法

文档序号:11389083阅读:496来源:国知局

本发明属于计算机图像技术领域,涉及视频检索、图像检索、图像相似度匹配等技术,具体涉及一种针对h.264压缩域的视频感知哈希算法。



背景技术:

视频感知哈希是指视频数据集到感知摘要集的一种单向映射,其中,具有相同感知内容的视频数据可映射为相同或相似的数字摘要,具有不同感知内容的视频数据可映射为完全不同的数字摘要。视频感知哈希为视频数据的检索、标识、认证等应用提供了安全可靠的技术支撑。

与密码学hash函数类似,视频感知哈希也具有单向性与摘要性等特征。除此之外,视频感知哈希算法还应满足鲁棒性、可区分性、安全性等属性,其中,鲁棒性是指对于感知内容相同或相似的多媒体数据,感知哈希能够得到相同或相似的摘要序列;可区分性是指对于感知内容完全不同的多媒体信息,感知哈希能够得到完全不同或差异巨大的摘要序列;安全性则要求算法能否有效地抵抗非法模拟攻击。

当前的视频感知哈希相关研究,主要集中在基于空域特征感知哈希、压缩域视频特征的感知哈希、基于时空域联合特征感知哈希等方面。

但是,现有的视频感知哈希算法没有顾及到h.264编码格式的特殊性。h.264是目前应用最为广泛、最为成功的视频编解码标准。h.264编码标准之前的视频编码标准,如h.261、h.263、mpeg-4等,预测编码过程主要采用帧间预测的方式,消除的是时间上的冗余性。除了帧间预测,h.264编码标准添加了帧内预测编码,亦即h.264之前的视频编码标准并不包含帧内预测。此外,现有视频感知哈希算法需要独立进行关键帧的检测,没有十分有效地利用h.264编码中已有的关键帧信息。所以,h.264编码的视频感知哈希算法需要依据h.264编码格式的特殊性进行分析与设计。

h.264编码流程仍然主要包括帧内预测(或帧间预测)、残差变换、量化和熵编码。具体如下:对输入视频帧以16*16像素大小的宏块为单位执行预测编码、变换(离散余弦变换)、量化以及摘编码的过程;重建过程是对量化后的结果执行反量化、反dct变换的过程,将重建得到的数据作为下一个宏块的参考数据。

h.264编码标准中帧间预测是根据参考倾的数据来消除时间冗余性,帧内预测则主要利用了宏块与宏块间的数据相关性,当对当前宏块进行帧内预测编码编码时,需要用到相邻块(包括左邻块、上邻块、右上邻块)的信息。另一方面,特征提取是感知哈希的关键步骤,而dct变换是经典的感知哈希特征提取方法。也就是说,h.264编码与解码过程中包含了提取视频帧的感知特征的步骤,这就为h.264编码的视频感知哈希算法的视频解码和特征提取过程的结合进行提供了可能性。



技术实现要素:

本发明的目的是提出一种针对h.264压缩域的视频感知哈希算法,实现高效的h.264视频数据感知哈希序列的生成。解决了现有感知哈希技术少有针对h.264压缩域的情况;解决了现有技术安全性较低的问题。

为实现上述目的,本发明采用的技术方案为一种针对h.264压缩域的视频感知哈希算法,包含以下步骤:

(1)读取h.264视频数据:设置欧氏范数阈值k、信息熵的阈值t,设定归一化参数m1和m2,m1>m2;

(2)判断一帧是否为i帧:将所有i帧无条件地视为关键帧,如果是i帧则转到步骤6,否则,进行步骤3;

(3)计算多维向量:假设当前视频帧由n个宏块组成,每个宏块由4个8×8大小的子宏块组成,另设mvni表示第n个8×8子宏块中第i(i=1,2,3,4)个4*4子宏块的运动向量值,得到4个运动向量欧氏范数,选取mvni中最大值表示第n个8×8子宏块的运动偏移量xn,即

xn=max(mvni),i=1,2,3,4公式(1)

当前视频帧内每个8×8的子宏块运动偏移量xn作为向量fm中的1维,得到多维向量fm,即

fm=max(x1,x2,…,xn-1,xn);公式(2)

(4)确定欧氏范数:向量fm表示视频帧中所有变化宏块的运动情况,其欧氏范数‖fm‖表达式为

(5)比较‖fm‖与k的大小:如果‖fm‖≥k,当前视频帧为关键帧,进行步骤6;反之,如果‖fm‖<k,当前帧为非关键帧,跳转到步骤1,重新进行下一帧计算;

(6)进行基于信息熵的关键帧自适应归一化:如果信息熵大于或等于t,通过双线性插值将视频帧分辨率调整为m1×m1;如果信息熵小于t,则将视频帧的分辨率调整为m2×m2;

(7)特征提取:对分辨率调整后的视频帧进行dct变换,选取ac系数和dc系数作为视频帧的内容特征;

(8)特征量化:量化提取的系数为二值序列,确定ac系数和dc系数的量化规则;

(9)量化序列加密:量化后的二值序列,采用rc4算法进行加密,得到序列就是该关键帧感知哈希序列;

(10)加密序列串联:重复步骤1~9,将视频所有视频帧的感知哈希序列串联起来,就构成了视频数据最终的感知哈希序列。

进一步,上述步骤7中,所述选取ac系数和dc系数作为视频帧的内容特征具体为选取变换后每个分块的一个dc系数和15个低频ac系数作为视频帧的内容特征。

进一步,上述步骤8中,所述ac系数的量化规则为:系数为正,置为1;系数为负,置为0。

同样,步骤8中,所述dc系数的量化规则为:大于各分块dc系数的均值,置为1,否则置为0。

与现有技术相比,本发明具有的有益效果:

(1)本发明充分利用了h.264编码的压缩域信息,显著提高了感知哈希序列和感知原始视频信息的能力;

(2)本发明既可以用于视频检索,也可以用于视频认证、视频拷贝检测,取决于发明实现过程中的i帧归一化的过程,具有很好的灵活性;

(3)通过阈值k的设定,调节关键帧判别的强度,有利于本发明方法计算效率和特征提取强度之间的调节;

(4)本发明充分顾及了h.264视频数据的整体内容特征,伪造感知哈希序列的可能性大大降低;而且本发明采用的rc4是主流的流密码,安全性有充足保障。

附图说明

图1为本发明针对h.264压缩域的视频感知哈希算法的流程图。

具体实施方式

现结合附图对本发明做进一步详尽的说明。

如图1所示,本发明提出一种针对h.264压缩域的视频感知哈希算法主要包含具体步骤如下:

(1)读取视频数据;设置欧氏范数阈值k;设定信息熵的阈值t;设定归一化参数m1和m2(m1>m2);

(2)判断一帧是否为i帧,将所有i帧无条件地视为关键帧,如果是i帧则转到步骤6,否则,进行步骤3。这里将所有i帧作为关键帧进行特征提取,顾及到了h.264编码中i帧的重要性。

(3)假设当前视频帧由n个宏块组成,每个宏块由4个8×8大小的子宏块组成,另设mvni表示第n个8×8子宏块中第i(i=1,2,3,4)个4*4子宏块的运动向量值,得到4个运动向量欧氏范数,选取mvni中最大值表示第n个8×8子宏块的运动偏移量xn,即

xn=max(mvni),i=1,2,3,4公式(1)

当前视频帧内每个8×8的子宏块运动偏移量xn作为向量fm中的1维,得到多维向量fm,即

fm=max(x1,x2,…,xn-1,xn)公式(2)

利用h.264帧内预测的特点,通过运动矢量欧氏范数判断非i帧是否为关键帧。

(4)向量fm表示视频帧中所有变化宏块的运动情况,其欧氏范数‖fm‖表达式为

(5)如果‖fm‖较大,说明视频帧运动较为剧烈,其内容与前帧的差别较大,可以认为该帧为关键帧,因此,通过比较判断欧氏范数‖fm‖与阈值k的大小来判断当前视频帧是否为关键帧,即:如果‖fm‖≥k,当前视频帧为关键帧,进行步骤6;反之,如果‖fm‖<k,当前帧为非关键帧,跳转到步骤1,重新进行下一帧计算。

(6)基于信息熵的关键帧自适应归一化。于或等于t,通过双线性插值将视频帧分辨率调整为m1×m1;如果信息熵小于t,则将视频帧的分辨率调整为m2×m2。即根据格网单元的信息熵,可以自适应地决定该格网单元的特征点聚类的参数。

(7)分辨率调整后的视频帧进行dct变换(离散余弦变换),并选取变换后每个分块的一个dc系数和15个低频ac系数作为视频帧的内容特征。

(8)量化提取的系数为二值序列。ac系数的量化规则为:系数为正,置为1;系数为负,置为0。dc系数的量化规则:大于各分块dc系数的均值,置为1,否则置为0。

(9)量化后的二值序列,采用rc4算法进行加密,得到序列就是该关键帧感知哈希序列。

(10)重复步骤(1)~(9),视频所有视频帧的感知哈希序列串联起来,就构成了视频数据最终的感知哈希序列。

本发明基于h.264编码的感知哈希技术,针对现有技术很少有针对h.264编码的缺陷解决了h.264编码的视频检索相关技术空白。本发明充分顾及了h.264视频数据的整体内容特征,伪造感知哈希序列的可能性大大降低;而且,本发明采用的rc4是主流的流密码,安全性有充足保障。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1