一种多媒体数字签名的方法

文档序号:6610002阅读:177来源:国知局
专利名称:一种多媒体数字签名的方法
一种多々某体数字签名的方法
技术领域
本发明涉及数字签名,特别地涉及一种多媒体数字签名的方法,属于电 子技术领域。
背景技术
随着电子技术、计算机技术的不断发展,数字多媒体信息的应用范围越 来越广,由于数字多媒体信息存在易拷贝和易修改的特性,所以如何对数字 多媒体信息进行版权和内容的保护是近年来提出的一个急待解决的问题。
针对上述问题,现有技术中多釆用数字水印(Digital Watermarking)技 术,该技术是将水印信息(如数字、序列号、文字、图像标志等版权信息) 嵌入数字媒体内容内,且不影响视听效果,也就是使水印信息成为源数据不 可分离的一部分。由此,该源数据即使通过压缩、数/才莫转换、改变文件格式 等操作,设计鲁棒的水印也能继续存在;并且在需要的时候可以将嵌入的水 印信号提取出来,用来判别对象是否受到保护,以达到版权保护的目的。
但是,上述的数字水印技术难以对抗解释攻击、串谋攻击以及机会攻击 等安全性问题,使得数字水印在版权保护领域的应用受到了很大的限制。例 如,在解释攻击中,攻击者在已经嵌入水印后的多士某体中再嵌入他的水印, 然后声明版权是他的,而此时利用数字水印技术根本无法检测在同一数字媒 体中的多个水印生成时间的先后。可见,由于数字水印技术本身存在的技术 缺陷,使得其在数字多媒体的保护过程中应用性和实用性都存在较大的制约 性。

发明内容
本发明要解决的技术问题是提供一种多媒体数字签名的方法,实现对数 字多媒体的签名。
为达到上述目的,本发明提供一种多媒体数字签名的方法,包括
a. 将数字多々某体对象中确定的低层特征向量构成一个数据矩阵,并对该 数据矩阵进行主成分分析,得到基矢量矩阵;
b. 将所述基矢量矩阵中的每个元素进行量化,以量化后的结果基矢量矩 阵作为最终签名。
进一步地,所述的低层特征是所述数字多媒体对象中能够反映感知内容 的特征。
进一步地,所述的低层特征向量的维数和内容是根据实际需要预先确 定、且其从所述多媒体对象中提取。
进一步地,所述的步骤b中,将所述基矢量矩阵中的每个元素进行量化 具体地为将基矢量矩阵中的每个元素量化成
范围内的一字节整数。
进一步地,该方法还包括
当需要增加数字签名的鲁棒性时,减少当前选定的低层特征向量的维
数;
当需要增加数字签名的区别性时,增加当前选定的低层特征向量的维数。
进一步地,该方法还包括利用标准数字多i某体对象的数字签名对待检 数字多媒体对象的数字签名进行匹配验证,具体地包括
c. 对于标准多媒体对象的数字签名和待检数字多媒体对象的数字签名 分别进行反量化,得到原始的标准多媒体对象的基矢量矩阵以及原始的待检 多媒体对象的基矢量矩阵;
d. 对原始的标准多媒体对象的基矢量矩阵以及原始的待检多媒体对象 的基矢量矩阵进行典型相关分析,得到两者的相似度,当所述相似度不小于 预定的相似度比较值时,待检多媒体对象的数字签名为真,否则,待检多媒 体对象的数字签名为假。
进一步地,所述的数字多媒体对象为数字图像,此时,所述的低层特征 向量为尺度不变特征变换特征向量。
进一步地,所述的数字多媒体对象为数字视频,此时,所述的低层特征 向量为每一帧图像的尺度不变特征变换特征向量。
进一步地,所述的数字多媒体对象为数字视频,此时,所述的低层特征 向量为数字视频中各个视频签名单元内的所有关键帧的尺度不变特征变换 特征向量。
进一步地,所述的数字多媒体对象为数字视频,此时,所述的低层特征 向量为数字视频中各个视频签名单元内所有关键帧的尺度不变特征变换特 征向量采用基于距离测度的无监督聚类方法进行聚类,去除其中的奇异点 后、将得到的各个类别的聚类中心作为该签名单元的特征向量。
再进一步地,所述的尺度不变特征变换特征是这样确定的
01. 对图像进行采样生成图像金字塔;
02. 对金字塔中各个层或者/确定的相近大尺寸层的图像采用多个方差 不同的高斯核进行平滑,对平滑后的图像两两相减得到高斯差分图像;
o3 .根据所述高斯差分图像中的各点与所述点的近邻点的灰度值,确定各 个点的关键值;
04. 确定各关键点的邻域像素的梯度方向直方图,取其峰值作为该关键 点处邻域梯度的主方向;
05. 根据所述关键点邻域的像素点的梯度位置和方向,确定尺度不变特 征变换特征向量。
更进一步地,所述的步骤o3,还包括将所述关键点中所含的低对比度 点和不稳定边缘的响应点去除。
更进一步地,所述的步骤o5进一步地包括
051. 以所述关键点为中心取nxn的窗口,对邻域中各像素的方向梯度 值进行以关键点为中心的高斯加权;
052. 在边长为n/4的块上计算8个方向的梯度方向直方图,确定所述关 键点邻域内的每个像素的梯度方向和模值;
053. 在边长为n/4的块上统计每个梯度方向的累加值,形成一个描述向 量,所有块的描述向量组成尺度不变特征变换特征向量。
又进一步地,所述的n取值为16。
更进一步地,所述的各个^L频签名单元是这样得到的
pl.对数字视频等时间间隔地提取一系列视频关键帧,提取每个关键帧
中的尺度不变特征变换特征;
p2.在相邻关键帧间进行尺度不变特征变换特征点的快速匹配,当匹配 的特征点数量低于某一设定阈值时,将相邻两关键帧之间作为相邻视频签名 单元的边界。
又进一步地,所述的时间间隔根据用户对数字签名的鲁棒性和区分性的 需求预先设定。
与现有技术相比,本发明具有如下显著优点
(1)本发明所提出的多媒体数字签名的方法,包括基于PCA的数字签 名基本生成方法以及基于CCA的数字签名基本匹配方法,能够实现数字签 名的生成和匹配过程,不仅适用于图像等静态对象地签名,也适用于视频等 动态对象的签名,便于数字签名的实用性推广;
(2 )本发明所提出的多媒体数字签名的方法与具体的数字媒体形态无 关,与所提取的低层特征无关,构造的签名长度很短,实现数字签名的鲁棒 性与区别性之间的自由调整与折衷;
(3 )本发明所提出的多媒体数字签名的方法是基于SIFT特征的数字图 像签名方法,将其应用于数字图像和数字签名中,具有较高鲁棒性,特别是 在抗几何失真的鲁棒性上提升显著;
(4) 本发明所提出的多媒体数字签名的方法还可以基于内容自适应视 频签名单元分割及SIFT特征聚类,由此充分利用了时序信息,有效提高视 频签名的鲁棒性,能够抵抗针对视频的特殊攻击方式;
(5) 本发明所提出的多媒体数字签名的方法不仅可以单独使用,还可 以与数字水印技术共同使用,起到更好的标识作用;如果将本发明的方法或 者本发明的方法与数字水印技术的结合应用于互联网多媒体信息的盗版检 测中,将更可靠地解决当今互联网上普遍存在的多々某体信息盗版复制等版权 问题。


图1为本发明具体实施例中多媒体数字签名的生成方法的流程图2为本发明具体实施例中多媒体数字签名的鲁棒性和区别性之间进行 调整的示意图3为本发明具体实施例中多媒体数字签名的验证方法的流程图4为本发明具体实施例中高斯差分图像的生成过程示意图5为根据图4所生成的高斯差分图像确定关键点的示意图6为图5中确定的各关键点的邻域像素的梯度方向直方图7为根据统计邻域点梯度方向生成特征向量的示意图8为本发明实施例内容自适应视频签名单元地分割示意图9为本发明实施例中数字视频签名单元中SITF特征向量矩阵形成过 程的示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步地介绍,但不作为对本发 明的限定。
如图l所示, 一种多媒体数字签名的生成方法,包括如下步骤
步骤101,从数字多媒体对象中提取出多个能反映其感知内容的特征向 量作为低层特征向量,如图像的边缘、离散余弦变换(Discrete Cosine Transform, DCT)低频系数等,上述能够反映感知内容的低层特征向量可以 根据现有技术来确定,且该低层特征向量还可以根据实际情况预先确定需要 选择的维数;
步骤102,将上述能够反映感知内容的低层特征向量组成一个数据矩阵, 并对之进行主成分分析(Principal Component Analysis, PCA ),得到一个基矢 量矩阵,作为中间签名;
PCA是现有技术中一种基于目标统计特性的最佳正交变换,其具有如下 优良性质
(1) 基矢量矩阵的基矢量正交或不相关;
(2) 以部分的基矢量表示原始数据均方误差最小;
(3)基矢量矩阵中的数据能量更集中,是能量集中意义上的理论最佳者。
由于PCA在能量集中意义方面最为有效,所以本步骤中变换前由低层 特征构成的矩阵数据可以表示为正交不相关的基矢量的线性组合,而由于基 矢量依赖于数据,所以不同数据产生的基矢量是不同的;
步骤103,为使生成的签名更短,将基矢量矩阵中的每个元素(其值为 实数)量化成
范围内的一字节整数,以量化后的结果基矢量矩阵作为 最终签名;
由此,通过步骤101 -步骤103实现了基于PCA的数字签名生成方法, 利用该方法生成的数字签名的鲁棒性体现在具有相似^L/听觉感知质量的数 字媒体对象的数字签名之间,对应的前几个基矢量具有高度的相关性;其区 别性体现在由于不同的数字媒体对象的数据矩阵各不相同,经PCA后得 到的基矢量矩阵也各不相同,特别是对应的最后几个基矢量差别很大。
根据上述方法进行数字多4某体签名,还可以实现数字签名的鲁棒性与区 别性之间的自由调整与折衷。如图2所示,当实际需求要求数字签名的鲁棒 性高时,可以降低n的取值;当要求数字签名的区别性高时,则可以增加n 的取值,其中Ai为基矢量,[A,, A2,…,Am]为基矢量矩阵,n为用作签名 基矢量的列数,其维数的选择是根据预先选定的低层特征向量的数量确定 的,也就是说,在实际需要中,可以根据对数字签名的鲁棒性和区别性来确 定低层特征向量的维数。
从上述的数字多々某体签名生成方法中可以看出,该方法并不限制媒体的 形态,也不限制所提取的低层特征向量,因而实现了与具体的数字媒体形态 无关,与所提取的低层特征向量无关的目标。同时利用该方法生成的签名长 度很短,与媒体的大小无关,仅取决于提取的低层特征向量的维数(数据矩 阵的列数)。
利用上述的方法在数字多媒体对象中生成签名后,对数字多媒体对象进 行签名匹配验证可以采用如图3所示的方法,其中原始文件M。的数字签 名为//。,待检文件M的数字签名为//,:
步骤201,根据原始文件M。的数字签名//。来反量化得到原始文件的基
矢量矩阵F。;
步骤202,根据待检文件M.的数字签名"来反量化得到原始文件的基 矢量矩阵K;
步骤203,通过对F"。和R进行典型相关分析(Canonical Correlation Analysis, CCA)得到基矢量矩阵F。和R.的相似度S;
步骤204,将相似度S与预先设定的相似度比较值T进行比较,判断S 是否小于T,如果是,则表明原始文件M。与待检文件械不相似,待检文件 M.的数字签名为假,否则,原始文件M。与待检文件M相似,待检文件A/;. 的数字签名为真。
由此,可以看出通过上述方法,借助于CCA的方法可以将原文件与待 检文件进行匹配,从而实现判断待检文件中数字签名真假的目的。 以下通过更加详细的应用例对本发明所提出的方法进行说明 一、对于数字图像进行签名
利用上述方法对数字图像签名主要是需要确定图像低层特征向量,根据 数字图像的特点,可以从数字图像中提取尺度不变特征变换(Scale Invariant Feature Transform, SIFT )特征向量作为图像低层特征向量,该特征向量的 提取过程可以通过以下具体步骤实现
①选取关键点,并提取关键点特征首先对图像进行采样生成图像金 字塔。如图4所示,对金字塔各层图像均采用多个方差不同的高斯核进行平 滑,对平滑后的图像两两相减得到高斯差分(Difference of Gaussian , DoG) 图像;再将DoG图像的各点与其近邻点比较,如图5所示,该图5中,比 较区域是x点所在DoG图像和相邻DoG图像的3x3区域共26个邻近点, 若该点的灰度值在其邻域内是局部极值(最大或最小值)则称该点为关键点 (point of interest);同时将关键点中所含的低对比度点和不稳定边缘响应点 去除,使其具备良好的独特性和稳定性;
然后统计各关键点的邻域像素的梯度方向直方图,取其峰值作为该关 键点处邻域梯度的主方向,如图6所示。若直方图中还存在达到80%峰值 的方向,则〗夺该方向i人为是该关4定点的辅方向。
由于SIFT特征向量在计算关键点方向时充分利用了邻域信息,这样在
一定程度上可以避免在小运动物体上匹配特征点,但由于小运动物体的邻域
时SIFT特征向量在计算关键点处的梯度方向时使用了直方图统计和高斯加 权的思想,这就对存在定位偏差的特征点匹配提供了更好的适应性;
②计算关键点邻域的像素点的梯度位置和方向,生成SIFT特征向量。 首先以关键点为中心取nxn的窗口,对邻域中各像素的方向梯度值进行以 关键点为中心的高斯加权。然后在边长为n/4的块上计算8个方向的梯度方 向直方图,如图7所示,在该图中中央黑点为当前关键点的位置,每个小格 代表关键点邻域内的一个像素,箭头方向代表该像素的梯度方向和模值。圆 圈代表高斯加权的范围,越靠近关键点的权值越大。
在边长为n/4的块上统计每个梯度方向的累加值,即可形成一个描述向 量,如图7所示,图7中一个关键点共由16个描述向量组成,每个描述向 量含8个方向的梯度信息。这种邻域方向性信息联合的思想增强了算法抗噪 声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。在实 际计算过程中,每个关键点可以取16 x 16的邻域,并取4x4的块进行分析, 得到各块的描述向量。由于共有16个块,各块的描述向量是8维,所以最 终形成128维的SIFT特征向量。
由于SIFT特征向量需要在各个尺度上进行计算,其时间复杂度相对较 高,而且SIFT特征向量的维数很高(通常为128维)。进一步地,作为更优 选地实施例,我们对SIFT特征向量提取方法时仅选择图像金字塔中相近的 几个大尺度图像进行计算,从而提高处理速度。这是因为SIFT算法运算代 价主要集中在提取步骤上,很多小图像的处理会占据大量计算时间。而且小 图像提取的特征点少而不稳定,容易产生错误匹配。上述优选地改进方法能 够在保i正鲁棒性的前纟是下大幅减少运算耗时。特征维数过高的改进方法是 融合SIFT特征向量和不变矩特征向量,以不变矩取代SIFT梯度方向直方图 特征,以降低特征向量维数;在数字图像签名中,可以通过此进一步地优化 方法将SIFT特征向量维数降为28维。
基于上述的图像SIFT特征点,再将每个SIFT点特征向量排列形成SIFT 数据矩阵,利用上述的数字签名生成方法,就可以实现数字图像签名的生成。
由于该数字签名的方法是以SIFT特征向量为低层特征向量的,而该SIFT特 征向量对于各种失真都具有较好的鲁棒性,特别是抗几何失真的鲁棒性,所 以该签名方法具有较高的鲁棒性,特别是在抗几何失真的鲁棒性上有显著提 升。
二、对于数字视频进行签名
视频可以简单地认为是由连续的图像序列构成,从这个角度出发,对于 数字视频签名,我们可以釆用类似于数字图像签名的方法,对视频中的每一 帧图像加入签名信息,从而构成视频的签名。
但是采用上述方法存在两方面的问题(1)整个视频的签名将有其所有 图像帧的签名组合而成,签名信息长度过长,不符合数字签名紧凑性要求; (2)由于视频图像帧本身的时间连续性,相邻帧之间较为相似,对于一系 列相似帧进行签名特征提取同样存在信息冗余的问题。由此,作为进一步地 优化,在对数字视频进行签名时可以将视频内容进行自适应分割方法得到若 干视频签名单元,在将各个视频签名单元内的所有关4定帧的SIFT特征向量 为低层特征向量,按照本发明所提出的方法进行数字签名。
如图9所示,将视频内容进行自适应分割可以通过以下具体步骤实现
① 提取视频关键帧特征。首先对视频等时间间隔地提取一 系列视频关 键帧,提取时间间隔可以根据用户对签名的鲁棒性和区分性的需求进行调 节。对于每个关键帧采用类似于图像签名中的特征向量提取方法提取其中的 SIFT特征向量;
② 基于SIFT特征点向量连续性确定分割边界。在相邻关键帧间进行 SIFT特征点的快速匹配,当匹配的特征点数量低于某一阈值时,表明该相 邻两关键帧内容相似度低,可以将相邻两关键帧之间作为视频分割的边界。
对于每个视频签名单元内的所有关键帧的SIFT特征向量采用基于距离 测度的无监督聚类方法进行聚类,去除其中的奇异点,并将得到的各个类别 的聚类中心作为该签名单元的特征向量。如图9所示,类似于图像签名生成 方法,将签名单元中的所有特征向量排列构成签名单元的SIFT特征向量矩 阵,进而进行PCA变换,提取其基矢量作为该;魄频签名单元的签名。 一个 视频所有签名单元的签名集合构成了该视频的数字签名。
这里需要补充一点的是在对于数字视频中的签名进行验证时,是对于 每个分割的视频单元中的数字签名进行分别进行匹配的,其每个视频单元中 的数字签名匹配方法与上述的匹配方法一致,在此不再赘述。
由上可见,上述数字视频签名方法具有如下优点(1)内容自适应签名 单元分割在一定程度上实现了视频签名鲁棒性与区别性(包括紧凑性)有效 折衷;(2) SIFT特征聚类在签名单元有效利用了时序信息,提高了视频签 名的鲁棒性;(3)内容自适应签名单元分割以及SIFT特征聚类能够有效降 低帧率变化的影响,从而该签名方法能够有效对抗针对视频的特殊攻击方 式。
需要说明的一点是本发明实施例中所提出的方法不仅可以单独使用来 实现对多^某体信息的保护,还可以与数字水印技术相结合,达到更好地效果。
权利要求
1.一种多媒体数字签名的方法,包括a.将数字多媒体对象中确定的低层特征向量构成一个数据矩阵,并对该数据矩阵进行主成分分析,得到基矢量矩阵;b.将所述基矢量矩阵中的每个元素进行量化,以量化后的结果基矢量矩阵作为最终签名。
2. 如权利要求1所述的方法,其特征在于,所述的低层特征是所述数字 多媒体对象中能够反映感知内容的特征。
3. 如权利要求l所述的方法,其特征在于,所述的低层特征向量的维数 和内容是根据实际需要预先确定、且其从所述多媒体对象中提取。
4. 如权利要求l所述的方法,其特征在于,所述的步骤b中,将所述基 矢量矩阵中的每个元素进行量化具体地为将基矢量矩阵中的每个元素量化 成[O, 255]范围内的一字节整数。
5. 如权利要求1所述的方法,其特征在于,该方法还包括当需要增加数字签名的鲁棒性时,减少当前选定的低层特征向量的维数;当需要增加数字签名的区别性时,增加当前选定的低层特征向量的维数。
6. 如权利要求l所述的方法,其特征在于,该方法还包括利用标准数 字多媒体对象的数字签名对待检数字多媒体对象的数字签名进行匹配验证, 具体地包括c. 对于标准多媒体对象的数字签名和待检数字多媒体对象的数字签名 分别进行反量化,得到原始的标准多媒体对象的基矢量矩阵以及原始的待检 多媒体对象的基矢量矩阵;d. 对原始的标准多媒体对象的基矢量矩阵以及原始的待检多媒体对象 的基矢量矩阵进行典型相关分析,得到两者的相似度,当所述相似度不小于 预定的相似度比较值时,待检多媒体对象的数字签名为真,否则,待检多媒 体对象的数字签名为假。
7. 如权利要求1所述的方法,其特征在于,所述的数字多媒体对象为数 字图像,此时,所述的低层特征向量为尺度不变特征变换特征向量。
8. 如权利要求1所述的方法,其特征在于,所述的数字多媒体对象为数 字视频,此时,所述的低层特征向量为每一帧图像的尺度不变特征变换特征 向量。
9. 如权利要求1所述的方法,其特征在于,所述的数字多媒体对象为数 字视频,此时,所述的低层特征向量为数字S见频中各个视频签名单元内的所 有关键帧的尺度不变特征变换特征向量。
10. 如权利要求1所述的方法,其特征在于,所述的数字多媒体对象为 数字视频,此时,所述的低层特征向量为数字视频中各个视频签名单元内所 有关键帧的尺度不变特征变换特征向量采用基于距离测度的无监督聚类方 法进行聚类,去除其中的奇异点后、将得到的各个类别的聚类中心作为该签 名单元的特征向量。
11. 如权利要求7或8或9或10所述的方法,其特征在于,所述的尺度 不变特征变换特征是这样确定的01. 对图像进行采样生成图像金字塔;02. 对金字塔中各个层或者/确定的相近大尺寸层的图像采用多个方差 不同的高斯核进行平滑,对平滑后的图像两两相减得到高斯差分图像;03. 根据所述高斯差分图像中的各点与所述点的近邻点的灰度值,确定各 个点的关键值;04. 确定各关键点的邻域像素的梯度方向直方图,取其峰值作为该关键 点处邻域梯度的主方向;05. 根据所述关键点邻域的像素点的梯度位置和方向,确定尺度不变特 征变换特征向量。
12. 如权利要求11所述的方法,其特征在于,所述的步骤o3,还包括 将所述关键点中所含的低对比度点和不稳定边缘的响应点去除。
13. 如权利要求11所述的方法,其特征在于,所述的步骤o5进一步地 包括051. 以所述关键点为中心取nxn的窗口,对邻域中各像素的方向梯度 值进行以关键点为中心的高斯加权;052. 在边长为n/4的块上计算8个方向的梯度方向直方图,确定所述关 键点邻域内的每个像素的梯度方向和模值;o53.在边长为n/4的块上统计每个梯度方向的累加值,形成一个描述向 量,所有块的描述向量组成尺度不变特征变换特征向量。
14. 如权利要求13所述的方法,其特征在于,所述的n取值为16。
15. 如权利要求9或IO所述的方法,其特征在于,所述的各个视频签名 单元是这样得到的pl.对数字视频等时间间隔地提取一系列视频关键帧,提取每个关键帧 中的尺度不变特征变换特征;p2.在相邻关键帧间进行尺度不变特征变换特征点的快速匹配,当匹配 的特征点数量低于某一设定阈值时,将相邻两关键帧之间作为相邻视频签名 单元的边界。
16. 如权利要求15所述的方法,其特征在于,所述的时间间隔根据用户 对数字签名的鲁棒性和区分性的需求预先设定。
全文摘要
本发明公开了一种多媒体数字签名的方法,包括a.将数字多媒体对象中确定的低层特征向量构成一个数据矩阵,并对该数据矩阵进行主成分分析,得到基矢量矩阵;b.将所述基矢量矩阵中的每个元素进行量化,以量化后的结果基矢量矩阵作为最终签名。本发明具有如下优点(1)能够实现数字签名的生成和匹配过程,应用范围广,便于数字签名推广;(2)与具体的数字媒体形态以及所提取的低层特征无关,构造的签名长度很短;(3)具有较高鲁棒性;(4)能够抵抗各种常见攻击;(5)能够和数字水印技术结合,具有更好地标识性。
文档编号G06T1/00GK101340551SQ200710118418
公开日2009年1月7日 申请日期2007年7月5日 优先权日2007年7月5日
发明者韩庆军 申请人:韩庆军
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1