利用新型准正交码生成技术的数字指纹设计与检测方法

文档序号:6331759阅读:151来源:国知局
专利名称:利用新型准正交码生成技术的数字指纹设计与检测方法
技术领域
本发明涉及一种利用新型准正交码生成技术的数字指纹设计与检测方法,是一种特别适合于追踪盗版者的版权保护技术。
背景技术
数字水印技术是多媒体内容保护的主要工具。数字水印技术是将与多媒体内容相关或不相关的一些标记信息,例如版权信息,在几乎不影响原内容价值的前提下,嵌入到多媒体内容当中。虽然多媒体产品的内容有所改变,但并不能被人的知觉系统觉察或注意到。通过这些隐藏在多媒体内容中的信息,可以确认版权所有者、购买者或其他信息。
如果为同一数字产品的每一份拷贝加入一个不同的水印,则数字水印在性质上转变成数字指纹。数字指纹的主要用途是鉴别用户,这使得它的一个重要应用是用于抵抗盗版,这是数字版权管理的另一个主要任务。对于多媒体产品,数字指纹以水印的形式存在,具有水印的全部特性。然而,指纹与水印在能力上具有本质区别。水印的主要能力是证明数字产品的版权归属。在很多情况下,盗版产品难以否认其侵权性质。因为确认多媒体产品的版权归属是一个相对容易的问题,除了水印之外,尚有其它证明手段。指纹的能力则更强,除了具有一般水印固有的能力以外,指纹可以帮助确认具体的数字产品的购买者。由于指纹携带购买者的个体信息,因此通过查获的盗版产品就能知道哪个购买者制造了该盗版。数字指纹能够以此打击和震慑盗版者,因而有很大的商业和社会价值。然而,从技术角度来说,性能良好、数量众多的数字指纹并不容易设计。迄今为止,水印的设计技术已经实用化,但数字指纹的设计方案还没有达到商业化的水平。
另外需要指出的是,数字指纹技术不仅仅可以用于版权保护领域,其它需要用户身份识别的领域,如数字通信中的身份验证,也很可能需要数字指纹技术。
数字指纹之所以难以设计,在于对盗版者来说,一种非常有力的对抗方式是购买同一个产品的多个拷贝,然后逐个比特进行比较(无论产品的数据量多么巨大,利用计算机总是很容易进行的),从而找到那些标记点,并对其进行修改以去除购买者信息,即所谓的共谋攻击(collusion attack)。性能良好的指纹除了必须具有水印的优势,还必须能够抵抗这种共谋攻击。
理解数字水印的特性,对于设计适合多媒体的数字指纹是很重要的。对于多媒体来说,指纹是水印的一种,必须不容易被破坏。用于版权保护的水印要求具有强鲁棒性,能够在一般的图像处理过程中生存。早期的水印研究通常是将水印信息加到多媒体数据在感觉上不重要的区域,如图像中的高频分量。这样水印不易被察觉,但很难抵抗通常的图像处理手段,如压缩、变色、格式变换等。由于人类的视觉或听觉系统具有掩蔽效应,后期的水印研究逐渐集中于如何将水印插入知觉中重要的区域如图像的低频分量而不会引起可感的变化。由于水印附载于在感觉上重要的区域,这样的水印能够抵抗通常的图像处理手段。于是问题变成如何将水印插入知觉中重要的区域而不会引起可感的变化。在此问题上的主要成果是I.Cox等人做出的,见“Secure spread spectrumwatermarking for multimedia”IEEE Trans.On Image Proc.,vol.6(12),December 1997。Cox认为,在多媒体中,任何频谱系数都可以改变,只要这些改变是微小的。然而,非常微小的变化很可能被看作噪声。如果不加以特殊处理,水印信息会淹没。为了解决这个问题,Cox从吸取扩频通信的思想,将图像或声音的频域视为一个通信信道,相应地,水印被视为通过该信道传递的信号。有意识的攻击以及无意识的信号失真被视为噪声,而该信号必须对它具有免疫力。
扩频通信的基本思想来自于著名的关于信道容量的香农公式C=Wlog(1+P/N)。如果带宽W很宽,那么在信噪比P/N很低的情况下,仍然可以获得满意的信道容量。因此,可以在一个很宽的带宽中发送一个窄带信号,使得呈现在任何单一频率中的该信号能量都微弱到难以察觉。类似地,水印被扩展在非常多的频带以至于任何一个频带的能量都非常小,近似于噪声因而是很难探测的。然而,由于水印的验证过程知道水印的位置和内容,集中这些非常弱的信号成为一个单一的具有很高信噪比的信号就是可能的(与扩频通信非常类似)。破坏这样一个水印是很困难的,需要把高振幅的噪声加到所有的频带。
基于以上原理,Cox建议将水印附载到感觉最重要的频区,这样任何对水印的有效攻击都将导致原始数据的严重降级。被适当放置在这些频域中的水印将会在实际上不可能看到或听到。因为如果水印在任何单一频率系数中的能量充分地小,这总是能够做到的。除此之外,通过利用人类听觉或视觉系统中的掩蔽现象,在特定的频段提升水印能量也是可能的。与扩频通信类似,水印的验证是通过提取水印位置处的信号,在去除固有的多媒体主信号之后,与原始水印进行相似性计算,从而判断出该产品是否含有该原始水印。Cox的水印设计方法是水印技术领域的重要成果,对于压缩、滤波、以及噪声污染具有很强的鲁棒性,并同时考虑到视觉特性,图像的主观质量也很好。另外值得注意的是,虽然此方法用于在数据中隐藏水印,实际上可以用于通过媒体数据携带任何信息。

发明内容
本发明的核心工作是将Cox的水印方案扩展成指纹方案,并且指纹的数量和性能足以达至商业化。本发明的重点是维持数字指纹特定的码长以及分布特性,同时又找到数量足够多(可供商业化)、正交性足够好的这样一组整数序列。良好的正交性是必须要满足的,因为指纹判断的方法是相似性计算,如果正交性不够好,不同的指纹之间可能混淆。
实际上,寻找正交性良好的一组代码,也是其它数字通信与信息技术领域的一个重要问题。在限定序列长度的情况下,人们一直在努力寻找数量足够多、性能足够好的正交编码群。
为了找到这样一组编码,本发明设计并公开了一种新的准正交编码方法,并且开创性地采用了新的数学手段和算法来支持这种准正交编码的寻找。利用本发明的新型正交编码设计方法,可以构造出前所未有的数量巨大的准正交编码库。
具体来说,这种新的准正交码的设计方法是考虑n个不同元素构成的n位码,要求每个元素刚好出现一次,对于由n个不同元素构成的n位编码来说,如果要求任意两个编码的码距为d(即对于n个位置来说,最多有n-d个位置上的元素相同),则最多能够有M=n·(n-1)·…·(n-d+1)个编码满足此要求。例如对于d=n-2来说(即任意两个编码之间最多只有2个位置上的元素相同,当n比较大时,正交性充分好,而且数量也足够多),最多可有n·(n-1)·(n-2)个编码满足此正交要求。
假设这样一组编码已经找到,如果要求正交编码呈现二进制的形式,则刚才所讨论的正交编码很容易扩展成符合要求的形式。例如采用hadamard矩阵生成m个正交的二进制编码H1、H2、…、Hm,然后将这m个编码视为m个元素,利用前面所讨论的设计方法扩展生成m·(m-1)·(m-2)个码长为m·m的准正交编码即可。可见,该方法所生成的准正交码的数量远远大于传统上利用hadamard矩阵生成的m·m的数量。显然,准正交码数量剧增的代价是正交性略微下降。
对于本发明所具体涉及的指纹编码来说,生成方式要稍微复杂一些。因为本发明所涉及的指纹编码既不是二进制也不是均一分布的。处理这种编码要求的方法是将每一个元素都处理成统一的符合要求的进制以及分布形式,然后单纯扩展即可。
如何寻找到这样一组n·(n-1)·(n-2)个满足d=n-2要求的编码,是一个尚未有人研究的纯粹数学问题。该问题的一般性解决可能相当困难或较为容易,但目前尚未有任何结论。本发明人利用在解决此问题时形成的某些猜想和严格推论,找到了有效部分解决该问题的一种方法,对于n<1000且n为素数或素数的幂+1的情况,能够找到n·(n-1)·(n-2)个满足d=n-2条件的编码。很容易看出,当n较大时如大于50,正交性对于应用来说是理想的,编码数量对于实用来说也足够多。n越大,编码的正交性越好,编码数量也大幅增长。
当n稍大时,如n>20,无论采用现有任何的计算机进行大海捞针式的穷举式搜索都是不可能做到的,因为搜索量是0(n!)。在n较大的情况下,满足d=n-2要求的编码是这样寻找的。假设达到编码数量上界M=n·(n-1)·(n-2)的编码成群,根据群理论,该编码群可由有限个元素经过置换运算生成,称之为种子。假设种子数为3,分别为s1、s2、s3。根据有限置换群的概念,可以推断s1必须具有(1)(n-1轮换)的形式,不妨定义s1=1345…n2。进一步,可以推断s2必须具有(1)(2轮换)(2轮换)…(2轮换)的形式,s3必须具有21n(n-1)(n-2)…543的形式。这其中,s1、s3具有明确的表达式,s2是最难得出的。但在n取值不是非常巨大的情况下,大约是n<1000时,有一些规律帮助采用计算机程序搜索找到s2的具体排列方式。在s1、s2、s3都确定之后,所有n·(n-1)·(n-2)个编码都可以通过这3个种子之间的各种置换运算得到。有了这n·(n-1)·(n-2)个编码,依照前述的扩展方法就可以得到数字指纹编码库。
数字指纹指纹的嵌入和检测与通常的水印嵌入与提取类似。以通常的压缩图像为例,首先是图像分成若干小块,每个小块进行频域变换运算,然后将指纹编码依次与各个小块的低频分量(不包括直流分量)相加,从而得到嵌入指纹的数字产品。其它形式的多媒体数据,数字指纹嵌入的方法在本质上是相同的。
数字指纹的检测/比对过程如下提取目标数字产品的特定小块的低频分量,然后与未嵌入任何指纹的原始产品特定小块的低频分量进行差值运算,得到一个特定维数的整数序列,即为待检测的指纹编码,它很有可能被改动过。将此整数序列与数字指纹编码库中的所有数字指纹进行前面所述的相似性运算,从而还原出某个或某些特定的数字指纹编码Ni、…、Nt。
具体实施例方式以典型的512×512像素jpg压缩格式的灰度图像为例。具体来说,本发明的数字指纹是由1020个整数数字组成的编码,它们均为均值为0和方差为1的正态分布N(0,1)。当然,指纹编码的长度是可变的且是可调整的,以适应数据的特性。对于视频来说,指纹编码可以比较长,但视频通常考虑的也是少数几帧的容量,因为水印/指纹攻击可以从时间轴上进行。指纹被放置在图像频谱中视觉上最重要的分量里,以确保在图像经过通常的信号和几何失真后仍然存在。由于是离散取值,每个系数的变化幅度为集合{-5,-4,-3,-2,-1,0,1,2,3,4,5}。又由于是正态分布,因此对于1020个随机数字来说,可以得出取值为0的数字个数大约为400,取值为-1,1的数字个数大约各为242,取值为-2,2的数字个数大约各为54,取值为-3,3的数字个数大约为4,取值为-4,4以及-5,5的数字个数总和不超过1。忽略取值为-3,3、-4,4、-5,5的数字并将数字个数吸收到-2,2中。可以认为此正态分布N(0,1)的特性是由特定数量的0、-1,1、-2,2来维持的,即400个0、240个-1、240个1、60个-2、60个2。
设Nx等于该正态分布中x的数量,取整并忽略某些极小量,N0=400、N-1=240、N1=240、N-2=60、N2=60。将其公约成N0=7、N-1=4、N1=4、N-2=1、N2=1。现在我们需要构造60个编码,C1、C2、…、C60,每个编码长度为17,包括7个0、4个-1、4个1、1个-2、1个2,并且要求这60个编码相互之间有良好的正交性。构造这些多进制形式的编码并没有一定之规,因为数量不多,很容易设计和调整,使之符合我们的要求。
将C1、C2、…、C60视为60个不同的元素,根据前面所描述的n个不同元素构成的n位码的正交编码生成方法,令n=60,存在60·59·58=205320组编码,它们相互之间最多只有两个位置上的元素相同,正交性是相当好的。每组编码的长度为60·码长17=1020。这样,我们就设计了20万个N(0,1)分布的且正交性良好的数字指纹编码。这些数字指纹编码用于嵌入到多媒体数字产品的内容。
数字指纹的嵌入是通过将载体图像分成适当小块,对每个小块进行离散余弦变换、小波变换或其他任何形式的频域变换运算,选取1020个变换后的各个小块的低频分量(不包括直流分量),将其与指纹编码相加,从而得到嵌入指纹的数字产品。其它形式的多媒体数据,数字指纹嵌入的方法在本质上是相同的。
数字指纹的检测/比对过程如下当搜集到非法发行/盗版的多媒体数字产品时,首先提取目标数字产品的特定1020个小块的低频分量,然后与未嵌入任何指纹的原始产品特定1020个小块的低频分量进行差值运算,得到一个1020维整数序列。将此1020维整数序列与数字指纹编码库中的所有数字指纹进行前面所述的相似性运算,从而还原出某个或某些特定的数字指纹编码Ni、…、Nt。这意味着该份数字产品的所有者是留下数字指纹Ni、…、Nt的那些人,他们即是非法传播该数字产品的嫌疑人。
相似性运算是这样进行的Sim(X,starX)=X*starX/sqr(starX*starX)X原初正版指纹编码序列
starX来自盗版的可能改变了的指纹编码序列*向量的内积sqr平方根由于盗版者无法得知X序列,因此starX的产生依赖于X。这样Sim(X,starX)具有较大的值(大于10),即具有高度的相似性。反之,如果starX独立于X产生,则Sim(X,starX)通常不会大于6。
应该指出,本发明关于准正交码的设计方法不仅仅可以用于数字指纹技术领域,对于其它任何需要正交码的信息技术领域都是可能应用的,对于在新的领域的任何应用,本发明所涉及到的相关方法也需要得到保护。
权利要求
1.一种码长为K的准正交码群的生成方法,改进了任何信息技术领域中利用正交码的数字通信信道的编码效率和带宽利用,所述的方法包括以下步骤建立n个相互正交或准正交的码长为L的码组C1、C2、…、Cn,n·L=K。Ci(1≤i≤n)称为元素。根据发明人发现的编码规律,可以生成数量最多为n·(n-1)·(n-2)的码长为n·L=K的准正交码群Mj{1≤j≤n·(n-1)·(n-2)}。此准正交码群Mj的特性是每个编码均有C1、C2、…、Cn元素各出现一次,任意两个编码之间最多只有两个位置上的元素相同。
2.如权利要求1的方法,建立具有某种特定分布类型的准正交码群,如针对本发明关于数字指纹的呈现正态分布的准正交码群Nj。对于其它领域,如数字通信、计算机网络,其它分布要求的准正交码群也依同样原理实现。某种特定分布是通过保证每个元素Ci的分布来实现的。
3.如权利要求2的方法,Nj即为用于嵌入到数字多媒体产品中的数字指纹编码库。同一个多媒体产品的不同拷贝,在发行的时候将这些不同的指纹编码嵌入到多媒体内容中去。
4.如权利要求3,以图像为例,数字指纹的嵌入是通过将载体图像分成适当小块,对每个小块进行离散余弦变换、小波变换或其他任何形式的频域变换运算,选取K个变换后的各个小块的低频分量(不包括直流分量),将其与指纹编码相加,从而得到嵌入指纹的数字产品。其它形式的多媒体数据,数字指纹嵌入的方法在本质上是相同的。
5.数字指纹检测方法以图像为例,首先提取目标数字产品的特定K个小块的低频分量,然后与未嵌入任何指纹的原始产品特定K个小块的低频分量进行差值运算,得到一个K维整数序列。将此K维整数序列与数字指纹编码库中的所有数字指纹进行相似性运算,从而还原出某个或某些特定的数字指纹编码Ni、…、Nt。这意味着该数字产品的所有者是Ni、…、Nt。
全文摘要
对于多媒体来说数字指纹是数字水印的一种应用形式。如果为同一多媒体产品的每一份发行拷贝加入一个不同的水印,水印在性质上就转变成指纹。数字指纹的主要用途是鉴别用户,它可用于打击盗版。本发明涉及一种利用新型准正交码生成技术的数字指纹设计与检测方法,是一种特别适合于追踪盗版者的版权保护技术。利用发明人在有限置换群方面的猜想和推论,发明人创造了一种新型的准正交码的生成方法。这种新型的准正交编码具有良好的正交性以及足以实用化的众多数量。利用这种准正交编码设计了数字指纹编码库。数字指纹如同水印一样被嵌入到多媒体内容中。当搜集到非法发行或盗版的多媒体产品时,经过指纹提取和指纹比对,就能够确定具体的盗版者。
文档编号G06K19/06GK1585328SQ20041004279
公开日2005年2月23日 申请日期2004年5月28日 优先权日2004年5月28日
发明者孙晓博 申请人:孙晓博
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1