用于印刷文档的可视鉴别图案的制作方法

文档序号:6658011阅读:185来源:国知局
专利名称:用于印刷文档的可视鉴别图案的制作方法
技术领域
本发明一般涉及印刷文档中的安全特征,并且更具体地涉及印刷文档中的可视鉴别图案。可视鉴别图案可用于区别原始印刷文档和那些印刷文档的影印本、检测文档中的变更以及承载隐藏和/或可视消息。
背景技术
商品社会的先决条件是能够区别真品和假冒或伪劣品。对于文档,需要回答以确定文档的真实性的问题包括以下方面·该文档是原版或原版的拷贝?·自从被首次制造以来该文档被更改过么?·该文档被授权了么?已经发展了许多技术使得能够合理地从文档本身来回答这些问题。使得能够更容易地确定文档是原版或拷贝的技术包括在纸币中使用的复杂蚀刻法、在ID卡中使用的照相术以及特殊纸张。特殊纸张和油墨已经被用于检测变更。用于显示文档被授权的技术包括签名和封印。
随着数字扫描和印刷技术的出现,数字水印已经被用于鉴别印刷文档。数字水印是通过对文档中的图形元素添加承载消息的噪声而嵌入到文档的数字表示中的消息。当用于鉴别的目的时,该消息通常是不可见的,并且只有在组成该消息的信息在图形元素中的位置是已知的情况下才能对其进行读取。对于数字水印技术的研究参见附录A,2002年2月5日公告的美国专利6,345,104,Rhoads,“Digitalwatermarks and methods for security documents”,从第17列27行开始,其内容在这里通过参考而被并入本文。对于数字水印如何用于鉴别目的的例子,参见2001年6月5日公告的美国专利6,243,480,Jian Zhao,“Digital authentication with analogdocuments”。
拷贝技术的发展减小了所有允许人们从文档的外观来确定它是否是真实的技术的意义。由于该进步,不但是钱和金融证券的伪造,而且诸如ID卡和证书之类的其它文档以及包装和标签的伪造,都造成了巨大的损失,占品牌产品世界销售量的5%到8%,并危及商标本身的声誉和价值。此外,因特网的发展驱动了假冒文档(伪造ID、大学毕业证书、支票等等)的交易,可从网上数以百计的公司容易地和匿名地购买到这些伪造文档。随着扫描仪、数字成像软件和印刷机精度的提高,该问题只会变得更糟糕。
随着扫描仪、数字成象软件和印刷机变得越来越好,所需要的是对文档添加信息的新方法,以便能够确定它是原版的还是拷贝的、它是否已经被改变和/或它是否已经被授权。在该领域的成果包括以下方面在一个文档中嵌入多个水印2001年12月18日公告的Rhoads等人的美国专利6,332,031“Multiple watermarking techniques for documents and otherdata”公开了在文档中嵌入若干个水印,每个水印具有不同的性质或在不同的区域。如果该文档被影印或扫描和印刷以便产生一个伪造品,则嵌入的水印将会改变或损坏。水印的性质或水印所嵌入的区域将影响通过拷贝过程改变的程度。因此,每个水印的相对改变程度能够指示该文档是原版的还是拷贝的。以这种方式使用水印具有多个优点·它是灵活的数字水印理论上可以插入到任何文档中,因为它只对文档引入了不起眼的修改。
·因为它是不可见的,所以它能够用于确定伪造品的来源。
·可能存在的水印迫使伪造者以非常高的逼真度来复制整个文档。
水印的优点也是它们的缺点。因为用于安全目的的数字水印是通过对文档添加不可见的噪声产生的,所以在包含所述水印的文档已经磨损和破损的情况下就不能对它们进行读取。因为它们隐藏在文档的噪声中,所以难于在诸如钞票之类的文档中隐藏水印,在所述文档中设计的每个元素都是固定的,并且因此没有空间来容纳噪声。
嵌入影印机不能复制的信息一个文档可以包含在可见光范围内是不可见的部分,因为它是用在紫外光下可见的油墨印刷的。使用可见光进行操作的影印机不能对它进行复制。参见1999年2月9日公告的Mantegazza的美国专利5,868,432“Documents with anticopying means to preventreproducibility by photocopying” 。
所述信息可能还需要比扫描-印刷过程所能达到的分辨率高的分辨率。参见1998年11月13日公告的Alosia的美国专利5,708,717“Digital anti-counterfeiting software method andapparatus”,其公开了一种用于将源图像与潜像结合起来的方法,所述潜像只有在通过特殊的解码器透镜观察时才能看到。该潜像可例如包含重复若干次的单词“authentic(真实的)”,或者更多文档特有的信息,例如ID卡照片中的个人信息。然而,因为潜像是以“子像素”精度印刷的,所以不能容易地对它进行复制。当然,“子像素”现在所代表的内容可在以后容易地进行复制。
全息图被插入到诸如ID卡和钞票之类的文档上,因为它们被认为通过人眼是容易检测的,并且难于以高的逼真度复制。然而,尽管任何人都能够看到在文档上是否存在全息图,但未经训练的观察者通常将不能看出该全息图是真实的还是复制品。
不可见的拷贝保护特征的共同征所有不可见的拷贝保护特征所具有的问题是它们的不可见性使得它们对于不具有读取它们所需的特殊仪器的人来说完全没有用。此外,所述特征的不可见性在印刷和/或检测时产生问题。使用该水印,需要将水印保持为不可见的要求使得它们难于检测,并且特别是在磨损和破损对文档加入了额外噪声的情况下。使用不可见的油墨,印刷和检测都是复杂的,并且那也是具有使用“子像素”精度印刷的潜像的情况。
所需要的是这样的技术,即它能够以较低成本可靠地确定文档是原版还是复制品、该文档是否发生了改变、或者它是否被授权,它使得公众能够看到文档可被容易地鉴别,以及它能够与用于鉴别文档的其它技术容易地结合。此处所公开的本发明的一个目的是提供这种技术。

发明内容
本发明的目的一方面是通过用于确定一个对象的模拟形态是否是原始的模拟形态(即由原始数字表示产生的模拟形态)的技术而不是通过影印或扫描模拟形态来获得的。在利用所述技术的方法中,将从所述模拟形态产生的数字记录的一部分与所述模拟形态部分的原始数字表示进行比较,以确定所述记录部分和该部分的原始数字表示之间的相异程度,并使用该相异程度来确定所述模拟形态是否为原始模拟形态。本发明进一步的特征在于所述被确定的相异性是通过在产生一个非原始模拟形态中所涉及的操作引起的相异性。
该方面的其它特征是在网络的节点中实施所述方法,该节点从该网络中的另一节点接收所述数字记录,并向另一节点返回一个指示所述模拟形态是否已经被确定为原始模拟形态的指示,以及在连接有数字记录设备和输出设备的处理器中实施所述方法。所述处理器根据从所述数字记录设备接收的输入产生所述数字记录,并将指示所述模拟形态是否已经被确定为原始模拟形态的指示提供给所述输出设备。
在本发明的一个有利实施例中,所述部分的原始数字表示具有一个有噪声图案。可使用一个密钥来产生所述原始数字表示,并且除了允许确定所述模拟形态是否为原版的之外,所述原始数字表示在所述模拟形态中还可具有一个功能。该功能可用作条形码或背景图像或用于承载消息。
本发明的另一个方面是一种对模拟形态执行真实性校验的方法。该方法将所述模拟形态的有噪声图案的数字记录与所述有噪声图案的原始数字表示进行比较,并使用所述比较结果来执行所述真实性校验。可使用该技术来确定所述有噪声图案的一部分在所述模拟形态中是否已经被破坏。所述有噪声图案可进一步包含一个消息。
本发明的又一个方面是一种在模拟形态中隐藏消息的方法。在该方法中,产生其中已经隐藏所述消息的可视有噪声图案的数字表示,并将所述数字表示包括在所述模拟形态中。


通过熟读下面的详细说明和附图,其它目的和优点对于本发明所属领域的技术人员来说将是显而易见的,其中图1为可视鉴别图案(VAP)是如何产生并插入到文档中的概图;图2为如何从文档记录VAP;图3为概略地示出在鉴别中如何使用VAP的流程图;图4为原始和非原始模拟形态的印刷和鉴别的概图;图5表示用于水印检测和变更检测的GUI;图6为示出在VAP的原始数字表示和从非原始文档记录的VAP的频带中能量之间相关性的曲线图;图7为表示在VAP的原始数字表示和从原始文档记录的VAP的频带中能量之间相关性的曲线图;图8表示如何使用基于消息的密钥在图像中嵌入无内容的水印;图9表示一种用于确定一个特定的数字表示是否为从使用基于消息的密钥加入水印的数字表示中导出的技术;图10表示如何使用VAP检测文档的变更;以及图11表示如何将VAP结合到条形码或标识中。
附图中的参考数字具有三位或更多位右边的两位是由剩下的数位指示的附图中的参考数字。因此,带有参考数字203的项首先呈现为图2中的项203。
具体实施例方式
仅仅使用水印的存在来鉴别文档通常来讲,用于包括水印的文档的鉴别技术使用水印在文档的图形元素中隐藏用于文档的某种鉴别信息。一个例子是使用水印来隐藏从文档字符码产生的摘要,如在上面引用的美国专利6,243,480中所解释的。使用水印在文档的图形元素中隐藏鉴别信息的技术的一个难题是文档的磨损和破损通常使水印不可读。
本申请的母案USSN 10/287,206探讨了从不可读取的水印获取至少一些信息的方法和在面对诸如由文档的磨损和破损引起的有损耗变形时使得水印更加稳健的方法。其中USSN 10/287,206的发明人在其工作过程中实现了第一,仅仅使用水印的存在可鉴别文档;第二,仅仅使用水印的存在可发现文档在什么地方已经发生了改变。涉及这些实现的USSN 10/287,206的部分如下。
使用基于消息的密钥嵌入的水印图8和9数字水印的标准应用是在数字表示中隐藏消息。这种消息的应用之一是证实或鉴别数字表示被证实的数字表示被认为包含一个含有特定消息的水印;读取水印并将其内容与所述特定消息进行比较。如果它们一致,则该数字表示是有效的或真实的。当所述数字表示已经遭受了有损耗变形时,则该水印可能变得不可读;在USSN 10/287,206中论述的技术在这种情形下允许进行有限的证实或鉴别。借助水印中包含的消息进行证实的一般问题是证实通常包含长消息,例如社会保障号或账号,而包含这种长消息的水印不如包含短消息的水印稳健,因此包含长消息的水印更有可能通过有损耗变形而变得不可读。
该一般问题的一个解决方案是基于这样的观测为了证实或鉴别的目的,水印实际上不需要包含形成证实或鉴别的基础的消息;所有需要的是只有在水印是使用形成所述证实的基础的消息产生的情况下才会在数字表示中出现给定的水印。在那种情况下,水印不需要是可读的;相反,仅仅水印的存在就可以允许数字表示得到证实。此外,因为是水印的存在而不是其内容显示数字表示是有效的或真实的,所以水印的内容除了指示水印的存在之外不需要做任何事情,并且不需要比要求那样做的更长;事实上,这样一个水印的水印向量只需要指定单个位的值。这又使得该种水印比包含形成用于证实或鉴别的基础的消息的水印更加稳健。
产生一个仅仅是它在数字表示中的存在来证实或鉴别数字表示的水印的方法是使用消息来确定水印在数字表示中的位置。这在图8的801处示出。使用密钥函数805(f)从消息803(m)来产生密钥806(K2)K2=f(m);在需要的情况下,函数805可以使用保密密钥K1以及m来产生密钥K2=f(K1,m)。然后将密钥806与短(最小1位)水印向量VM 807一起提供给水印嵌入器809,并且水印嵌入器809在水印数字表示813中的由密钥806指示的位置处嵌入使用水印向量807产生的水印。所述水印在图8中由数字表示813中标记为807的虚线框示出。因为消息803现在不再包含在水印中,而是相反用于产生密钥806,并且短水印向量807在长度上只需要是1位,所以所述消息的长度无论如何对水印的稳健性都没有任何影响。如数学中已知的,有许多的函数可用于从消息803以一种方式产生密钥806,使得密钥806和由此用该密钥产生的水印对于所述消息来说是唯一的。当然所需要的唯一程度可随应用而变化。在某些情况下,所述函数可以是恒等函数,即密钥是消息本身。该技术的优点是该函数确定了水印密钥的长度,并且因此,只要特定的应用需要就能够产生密钥。
图9表示系统901,其确定被认为包含以刚才所述的方式产生的水印的数字表示903是否是真实的。数字表示903包含一组位置905,如果数字表示903实际上是从数字表示813获得的,则所述位置应该包含水印向量807。所述位置位于通过密钥806在数字表示813中确定的位置。所述实行鉴别的系统获得消息803,并且还获得或具有密钥函数805。密钥函数805被应用到消息803以产生如上所述的密钥806。然后该系统将密钥806提供给水印读取器907,该读取器使用它来找到位置905。当一个位置被找到时,它将被输出给比较器909,如在909处所示。短水印向量807也可以占有系统901,并且它被提供给比较器911以便接下来与每个位置905的值进行比较。每个比较的结果912进入聚集器913,在那里结果被聚集以产生总结果915,其指示嵌入到数字表示813中的水印在数字表示903中是否存在。比较器911和聚集器913可使用先前关于用来进行比较和聚集的不可读的水印所讨论的任何技术。如下面对于不可读水印使用的技术所说明的,与数字表示813中的水印相匹配的位置905的图案可用于表示数字表示903已经发生改变的位置。
在某些应用中,聚集器913将产生一个可视的比较结果。这种比较的一个例子在图5中的501示出。此时,施加水印的块根据检测到水印出现的程度具有不同的阴影。所述块越亮,则水印在块中出现的程度越强。因为图像501遭受了有损耗变形,所以具有强水印的块的分布与原始的不同,但由有损耗变形引起的错误是随机的,因此,如果该图像是真实的,则包含水印的所有区域应该具有与如501所示的亮块大致相同的分布。该可视化技术当然也可用于水印,其中所述消息确定水印的内容。
使用水印在数字文档和从数字文档产生的模拟文档中定位变更攻击数字文档或从数字文档产生的模拟形态的一个方法是局部修改文档或形态中的图像以改变其语义内容。局部修改的例子可以是·修改在意外事件/犯罪场景中通过DVR拍摄的汽车图像上的牌号;或·修改ID卡上的照片区域;或·替换ID文档上的照片。
如果所述文档或形态是加水印的,则伪造者的目的是在没有使水印不正确或不可读的情况下改变数字文档或形态的语义内容。通常,当水印足够稳健可被读取时,在没有使水印不正确或不可读的情况下伪造者将不难对文档或形态做小的改变。另一方面,水印的很好的稳健性使得它对于检测和跟踪变更是有用的。
为了使用水印来定位变更,我们只需要知道水印预期出现的位置及其水印向量。因为该技术并不要求水印具有任何特定的内容,所以水印向量只需要是单个位的。一旦检测器知道水印位置和水印向量,则检测器可使用为原始水印的水印向量w的复制品的水印向量w’,并将w’与可疑内容中的水印w”进行比较。W’和w”之间的差别可显示其为可疑内容的来源的数字文档或模拟形态是否已经被修改,并且如果修改了,则显示哪些部分被修改了。
更加详细地说,检测器将数字文档或模拟形态的每个子部分(这里称作块)中的水印向量w”与向量w’进行比较。该比较指出所述文档或形态的每个块是否拥有正确的水印信息。在数字文档中,如果还没有发生变更,则大多数块将包含正确的水印信息。对于模拟形态,印刷和扫描过程恶化了水印,因此,不是所有的块都拥有正确的水印信息(例如,可能存在约为20%到40%的错误)。这些印刷和扫描错误通常具有随机性质,因此能够期望在模拟形态上或多或少均匀地进行分布。因此,如果图像已经被局部变更并且因此在变更后的区域中丢失了其水印,则水印检测器将以与对未加水印的区域做出响应相同的方式对变更区域进行响应。在如此做的过程中,水印检测器检测了该变更。该技术也可用于显示图像的每个区域中的水印的强度。
用于检测变更或水印强度的复制水印向量可来自于任何来源。例子包括原始图像、来自于已经被成功读取的可疑内容的水印向量、或从所述消息重新产生的水印向量。自适应嵌入和检测可用于提高检测变更的效率。例如,需要特别保护以防止改变的内容区域可接收大于其它内容区域的强度的水印,并且当如上所述分析水印时,可在这些区域中考虑较大的水印强度。当然,正如用于显示图像的每个区域中的水印强度的该技术可被利用来辅助设计用于自适应嵌入和检测的掩码。
由统计学、信号处理或模式识别产生的不同技术可被应用以自动检测包含拥有不正确信息(或根本没有信息)的异常大数量的块的区域。例如,由模式识别产生的一个技术是确定不正确块的联系和提取高于阈值的那些联系。另一个技术将是在模拟形态的大小为N×N的所有区域中确定是否存在多于P个的非正确块。来自信号处理的又一个技术是对正确块分配正值和对不正确块分配负值,然后对所得矩阵进行低通滤波。其中值在阈值以下的已滤波矩阵的区域被检测为已经发生了变更。最后,可对所有方法应用统计学以描绘未变更的图像和变更的图像的区域,并确定相对于用户期望(例如,变更区域的最小尺寸、错误报警/拒绝的概率等)的检测参数。也能够以不同的颜色向用户显示具有不正确和正确块的图像,以允许人们对数据作出解释。
图5表示水印强度的变更效果,并且还提供了显示变更区域的图形方式的例子。这里,在通过用另一个未以图像501的脸部加水印的方式加水印的脸部替代所述脸部来加水印之后对图像501进行修改。修改的结果为图像502。当将图像502与图像501进行比较时,将看到图像502的面部区域比图像501的面部区域暗。这接下来显示图像502的面部区域中的块与图像501的面部区域中的块相比所加的水印弱得多。图像502的面部区域中的弱水印当然是修改的直接结果。当对带有许多弱块的高亮区域施加滤波时,结果是图像503,其中修改的区域505清楚地显示出来。
技术的扩展·检测一个以上的变更区域·使用外部模块(例如面部识别),以对大多数语义有效区域(例如ID相片中的眼睛)聚焦变更检测
·对物理文档进行多次扫描以抵消扫描可变性。
如果水印是不可读的,则变更检测可用于检测其不可读的原因。可视鉴别图案继之以前述实现的是导致本发明的实现当仅仅水印的存在被用于确定模拟形态的真实性时,水印被用作无内容图案。因为该图案没有内容,所以对于它来讲不再需要是可见的;相反,可将它添加到文档中作为可视元素。在下面,用于鉴别的可视图案被称作可视鉴别图案或VAP。因为VAP是可视的,所以与水印相比它的检测容易得多。然而,它仍然能够实现不可见水印的所有鉴别功能,并且此外还让文档的用户知道该文档的真实性是受到保护的。
术语在具体实施方式
中将使用下列术语来阐明数字表示和模拟形态之间的关系。
对象的数字表示是对象能存储在数字处理系统中并能由其操作的对象形式。对象可以是或包括作为组分的文档、图像、音频、视频或能够产生数字表示的任何其他介质。
数字表示的模拟形态是在将数字表示输出给例如显示器、印刷机或扬声器的模拟设备时产生的对象或组分的形态。
模拟形态的数字记录是从模拟形态产生的数字表示。产生数字记录的方式取决于介质;例如,对于文档或图像,通过使从文档或图像的模拟形态产生的图像数字化来进行数字记录。
原始数字表示是由被授权这样做的某人制作或拷贝的数字表示;原始模拟形态为从原始数字表示产生的形态。
非原始数字表示是通过在没有授权的情况下对模拟形态进行数字记录而产生的;非原始模拟形态是从非原始数字表示或通过对模拟形态进行影印产生的。
文档将给出通过印刷过程产生的任何模拟形态的特殊含义,包括在更通常意义上由单词组成的文档、标签、包装和本身被盖印的对象。就进行合理类推而言,下面关于文档所述的每件事情也可应用于其他介质。例如,音频模拟形态可以包括为VAP的音频等价物的音频鉴别图案。
产生可视鉴别图案图1
可视鉴别图案的悖论是虽然该图案是可视的,但可能的伪造者一定不能够修改图案从而其将鉴别一个为不真实的文档。该目的在一个优选实施例中是通过产生有噪声的图案获得的,也就是组成所述图案的像素的大部分值显然是随机确定的。因为该图案是有噪声的,所以在对图案的原始数字表示不进行访问的情况下就不可能断定构成图案的数字表示的像素应具有什么样的值。另一方面,如果给出VAP的原始数字表示,就可以将来自于文档的VAP的数字记录与VAP的原始数字表示进行比较,确定记录的VAP相对于VAP的原始数字表示是如何变更的,并且能够根据所述差别确定正被讨论的文档如何发生变更。从下面可更加详细地看出,能够检测到的变更包括在产生非原始文档时所涉及的那些变更和在变更文档中的信息时所涉及的那些变更。
图1表示产生可视鉴别图案并将它插入到文档中的一个方法。有三个步骤·产生图案的数字表示,如在101处所示;·向鉴别图案添加可视标识或符号的可选步骤,如在107处所示;以及·将鉴别图案插入到文档中,如在113处所示。
图案105的原始数字表示可以以产生其中图案的像素呈现为具有强随机分量的值的结果的任何方式产生。图案105的数字表示可以是灰度级图案,或者它可以采用彩色像素。对于利用密钥来产生图案尤其有用;密钥103被用作一个伪随机数产生器的种子,所述产生器产生给予所述图案中的像素的值的序列。密钥的应用将在后面详细说明。图案105的原始数字表示也可以包括有助于定位在通过扫描包含图案105的文档产生的数字表示中的图案的成分。在图案105中,黑色边界106执行该功能。
可将可视标识或符号109添加到图案105的原始数字表示中以产生图案111的原始数字表示而没有损害图案105的噪声量,因为只有构成所述图案的一部分像素值需要被随机确定。因此,可以通过以一种保持像素值的随机性同时使标识或符号得以显现的方式来操作组成所述标识或符号的像素值,使得所述标识或符号可以被叠加在图案105上。例如,如果图案105为灰度级图案,则可通过使符号或标识的像素相对于它们的原始随机值均匀地变得更暗或更亮来产生所述符号或标识。除了保持图案105的噪声量之外,该技术类似于向图像添加可视水印。
一旦图案111的原始数字表示已经产生时,它被插入到文档115的原始数字表示中,如在113处所示。当从原始数字表示115印刷文档117时,文档117包括印刷的可视鉴别图案119。当然,该文档也可以印刷到在其上已经有印刷材料的衬底上。因此,图案119可被添加到预先印刷的衬底上。
使用可视鉴别图案来鉴别文档图2和3当包含印刷VAP 119的文档被鉴别时,将进行下列过程·在所述文档中检测印刷VAP 119。
·产生检测的印刷VAP 119的数字记录。
·将印刷VAP的数字记录与VAP的原始数字表示进行比较;以及·在所述比较的基础上确定真实性。
将印刷VAP的数字记录与VAP的原始数字表示进行比较的方式取决于正在进行的鉴别的种类;此外,给定文档的鉴别可包括在数字记录和原始数字表示之间产生的若干不同种类的比较。例如,在一张支票的数额域上的可视鉴别图案的数字记录可首先与原始数字表示进行比较以确定该支票是否是伪造品,其次是确定数额域中的数额是否已经被更改。
图2表示在一个优选实施例中检测印刷VAP和产生该VAP的数字记录。这两个过程都是使用MediaSec技术公司可用的“Scanread”应用程序进行的。也可以利用检测文档的一部分并产生它的数字记录的其它应用程序。Scanread 201使用黑色边界106来检测可视鉴别图案119在印刷文档117中的存在,然后产生可视鉴别图案119的数字记录203。图3表示使用数字记录203和VAP 119的原始数字表示111来确定真实性的程序的一般流程图301。VAP的原始数字表示111可以是原版本身、原版的拷贝、或者是以与第一原始数字表示完全相同的方式产生的新的原始数字表示111。通过这些方法中的任何一个获得的原始数字表示当然是完全等价的,并且使用哪个方法只是实现结果的问题,例如VAP的原始数字表示的存储成本、通过网络传送VAP的原始数字表示的成本和每次要求时产生原始数字表示的成本。
在303处开始,在305处将数字记录203和原始数字表示111的特征进行比较;将什么样的特征进行比较和它们如何进行比较取决于正在进行的鉴别的种类。如果数字记录203和原始数字表示111之间的差别超过了一个阈值(307),则存在鉴别问题并采用分支309。所述阈值也取决于正在进行的鉴别的种类。在分支309,在311处向正在进行鉴别的应用程序指出存在的问题。在它是有用的情况下,该程序也可以提供关于比较的信息(315);此外,信息的种类和它提供的方式也将取决于鉴别的种类。例如,如果数额域中的数额显示为已经发生了变更,则该程序可显示这样的图像,其显示原始数字表示中的哪些像素呈现为在可视鉴别图案的数字记录中已经发生了变更。如果所述差别并未超过所述阈值,则采用分支317。此时,向正在进行鉴别的应用程序指出没有检测到鉴别问题的事实。两个分支和程序终止于321。
使用可视鉴别图案区别原始文档和非原始文档图4、5可使用可视鉴别图案来鉴别文档的一个方法是通过确定文档是否是原版,即是从原始数字表示印刷的,或者是否是非原版,即是从文档影印的或是从非原始数字表示印刷的,非原始数字表示也就是从文档的未授权数字记录产生的数字表示。可视鉴别图案能够以这种方式使用的原因在于从其数字表示印刷一个文档和从它的数字记录产生文档的一个数字表示或影印一个文档总是导致可视鉴别图案中信息的损失,而不论印刷、数字记录或影印过程是如何的精确;因此,通过将可视鉴别图案的原始数字表示与通过从文档记录可视鉴别图案产生的数字表示进行比较,就能够确定该文档是否为原版或非原版。在原始文档的情况下,可视鉴别图案将被印刷一次和数字记录一次;在非原始文档的情况下,可视鉴别图案将被印刷和数字记录一次以产生用于从其中产生该非原始文档的原始文档,然后,根据非原始文档是如何产生的,或者进行影印或者再次印刷和数字记录,从而与原始文档的可视鉴别图案相比,导致非原始文档的可视鉴别图案中的信息的更大损失。
所述基本技术在图4中更详细地示出。在401中示出了使用可视鉴别图案的鉴别是如何对原始文档起作用的。该文档的原始数字表示403包含一个原始可视鉴别图案(ovap)405。然后在407印刷原始数字表示403以产生原始模拟形态409。印刷操作引起模拟形态409中的原始模拟可视鉴别图案(oavap)411中的损失1。当鉴别器421鉴别模拟形态409时,它产生oavap 411的数字记录,从而导致损失2。该记录呈现为roavap 415。然后鉴别器421利用比较器417将ovap 406与roavap 415进行比较。它们之间的差别为损失1和损失2的和。当任何另外的未损坏roavap 415与ovap 405进行比较时这将是真的,并且所述大小的差别为模拟形态409确实是原始模拟形态的可靠指示。
在420可以看出鉴别是如何对非原始文档起作用的。原始文档和非原始文档之间的差别为非原始文档不是从文档的原始数字表示403直接印刷的,而是从通过数字记录原始文档409已经产生的文档的非原始数字表示423印刷的(422)。作为数字记录的结果,数字表示423中的非原始可视鉴别图案425已经遭受了额外的信息损失,其在图4中显现为损失3。当从数字表示423印刷(427)非原始模拟形态429时,在非原始模拟可视鉴别图案431中发生了另外的损失,表示为损失4。当通过鉴别器421如上所述地鉴别非原始模拟形态429并将从noavap 431产生的rnoavap 435与ovap 405进行比较时,损失3和损失4的影响将在ovap 405和rnovap 435之间显示为比ovap 405和roavap 415之间所具有的更大的差别。因为非原始模拟形态429中的noavap 431将总是遭受额外的损失3和4,所以较大的差别是非原始文档的可靠指示符。
当然通过任何影印过程以及通过记录原始模拟形态(422)以产生非原始数字表示423然后印刷(427)数字表示423以产生非原始模拟形态429的过程都可产生非原始模拟形态429。获得原始模拟形态409的图像然后从该图像印刷非原始模拟形态429的过程造成了类似损失3和4的额外损失,因此,与roavap 425相比,以这种方式产生的rnoavap 435仍将更少类似于ovap 405。
当然,如果非原始数字表示423本身是从非原始数字表示产生的,则rnovap 435将包括从影印或印刷以及所述非原始数字表示的数字记录导致的额外的损失。显然,如果损失1和损失2是固定值,则检测器总是能正确地确定该文档是否为原始的或非原始的。然而,通常对于每个损失将发生某一变化,例如可以以比其它质量更好的质量(逼真度)印刷某些原版。那么看起来就像是应该采用一个统计学检测方法。
用于区别原始和非原始文档的技术的优选实施例的细节图6和7鉴别技术的好坏仅仅取决于其可靠性。使检测错误的概率最小化的关键是用于测量从文档记录的可视鉴别图案与该可视鉴别图案的原始数字表示是如何“不同”的方法。所选择的测量方法必须是基于通过产生非原始文档的过程所影响的VAP的性质,并且必须清楚地区别原始和非原始文档。
我们的方法是把影印、记录和印刷过程看作是滤波器,更加具体地是看作低通滤波器。因此,与低频相比,通过印刷和记录过程高频将被削弱得更多,并且在每个记录和印刷或影印步骤将丢失更多的信息。对于其中记录和印刷或影印过程保存几乎所有能量的低频来说,非原始文档中的VAP可能不具有比原始文档中的VAP显著减少的信息。甚高频也不是有益的,因为VAP中在这些频率下的大多数能量在第一次印刷VAP时就损失了。因此,甚至原始文档的VAP包含来自于那些频率的非常少的信息。因此,必须对检测器使用的频率进行适当的选择和/或加权。用于比较的频率选择,以及用于确定文档是否为原始或非原始的阈值选择典型地是通过对来自原始文档的VAP训练比较软件来进行的。
此处应该指出上述的技术并不需要特殊的可视鉴别图案。相反,可将整个文档或其一部分用作所述图案。然而,因为许多文档或许不包含在确定文档是原版还是拷贝所需的能级下的信息,所以最好使用包含在适当的能级下的信息的可视鉴别图案。在下面,这种可视鉴别图案将被称作拷贝检测图案,或者CDP。CDP中的信息分布在适当的频率中。在一个优选实施例中,通过一个密钥来伪随机地产生CDP的原始数字表示,并且因此有权访问密钥的程序在任何时间都能够产生CDP的原始数字表示的一个新的拷贝。该密钥可以保持是秘密的或只对信任的群体公开。拷贝检测图案被插入或印刷在被保护的文档中。在一个优选实施例中,文档的拷贝检测图案的分析是通过数字记录文档的CDP、使用密钥产生CDP的原始数字表示的一个新的拷贝、并将该记录的CDP与CDP的原始数字表示进行比较来实现的。在其他实施例中,记录的CDP可简单地与CDP的原始数字表示的预先存在的拷贝进行比较。
在所述技术中使用的算法此部分描述了下列过程中所使用的算法(1)产生CDP的原始数字表示;(2)从文档检测和提取CDP;(3)将CDP的原始数字表示与记录的CDP进行比较;以及(4)确定CDP是否为原始的或非原始的。算法(4)中用于比较CDP的方式和用于确定CDP是否为原始的或非原始的的阈值是通过在其中使用算法(3)来收集训练数据的训练过程来确定的。
产生CDP的原始数字表示使用函数make_pattern来产生可与从中产生原始文档的数字表示的来源等同的拷贝检测图案的数字表示(pattern_img)。make_pattern产生有噪声的灰度级或彩色图案。也可将黑色边界添加到该图案中以便于在所述文档中进行检测。CDP也可以可选地显示一个标识。该标识将典型地影响最低频带,并且其对检测的影响将因此受到限制。典型值在参数的说明中给出。
pattern_img=make_pattern(type,height,width,key,filename,border,logo_img,logo_weight)。
用于图案产生的参数必需的1.Type产生的随机数值的类型,例如,“randn”(高斯型的N(0,1))、“rand”(等概率分布)、“randint”(二进制+1或-1分布)、或MD5、SHA算法(0-255的整数)。然后所述随机数值被用于组成灰度级或彩色图像。
2.Height以像素表示的图案高度(例如104)。
3.Width以像素表示的图案宽度(例如304)。
4.Key用作随机数产生器的种子的整数值的保密密钥或密码。
可选的5.Filename保存图案图像的文件的名称。
6.Registration mark(例如,在图案图像的侧面添加的黑色边界,在图案图像的四角处添加的点)。
7.Logo_img将被用作背景标识的图像,自动与图案图像的尺寸成比例。
8.Logo_weight0和1之间的值以对叠加在图案图像上的标识图像的能量进行加权(例如0.2)。
使用图案产生算法的例子1.在特定的域中产生图案(例如,DCT亮度或彩色RGB模式中的空间域)pattern=generate_pattern(type,height,width,key);2.如果步骤1中的域不是空间域(例如逆DCT),则将所述图案变换为空间域pattern_img=transform(pattern);3.如果需要将像素值p上舍入为整数值,0<p<255。
4.将标识与图案结合,例如混合下列函数可以是pattern_img=(1-logo_weight)*pattern_img+logo_weight*logo_img;5.添加registration mark(例如黑色边界)。
6.转储图像。
图案图像可以由多个分量/信道构成,例如红、蓝、绿或YUV,其能够如上面的步骤1和2中所述的被产生。
为了将CDP与标识或背景图像相结合,可采用各种混合函数。例如,当CDP与条形码(图像)相结合时,CDP只替换条形码的黑色区域,而保持白色区域未改变。
能够产生图案图像的任何形状(例如圆形、椭圆形)。一个简单的方法是使用一个定义由“1”和“0”组成的二维数组表示的任意形状的“形状掩模”。通过对矩形图案图像应用“形状掩模”可产生任何形状。
从文档检测和提取VAP在此实现方式中,产生正在被鉴别的文档的数字记录,并且使用VAP上的黑色边界来定位数字记录中的VAP。黑色边界在过渡区导致强烈的亮度变化,其是容易检测的。也可以使用用于确定VAP位置的其它技术(文档中的现有蛋形特征、黑点等)。一旦VAP已经被检测到,就由它产生可与VAP的原始数字表示进行比较的数字表示。该数字表示为记录的VAP。
使用下列函数来对VAP的原始数字表示和记录的VAP进行比较,所述函数量度指示记录的VAP与VAP的原始数字表示的“接近”程度的指标。可将VAP的原始数字表示存储在检测器的存储器中,或者如果用于产生原始数字表示和函数make_pattern(..)的参数对于所述检测器是可利用的,则可再生VAP的原始数字表示。当将所述图案与标识相结合时所使用的可选参数或许不需要,因为标识一般只会轻微影响图案的性质。用于进行比较的函数为analyze_pattern,其返回Results,并且根据实际应用的情景可采用不同的参数Results=analyze_pattern(type,height,width,key,...,test_img);或Results=analyze_pattern(orig_img,test_img);参数和输出1.type、height、width和key这些参数如同对图案产生进行解释的那些参数。
2.test_img从文档提取的测试图案图像。
3.orig_img图案的原始数字表示。
4.Results包含所有分析结果。例如,它可以包括对于图像的不同元素(例如不同频率、不同区域、不同彩色信道等)计算的不同的相关或统计学量度。
下面的例子示出了再生原始数字图案的算法的步骤和该算法所需的子函数1.(可选的)从测试CDP中除去黑色边界2.将测试图案图像变换成其最初产生的域,例如8×8块DCTtest_pattern=transform(test_img)3.再生原始CDPpattern=make_pattern(type,height,width,key);4.(可选的)如下所述使测试CDP和原始CDP局部同步。(可选的)对测试CDP施加某些图像滤波器(例如锐化)以便产生与原始CDP较好的相关性。
5.如果需要,将原始CDP和测试CDP变换成其中要进行所述比较的域(例如8×8块DCT)。注意可在一个以上的域中进行所述比较,例如在空间域和频域中。
6.为变换域中的每个信道计算多个原始CDP和测试CDP之间的相似性量度。例如,如果在彩色RGB域中产生和记录图案,并且在8×8块DCT域中进行所述分析。那么就有192(即8×8×3)种组合,借助它们能够对所述两个图案进行比较,因此就能够执行192个相似性量度。相似性量度本身可以通过多种方式来计算,例如通过对值进行装仓(binning)和只在具有较高相关性时保存那些值,以便排除已经发生毁坏的测试CDP的区域。
7.收集和组合所有相似性量度或基于其它的图像特征的量度,以便测量一个或多个质量的指标或测试CDP与原始CDP“接近程度”的指标。所述组合函数可以是对不同输入进行组合的任何函数,例如通过对为原始CDP和测试CDP之间的较好判别式的特征分配更多加权或重要性来组合相似性量度的函数。
如上面已经描述的,复制过程通常将使原始CDP恶化,并且通常期望不同的接近程度或质量的量度对于从模拟形态记录的CDP将是较低的。然而,由于统计变化,不同量度的适当选择和组合在确定测试CDP是从原始模拟形态记录的还是从非原始模拟形态记录的过程中可能更加有效。
图6表示来自于正在鉴别的文档的原始CDP和测试CDP对于三十个频带(如603所示)的频率能量之间的相关性(如605所示)。如所期望的,能量之间的相关性在低频带最高,而在高频带最低,在低频带下在拷贝过程中损失很少的信息,而在高频带下即使是单独的印刷操作也会引起大量信息的损失。如果对于原始文档的CDP来说,相关性在中频带下比它们的平均水平实质上低,则CDP不是原版,因此正在鉴别的文档也不是原版。那也就是图6的曲线图的情况,因此该图示出了正在被鉴别的文档不是原版。当相关值本身不足以确定文档是原始模拟形态还是非原始模拟形态时,也可以考虑其它图像特征。可以用于产生原始CDP和测试CDP之间的相关值的附加的图像特征包括-彩色直方图-边缘、线条和轮廓-其它域中的频率(例如傅立叶和小波域)-亮度和对比度检测CDP是来自于原始还是非原始文档函数detect_pattern分析由analyze_pattern返回的结果,并返回值Output,其表示CDP是来自于原始文档还是非原始文档。
Output=detect_pattern(Results,Parameters)Results可以是标量值或矢量,函数analyze_pattern的输出。
Parameters调节检测函数的性能所需的值,其可取决于应用程序的需求和执行检测的条件。
Output不同的输出值是可能的。以其最简单的形式,Output可以采取三个值ORIGINAL(原版)、NON-ORIGINAL(非原版)或PROCESSING-ERROR(处理错误)。当图案被非常差地记录时可出现最后一种输出。Output可以返回更详细的信息,例如,NON-ORIGINAL可进一步指出来自于非原始文档的测试图案是如何产生的(例如复制、影印、再生等等)。Output可进一步提供质量或接近程度的指标。
此处是一个用于简单检测函数的算法的例子1.将由analyze_pattern返回的各个Results值进行组合以获得标量值S。这样做的一个方法是通过对返回的Results求和而产生S。
2.如果S>T1,那么输出为ORIGINAL,否则如果S>T2,那么输出为NON-ORIGINAL,否则输出为PROCESSING ERROR。
这里,T1和T2是典型地通过训练过程获得的两个标量参数,典型地具有T1>T2。
使来自文档的CDP与原始CDP局部再同步为了将从文档记录的CDP与原始CDP进行比较,记录的CDP必须与原始CDP同步。这样做的一个方法是使用在记录的CDP中的同步点,例如黑色边界601,以与原版同步。一旦各CDP被同步,则它们之间的比较被逐像素或逐块地进行。
当在印刷文档中的CDP或在数字记录来自文档的CDP中已经有错误时,通过该方法不能使各CDP完全地同步。例如,在原始CDP和从文档记录的CDP之间可能存在小于一个像素的偏移。此外,所述偏移可沿图案发生改变在某些情况下记录的CDP的上部与原始CDP相比可朝向下偏移,而下部可向上偏移(当然或者反之亦然)。这些偏移可能很难注意到,可能不是一致地发生,并且可以在记录的图案中发生局部变化。它们通常是由印刷机中的轻微不稳定引起的,但也可以是由记录设备中的类似不稳定性引起的。
这些不可预测的子像素偏移可降低检测器的性能因为这些未对准,来自原始文档的某些CDP可被检测为来自于非原始文档。处理这些来自于原始文档的“病态”CDP和通常提高CDP检测稳定性的方法是使各CDP局部再同步以便校正局部未对准。有若干种方法来执行局部再同步,但通常的构思是使用记录的CDP本身用于局部再同步。
执行局部再同步的一个方法是将原始CDP分割成块(非重叠块是优选的,但块也可以重叠),并找出该记录的CDP的哪个块与原始CDP的给定块最接近匹配。如果没有未对准,则与给定块最接近匹配的记录CDP的块将位于记录的CDP中与给定块在原始CDP中所具有的相同的位置处例如,对于原始CDP的具有开始位置(80,80)和结束位置(89,89)的10×10块的最佳匹配是记录的CDP的相应块(80,80)到(89,89)。然而,如果有未对准,则最佳匹配也可以是块(81,80)到(90,89)(向右移动一个像素)。如果是这样的情况,那么记录的图案将使得块(81,80)到(90,89)向左移动一个像素到位置(80,80)到(89,89)。相同的构思可应用于记录CDP的每个块,以产生“局部再同步”的CDP。
局部再同步需要几个参数和函数。第一,我们必须定义原始CDP的每个块和记录CDP的相同大小的块之间的距离量度。用于此目的的适宜量度为标准相关系数。还需要将块的尺寸设定为原始CDP所分割的大小典型地可使用尺寸为8×8或16×16的块,但通常可使用大小为N×M的块。如早先所述的,块可以是重叠的,在这样的情况下,需要对连续块之间的重叠量进行规定。另一个要设定的参数是搜索范围或搜索区域从匹配位置开始,所述算法应该为一个匹配块搜索多远?这是用参数n设定的,其中对于从原始CDP的位置(x,y)开始的块来说,具有位置(x+/-i,y+/-i),0<i<n的所有块都被测试。
还能够在进行局部再同步之前对数字和记录CDP进行缩放这允许更精细的粒度匹配。例如,通过将两个CDP放大2倍,我们能够恢复半个像素的偏移。并且最终,可对再同步的CDP迭代应用所述同步算法直到不能发现进一步的改进。
一旦执行再同步,则再同步记录的CDP和原始CDP之间的相似性/距离的任意量度都能被执行。一个简单的相关性或局部频率分析可被执行,或许利用基于训练集的参数。然而,这些典型地产生整个CDP上的某些量的平均值的量度对于可在某些应用中发生的扫描的CDP的某些局部损坏并不总是稳健的。例如,在某些情况下,CDP的一个区域可能印刷得很差,或者可能已经被刮擦、写入或水所损坏。在其它的情况下,扫描设备可能已经在扫描的CDP中插入了失真;那个问题典型地发生在文档未正确插入时的馈通设备上。为了使CDP对这些种类的失真更加稳健,可使用更加稳健的相似性量度一个这种量度是中值局部相关系数,其中为CDP的每个块计算一个相关系数,并计算所有局部相关系数的中值。此处,计算中值而不是平均值使得检测器对于局部变更更加稳健。为了处理CDP中的更大数量的毁坏区域,还可能只计算20%最佳局部相关系数的平均值,这些部分可以被假定为未毁坏的。在一种实现方式中,该计算过程是这种分别施加给每个频率信道和可选择地施加给不同彩色信道的“偏置的”平均值。当然,前述同步技术不仅仅可以应用于CDP,而且还可以应用于需要与原始可视鉴别图案同步的任何记录的可视鉴别图案。
CDP的应用可在有益于区别原始文档和非原始文档的任何情形下使用CDP。可通过以足够高的逼真度印刷CDP的任何过程来印刷CDP以便使CDP的数字记录可与CDP的原始数字表示进行比较。所述图案可特别适用于检测通过特殊影印、扫描或印刷技术产生的非原始文档。CDP的特定应用包括1.在包装上印刷CDP用于品牌保护2.在支票和货币上印刷CDP用于复制保护3.在有价值文档包括证书、合同等上印刷CDP用于验证该文档是原版还是拷贝4.在全息图上印刷CDP5.在贵重物品例如航空/汽车部件或药物的标签上印刷CDP更一般地,CDP可用在期望能够确定已经对文档应用了什么样的处理的任何应用中。当然所述图案可根据需要改变以最佳地检测感兴趣的处理。
CDP也可用于下列应用1.按基准检查印刷质量当读取CDP时,CDP的数字记录的质量指标被计算。该质量指标将根据印刷质量、纸张/衬底质量或数字化/扫描(设备)质量而变化。于是所述CDP质量指标就可用于量化某个印刷过程、某个衬底或某个扫描仪的质量。
2.质量控制在同样的脉络下,CDP读取器可用在用于自动质量控制的印刷品处理中。遍及人工检查的CDP的优点在于它给出了自动的、客观的和精确的质量量度。
3.追踪CDP具有与印刷机、纸张、照相机以及使用情况和磨损程度相关的结构和特性。原则上,对CDP的分析可确定文档的一般“历史”它是如何印刷的和它已经受到了什么样的“磨损和破损”。
使用可视鉴别图案来检测文档中的变更图10某些种类的文档通常在它们印刷之后被“修改”。这种情况的一个普通的例子是印有空白字段的支票,在对支票进行书写的时候才填写所述空白字段。属于所有这些种类的文档的一个问题是在填充字段中所放置的内容可在以后进行更改。因此,即使该支票本身是真实的,但在空白字段中写入的内容的语义值可发生变化。例如,支票的收款人可以一种出纳员难于注意的方式修改呈送给他的支票上的数额(例如从“一百”到“九百”)。
这种问题难于解决,因为伪造者实际上并没有产生假冒文档;相反,他们改变了真实文档的语义值。该问题通过这样的事实变得更难,即填写的真实文档已经包含了合法的修改。问题是,如何从以后的非法修改中区别出对文档的合法修改。
对该问题的解决方案之一是法院检查。如果出纳员怀疑支票已经被修改,则他可以将支票带给另外的权威人士做进一步的检查。然而该任务是人工的、昂贵的和费时的,并且显然不可能将其系统地应用到每个文档或支票。通常,伪造者通过首先擦除书写的一部分来伪造支票。例如,为了将数额从“两百”修改为“九百”,他将可能擦除“两”并将它修改为“九”。为了擦除笔迹,他将通常使用化学品。另一种可能性是从支票上刮掉原始数额,重新绘制背景,然后写上新的数额。
可视鉴别图案可用于检测这些非法修改。一般的构思是在我们想要检测非法修改的文档的每个区域中印刷一个VAP。然后通过在VAP上写入来产生合法修改。以后可使用精确的、唯一的和不能拷贝的VAP结构来检测修改并确定该修改是否为可接受的。所述构思在于在VAP上写入和擦除在VAP上写入的某些内容都将产生可检测的VAP修改。正如刮去VAP的写入内容或对VAP施加化学擦除剂一样,在VAP上写入破坏了图案。以这种方式使用的VAP在下文中被称作修改检测图案,或MDP。
如何使用MDP检测非法修改可总结如下·在需要受保护防止未授权修改的文档的每个区域中插入MDP。
·当检验文档的真实性时,首先在文档中记录每个MDP的图像。
·对于每个记录的MDP,将记录的MDP与MDP的原始数字表示进行比较以检测MDP已经损坏的区域。
可以以多种方式使用记录的MDP与MDP的原始数字表示的比较结果·向决策者显示带有加亮的损坏区域的比较结果。这将显示包含写入和擦除的区域。
·向决策者显示带有加亮的非写入损坏区域的比较结果。
·将损坏区域的尺寸与已经进行写入的区域的尺寸进行比较,如果该差别在一个阈值以上,则视为该字段已经被修改。
图10表示如何使用MDP来检测修改。在1001处示出了在一个文档的数额字段中所使用的MDP 1002。如前,MDP 1002被黑色边界106包围。如1003处所示,数额250已经被写入到MDP 1002中。在1005可以看到伪造者是如何通过擦除2的“尾巴”并添加一个圈使它变成数字9来将数额$250修改成数额$950的。为了掩饰擦除痕迹,伪造者模仿了MDP的图案。所述模仿在1005中仍然是可见的,但甚至如所示的,它足够好以通过粗心的出纳员,并且技术娴熟的伪造者能够容易地使模仿变得更好。
对于伪造者的问题是所述擦除已经破坏了MDP。通过扫描MDP并对它进行局部分析,能够以高精度检测出MDP的哪一部分已经从原版发生了改变。通过找出MDP中既不包含文本也不包含原始图案的区域就能够检测到擦除痕迹。这在1009处示出。文本区域是容易找出的,因为它们典型地是颜色一致的并且比MDP暗。于是找出擦除区域需要做的所有事情是将记录的不包含文本的MDP的区域与MDP的原始数字表示进行比较。擦除的区域显示为记录的MDP的不与原始数字表示相匹配的部分,如在1011处所示。在一个优选实施例中,这种不匹配部分呈现为红色。
使用MDP来检测文档变更的算法的更多细节·产生MDP可以以产生VAP的任何方式来产生MDP,但需要增加像素值以使MDP更亮(否则,就不能容易地从MDP区分出在MDP上写入的文本)。
·使用对准标记(例如黑色边界或角标记)从文档提取记录的MDP。
·检测文本区域对记录的MDP应用低通滤波器,具有在阈值以下的值的像素被认为是文本和合法修改的一部分。
·检测MDP的修改在应用局部再同步之后,为MDP的每个块计算一个相关系数。如1009中所示,能够看到文本区域和非法修改区域被变更了。
·通过从图像1001中排除合法修改(在1003处),可应用多个算法来检测非法修改。一个可能的方式为首先将各区域分类为修改的或非修改的(通过取局部相关的阈值),然后应用噪声处理算法或低通滤波器,其去除各个或非有效的修改区域。也可应用区域检测算法来找出有效的修改区域。结果被显示在1009中以红色显示非允许的修改,而以绿色显示(对文本)允许的修改区域。
·根据非允许的修改的数量,可对MDP所属的文档的真实性任意地做出判定。
VAP的实现细节文档中VAP的形式对于使用VAP来检测模拟形态中的变更所需要的是在模拟形态中应具有这样一个区域,其具有用于此目的的图案和能够与从模拟形态记录的图案进行比较的图案的原始数字表示。因此在一些情况下可使用模拟形态中预先存在的图案来用于该技术。可是,更一般的,VAP将被包括作为新的模拟形态的设计部分。当然不需要在模拟形态中隐藏VAP,并且确实在一些情况下,它的出现被通告以重新确保用户能够检测到非法的模拟形态。另一方面,VAP可具有任何形状,因此能够容易地将其嵌入到模拟形态的其它特征的内部。图11显示两个例子。在1101处示出了一个条形码,其条纹组成VAP。在1103处为包含VAP的标识。当然在一个文档中可具有一个以上的VAP,以及一个以上的VAP可共享一个位置。这可以通过给每个图案一个加权值以便所有图案的加权加起来为1来实现,例如Final_pattern=a*pattern1+(1-a)*pattern2,其中0<a<1。
多个图案的一个应用是合同鉴别,其中当在签订合同时或相反中止谈判中的一个阶段时每方都加入其自己的图案。
还可能在文档的不同位置处插入典型地用不同密钥产生的多个CDP,以允许多方能够检验他们自己的CDP而不能检验其它方的CDP(并且因此能够复制它们)。甚至可能使用不同的密钥(每个密钥可控制CDP的不同空间或频率区域)来产生一个CDP,以允许不同方来检验所述CDP。这样,如果一方透露了他的密钥,则该密钥不足以产生CDP的精确复制(需要所有密钥),因而不会危及安全性。这类似于“共享秘密”的概念。
VAP的对准所述优选实施例利用黑色框106作为对VAP的对准。然而,许多其它对准技术也是可能的。例如,我们可利用可视图案,例如已经在包装上显示的帧、条形码等等来定位VAP,以及OCR。也可以使用UV标记或在2002年11月4日提交的J.Zhao等人的母案专利申请USSN10/287,206“Apparatus and methods for improving detection ofwatermarks in content that has undergone a lossytransformation”中论述的任何技术。此外,也可对记录的VAP进行傅立叶-梅林变换并使它与VAP的原始数字表示相匹配。
对于某些应用,难于知道VAP的数字记录的取向是否是正确的,或者在读取之前是否应该将其颠倒过来(180度旋转)。为了避免不得不对VAP进行一次分析,然后如果该分析是不成功的就在相反的垂直方向旋转它并再次对它进行分析,能够设计一个对称的VAP下部是上部的镜像。那么就可不受其垂直取向的约束对VAP进行分析。
VAP图案的性质所述图案可以是灰度级图案,或者它可以是彩色图案。在后者的情况下,可利用不同的颜色信道,例如RGB和YUV。也可以在各种频域中产生所述图案,例如空间、小波、DFT或DCT域。
产生VAPVAP的噪声特性,即随机性质使得造假者和伪造者难于对付它。能够产生随机或伪随机图案的任何技术都将确实产生VAP。在所述优选实施例中,产生过程是通过向产生随机数序列的伪随机数产生器提供一个值来进行的,所述随机数序列对于所述值是唯一的。该值因此用作可用于产生图案的新拷贝的密钥。在不同的实施例中可使用不同的伪随机数产生器,用于产生的随机数的随机频率值可采取不同的概率分布。所述密钥也可用于确定VAP中的位置,根据该位置来执行分析。如将在下面使用VAP来承载其它信息的讨论中所说明的,所述密钥可包括此种其它信息。在一些应用中,用于设计图案的密钥不能披露给其它方。在那样的情况下,可使用任何分配密钥的有用方式,例如不对称密钥或公共-私有密钥对。
通过将标识添加到图案或反之亦然,能够将图案与标识相结合。标识可以是任何已有的图像或文档,包括用于其它目的的图像(2-D条形码、加水印的图像等)。还可能以这样一种方式对图案或标识应用任何诸如滤波之类的处理,即标识最低限度地干扰记录的VAP与VAP的原始数字表示之间的比较。
印刷VAP由VAP提供的鉴别质量完全取决于在文档上印刷VAP的逼真度。如果在印刷过程结束处添加“质量控制”步骤以保证VAP的逼真度,则可减少鉴别错误1.每个印刷的VAP将被传递给自动验证过程以校验鉴别图案是否具有将它识别为原版所需的最小质量。
2.如果所述质量低于最小质量,则将发出警报并且包含鉴别图案的文档/包装将被重印。
3.这种验证也可用作用于印刷质量或由印刷机引入的错误的“质量控制”。
VAP的产生可适用于印刷技术。例如,如果使用了仅印刷二元点的激光印刷机,那么二元点VAP就能够被产生以更好地使用印刷机的潜能。此外,也可以在印刷机的颜色空间中更恰当地产生和印刷VAP。如果某一印刷机使用了特定的油墨(例如CMYK),则能够在那个域中比在RGB域中更加有效地产生VAP。如果利用能够只产生二元点的激光雕刻机将VAP雕刻在金属上,则它将更有意义来产生二元VAP。
使用VAP来承载其它信息在下面讨论了三种使用VAP来承载其它信息的方法保留VAP的某些区域来保存信息,使用所述其它信息来产生用于产生原始VAP的密钥,以及将水印添加到VAP中。添加水印的缺点是它降低了检测非原始模拟形态或VAP中的修改的VAP能力。
保留VAP中的区域来保存信息VAP的某些区域(例如8×8块)可被保留来保存信息。在那些区域中,VAP的结构/特性实际上并不是用于验证它的真实性,而是用于存储一些信息位。使用密钥可对这些区域进行伪随机选择,使得不具有该密钥的实体不能确定VAP中的区域是否实际上用于存储信息或确定VAP的真实性。在用于保存信息的一个区域中,VAP的某一结构/特征可对应于信息的某一位值(“0”或“1”)。由于是由密钥确定的,所以这个取决于位的结构/特征当然能够变化。注意保留的区域和它们包含的信息是所产生的VAP的一部分。因此它们不会降低检测不真实文档的VAP能力。保留区域的一个应用是存储用于产生VAP的密钥。
使用所述信息来产生VAP的密钥本讨论使用了下列术语使用密钥P来产生和检测VAP;如上文关于保留区域所述的或下文关于水印所述的,我们可能需要使用不同的密钥S在图案中嵌入消息;使用密钥S在VAP中嵌入消息M;最终附加信息I可在文档上(序列号、条形码等)被可见地印刷,或在图案内或其外部被不可见地UV编码,或者从外部来源获取。
固定的图案密钥在一个实施例中,VAP产生密钥为固定的P。这典型地是用于标准胶印技术的情况,其中所述的印刷技术并不具有动态地改变每个包装/产品/文档的图案的能力。该密钥可如上所述的保持为秘密的,或者可将它并入到其它安全特征中。例如,可用UV油墨将它印刷在文档上。固定的图案密钥通常可用于品牌保护或文档保护。
可变的图案密钥在另一实施例中,VAP的密钥取决于保密密钥S和某些其它信息I。该其它信息I可在文档上(在图案内或在其外部)显示或从外部来源获得。来自文档的信息可例如是序列号、文本、条形码等。来自外部来源的信息可例如是与VAP相关联的并对于正在检测包含VAP的文档是否是真实的人来说是已知的值。所述图案密钥可以是为保密密钥和信息I的参数的任何任意函数P=f(S,I)。一个简单的函数是对两个参数进行连接或求和,但许多其它函数也是可能的,例如两个参数的组合的散列值等。在检测时,使用适当的技术(条形码读取器、OCR等)来提取印刷的信息I。然后图案密钥被产生为P=f(S,I),并对图案进行分析。典型的应用包括具有数字印刷的品牌保护。
VAP中的水印使用任何水印技术在VAP中嵌入可见或不可见的水印是可能的。水印可用于多个目的。它可包含任何信息,包括如上所述的仅仅一位或图案的辅助对准。可使用用于产生VAP的密钥或使用另外的密钥来检测水印,使得它的读取被限制到另外的用户或用户群体。下面所述的第三种可能性是使用由水印承载的消息来获得用于产生VAP的密钥。
当数字水印被嵌入到VAP中时,VAP将被略微地修改。结果,当相同的VAP被用于真实性验证时,用于所述目的的VAP的可靠性可能被降低。作为替换方案,数字水印可嵌入到VAP中如上所述的被保留以存储信息的区域中。
水印和密钥在另一个实施例中,图案产生密钥P是从作为数字水印嵌入到拷贝检测图案中的保密密钥S和信息M而获得的。在该情况下,M替代了如上所述的用于产生可变图案密钥的信息I。在创建时,图案密钥P可以是保密密钥S和消息M的任何函数g(M,S)。以通常的方式产生所述图案,然后将水印插入到所述图案中,其中水印使用保密密钥S作为参数对消息M进行编码。在检测时,首先必须用保密密钥S从所述图案中读取水印消息M。一旦M是已知的,图案密钥P=g(M,S)就被获得,并且对该图案进行分析。
在该应用框架内,将不需要辅助技术来提取印刷在包装上的更多信息。然而在此处所述的原理范围内也可能以多种方式使用印刷在包装上的信息I。例如,保密密钥S可与信息I结合使用以产生水印密钥W,即h(S,I)=W,其用于在所述图案中嵌入消息。那么所述图案密钥是以如前所述相同的方式产生的,即P=f(M,W)=f(M,h(S,I))。通常,VAP可与水印技术相结合,并且其它读取技术(例如OCR或条形码读取器)将产生不同等级的验证。
比较VAP记录的VAP如何与VAP的原始数字表示进行比较将取决于VAP是如何产生的以及其目的是什么。一些通常应用的变化包括独立地评价某些区域,以便具有关于已经对文档应用的过程的更多线索或者用于安全特征。如上所述,VAP可包含一个以上的鉴别图案,并且不同的图案可被不同的群组所分析。
在对VAP进行有意义的比较之前,比较程序可能必须用从原始文档记录的VAP进行“训练”,如上面对于CDP所述的。所述训练产生了用于确定从正在检查其真实性的文档记录的VAP是否是真实的阈值。当然阈值的含义将取决于正在使用VAP进行检测的变更的类型。无论何时原始文档进行印刷的方式以影响VAP比较的方式发生变化都需要重新训练。通过在一张纸上印刷多个VAP、扫描该张纸并对训练软件提供扫描能够自动进行训练。
在另一实施例中,与把测试VAP的数字记录与对应的数字表示进行比较来测量其质量指标相反,可以将所述数字记录与另一VAP(典型地为被扫描的原始VAP)的数字记录进行比较。
执行VAP分析的环境进行VAP分析所需要的是能够从文档记录VAP以产生记录的VAP的设备、VAP的原始数字表示的拷贝以及能够将记录的VAP与VAP的原始数字表示进行比较的处理器。该记录器和处理器彼此可以是本地的或者是通过网络连接的。所述网络既可以是局域网(LAN)也可以是广域网(WAN)。本地环境的一个例子是为具有扫描仪的PC的处理器、分析代码的拷贝和VAP的原始数字表示的拷贝。VAP的原始数字表示的拷贝既可以是下载的也可以是使用密钥本地产生的。分析的结果被输出给PC的显示设备。
在网络环境中,能够以任何方式通过网络分配扫描、分析和VAP的原始数字表示。保持VAP的原始数字表示的安全性和简化在本地级所需装备的分配是在连接到WAN上的设备中进行扫描。当文档上的VAP已经被扫描以产生记录的VAP时,记录的VAP被发送给WAN中的位置,在该位置处分析代码和VAP的原始数字表示都是可用的。可根据需要存储或再生所述原始数字表示。分析是在该位置进行的,并且通过WAN只将分析的结果返回给用于扫描的设备。通常在网络环境中,在记录的VAP中承载的或和它一起发送的信息可被用于检索分析中使用的信息。例如,文档可包括序列号,并且可将序列号和记录的VAP一起发送到进行所述分析的位置。如果在VAP和序列号之间存在关联,则可将该序列号应用到在所述位置或网络中的其它地方的数据库以检索用于应该与记录的VAP进行比较的VAP的原始数字表示的密钥或VAP本身的原始数字表示的拷贝。如上所述,序列号可在包含VAP的条形码中作为VAP中的可视水印而被指定,可以是来自文档的OCR’d,或者甚至可以是通过进行扫描的人输入的。
也可使用摄像机(网络摄像机、摄像放像机等)来捕获VAP的图像。在这种情况下,VAP检测器不但接收一个图像作为输入,而且还接收一个持续的图像流。由多个图像提供的附加信息可能在分析中非常有用。然而,由于分析一幅图像所需的时间比两幅连续图像之间的时间大得多,所以图像流的使用可被最佳化。例如,呈现为具有用于正确读取的性质(好的清晰度,整个包含在画面中的VAP)的图像可从所述流中选出并用于分析。
VAP与其它安全技术的结合VAP可与其它目的在于产生更加安全的模拟形态的技术相结合。例如,VAP可与例如数字水印的信息隐藏技术、例如1-D或2-D条形码的机器可读信息、全息图、或能够应用于模拟形态的任何其它技术结合使用。所述各技术之间的关系可以是各种各样的作为一个例子,2-D条形码可包含独立的信息、或图案分析所需的保密密钥,或相反地,VAP可保存解码2-D条形码所需的密钥或所述2-D条形码可包含VAP。
结论前述的具体实施方式
已经向相关技术领域的技术人员公开了发明人的用于确定一个对象的模拟形态是原始模拟形态还是非原始模拟形态的技术、他们的使用VAP来对模拟形态执行真实性检验的技术、以及他们的使用VAP来隐藏模拟形态中的消息的技术,并且进一步向相关技术领域的技术人员公开了发明人目前所知的用于实践所述技术的最佳模式。相关技术领域的技术人员很显然将能够立即明白除了此处所公开的实施例之外的申请人的技术的许多实施例也是可行的。例如,VAP的尺寸、形状和图案将通过VAP正在使用的模拟形态的性质和通过VAP的目的来确定。VAP如何承载附加信息和该信息是什么也将通过模拟形态的性质和通过VAP的目的来确定。通常,VAP可用于在原始模拟形态被产生之后产生的变化将被检测到的任何情形中。虽然本申请公开了印刷在文档上的VAP,但这些印刷的VAP的类似物可被放置在其它介质中的模拟形态上。
出于所有上述的原因,所述具体实施方式
在所有方面都将被看作是示例性的而非限制性的,并且此处所公开的本发明的范围将不是由所述具体实施方式
确定的,而是如由专利法允许的全部范围所解释的权利要求所限定的。
权利要求
1.一种确定一个对象的模拟形态是否是原始模拟形态的方法,该方法包括步骤将从所述模拟形态产生的数字记录的一部分与该部分的原始数字表示进行比较,以确定所述记录的部分和该部分的原始数字表示之间的相异程度;以及使用所述相异程度来确定所述模拟形态是否为原始模拟形态。
2.权利要求1所述的方法,其中所述方法在网络中的一个节点处被实施,并且该方法进一步包括步骤从所述网络的另一个节点接收所述数字记录。
3.权利要求1所述的方法,其中所述方法在网络中的一个节点处被实施,并且该方法进一步包括步骤向另一个节点返回指示所述模拟形态是否已经被确定为原始模拟形态的指示。
4.权利要求1所述的方法,其中该方法在一个处理器中被实施,所述处理器上连接有数字记录设备和输出设备;以及所述方法进一步包括步骤根据从所述数字记录设备接收的输入产生所述数字记录;以及将指示所述模拟形态是否已经被确定为原始模拟形态的指示提供给所述输出设备。
5.权利要求1所述的方法,其中在确定相异程度的步骤中,所确定的是所述模拟形态部分的数字记录和该部分的原始数字表示中的特征的相异性,该相异性是由产生非原始模拟形态中所涉及的操作引起的。
6.权利要求1所述的方法,其中所述部分的原始数字表示具有有噪声图案。
7.权利要求6所述的方法,其中所述有噪声图案是使用密钥产生的,并且所述方法进一步包括步骤使用所述密钥来产生所述原始数字表示。
8.权利要求6所述的方法,其中所述有噪声图案除了允许确定所述模拟形态是否为原始的之外,还在所述模拟形态中具有一个功能。
9.权利要求8所述的方法,其中从所述有噪声图案可获得一个消息。
10.权利要求9所述的方法,其中所述方法进一步包括步骤使用所述消息导出一个密钥;以及使用所述密钥来产生所述原始数字表示。
11.权利要求9所述的方法,其中所述消息在为此保留的有噪声图案的部分中。
12.权利要求8所述的方法,其中至少部分的有噪声图案在背景图像中。
13.权利要求8所述的方法,其中至少部分的有噪声图案在条形码中。
14.一种对一个模拟形态执行真实性检测的方法,该方法包括步骤将所述模拟形态中的有噪声图案的数字记录与所述有噪声图案的原始数字表示进行比较;以及使用所述比较结果来执行所述真实性检测。
15.权利要求14所述的方法,其中所述比较的结果指出所述模拟形态中已经被破坏的有噪声图案的一部分。
16.权利要求14所述的方法,其中所述比较的结果指出来自于所述原始模拟形态的有噪声图案的一部分。
17.权利要求14所述的方法,其中所述方法包括步骤产生所述有噪声图案的原始数字表示。
18.权利要求14所述的方法,其中所述有噪声图案进一步包含一个消息。
19.权利要求14所述的方法,其中所述比较的结果指出已经被写入文本所重写的有噪声图案的一部分。
20.一种在一个模拟形态中隐藏消息的方法,该方法包括步骤产生一个其中已经隐藏所述消息的可视有噪声图案的数字表示;以及在所述模拟形态中包括所述有噪声图案。
全文摘要
用于确定例如包装或文档的模拟形态(117)的真实性的技术。所述技术之一确定所述模拟形态是从数字表示(903)直接产生的,还是通过对模拟形态进行影印或扫描产生的。所述技术通过将所述模拟形态的一部分的原始数字表示与来自于所述模拟形态的该部分的数字记录(203)进行比较(911)、并测量受到影印或扫描操作影响的特征中的差别来作出所述确定。所述原始数字表示(105)和所述模拟形态可具有一个“有噪声”,即随机或伪随机图案。这种有噪声图案可进一步用于其它的鉴别目的,例如确定具有所述有噪声图案的所述模拟形态的部分是否已经变更,以及用于承载隐藏消息。所述有噪声图案可承载标识或者可以是条形码的一部分或全部。
文档编号G07D7/20GK1669046SQ03816744
公开日2005年9月14日 申请日期2003年5月14日 优先权日2002年5月14日
发明者赵健, J·皮卡德, N·托维特 申请人:媒体安全技术责任有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1