用于媒体鉴别的隐蔽且鲁棒的标记的制作方法

文档序号：6568805阅读：133来源：国知局

专利名称：用于媒体鉴别的隐蔽且鲁棒的标记的制作方法
技术领域：
本发明一般涉及数字媒体，并且具体地涉及嵌入承载媒体(carrier media)中的安全、察觉不到且鲁棒的媒体标记，其可被呈现为可识别(recognizable)的图像，从而鉴别(identify)承栽媒体。
背景技术：
数字媒体的数字表示、存储、分发和复制已经非常普遍，这是因为其成本低、易于使用并且保证媒体的质量。然而，这些优点却使得诸如在因特网上未经授权地分发数字图像和视频之类的非法分发和使用已取得版权的材料非常普遍。已经提出了多种不同的方法来防止数字媒体免于未经授权的使用。例如，针对使得能够安全通信和交付，数字加密技术是有效的。然而，如果以对人来讲是可视和可听的方式对加密的内容解密或呈现，那么该内容可被再录制，并且可获得未经保护的拷贝。通过在媒体中嵌入接收方信息来标记媒体可有助于鉴别以未经授权的方式接收媒体并且使用该内容的个体。此外，在媒体中嵌入的所有权信息可指示拷贝限制以及可阐明该媒体的所有权。一种标记媒体的方式是通过对数字媒体文件格式添加注解来实现的，其可从未修改的文件中读出并且在播放期间被忽略。然而，如果将该文件再记录或将其转换为另一种格式，那么可能会丢失该信为了在视频媒体中实现鲁棒和永久的标记，已经提出了在回放期间显示版权信息的可视和重叠的图像。重叠的图像针对修改具有鲁棒性并易于读出。然而，该方法可降低标记视频的品质，这是因为重叠的图像干扰了原始视频，其降低了收看体验的品质。此外，重叠的图像是明显的并且因此容易进行鉴别，以及可通过盖写或剪裁而去除。数字水印是另一种方法，其已经提出几种不同的变化方式。许多普通的数字水印方案包括通过在空间或时间的某些位置上引入机器可读操作而将数字比特序列嵌入数字媒体中。在读出期间，使用软件来解译这些操作并得到用来组装所嵌消息的数字比特序列。为了解译这些操作，需要在空间或时间上的操作的位置的知识。当该操作失真 (即，例如，偏位或变弱)时，该读出(也被称作检测)经常是困难或不可能的。在诸如剪裁、旋转、转换到另一种文件格式以及帧速率的修改之类的简单媒体处理期间可能出现失真。此外，该操作的有意偏位可由攻击者来实施，从而去除标记，以及可通过诸如移位、旋转和回放速度变化之类的察觉不到、轻微且组合的失真来达到。公共可用的工具以自动方式应用一定的这些操作，其也被称作攻击。当前的数字水印算法对识别(recognize)失真内容的偏位(也,皮称作配准(registration)的处理)经常不够有效。所以，有意的偏位可导致数字水印不可读。机器可读出操作也易受到另外的安全风险的攻击，将在下面进行说明。机器可读出操作的检测通常需要已执行操作的知识。所以，试图绕过水印的人通过观察要读出或被嵌入的水印可确定操作的位置和含义。通过分析、或反向工程、嵌入或检测处理可执行该观察。随后，有技能的攻击者可去除或转化该操作，即，有效地去除该水印。除了去除水印，上述的反向工程方法还使得能够修改嵌入水印中的信息。即使利用密钥来加密操作的位置，这也是成立的。由于对于嵌入和检测通常使用相同的密钥，所以限制了通过使用密钥提供的保护。攻击者可分析或反向工程研究嵌入或检测应用并获得对所述位置的接入，即使其被加密。此外，通过分析该检测或嵌入应用可观察密钥。除了配准和安全，针对有损压缩和过滤的鲁棒性是多媒体内容的察觉不到标记的重要部分。在形成水印期间，通过操作数字媒体的区域，通常将消息嵌入数字媒体中，该区域适于隐藏机器可读的信息并且使人对标记内容没有明显察觉。在数字媒体中这样区域的示例包括含有细节(例如，高频)的区域。然而，可改变或去除这些区域，同时内容维持在可接受的品质。例如，如MPEG2和H.264之类的通常的有损压缩方案去除了这种感知不明显的信息，从而减少了数字媒体文件的大小，并且因此去除了存储在那儿的水印信息。所以，利用这种有损压缩方案的媒体压缩可使一些或全部水印信息去除。数字静止图像已经是早期水印研究的焦点。视频水印方法通常基于对每一视频帧应用静止图像水印。原因在于对每一视频帧应用静止图像水印是显而易见的并且易于实现。然而，该方法没有有效地使用时域以来收集嵌入的信息。水印检测通常仅在可恢复来自各个帧的某些信息的情况下是成功的。如果由于配准不成功或视频帧的相关区域的损坏导致在任何帧中不能读出水印，那么这种方法经常失败。此外，如果使帧水印化为各个图像并且水印在帧之间变化，那么因为可对在一个视频内的类似帧求平均从而消弱水印，所以水印易于受攻击的影响。如果所述帧中的每一帧包含相同的水印，那么该帧可被用来分析在每帧中的水印的结构，从而理解和随后去除该水印。此外，数字水印的处理通常包括初始图像和要嵌入的消息的复杂转换。这样复杂变换的示例是DCT、快速傅立叶或小波变换。执行这些变换所需要的计算是时间密集处理，当实时地(例如，在回放或下栽期间)嵌入数字水印时，这个可能是明显的限制。此外，水印方法通常包括清楚限定的修改、允许变化的灵活性较小，从而采用不同的压缩格式、安全或性能要求。发明内容本发明通常涉及数字和模拟媒体，并且更具体地涉及重复地将信息嵌入承载媒体的系统和处理，该信息可被揭示(uncover)以鉴别该承栽媒体。本发明的一个实施例包括以以媒体的形式呈现所述信息；从所述承载媒体中选择多个媒体組分(portion of media);将被呈现的媒体的至少一部分与该承载媒体的所选择的媒体组分中的每个媒体组分组合以形成修改后的媒体组分，其中对所述修改后的媒体组分的所述修改对于人类观察者是不可见的；以及使用所述修改后的媒体组分来创建修改后的承载媒体。在进一步的实施例中，所述承栽媒体包括视频序列；承载媒体的每个所述媒体组分是单个视频帧；并且所述被呈现的媒体是图像。另一实施例还包括改变表示被呈现的媒体的图像的几何形状。在又进一步的实施例中，将所述被呈现的媒体的部分与所述承载媒体的每个所述媒体组分组合包括根据感知模型来修改所述被呈现的媒体。在另一实施例中，伪随机地选择被呈现的媒体的、与所述承载媒体的媒体组分组合的部分。在还有的进一步的实施例中，所述承载媒体包括音频序列，所述承载媒体的每个所述媒体组分是一段音频，并且所述被呈现的媒体是音频序列。在另一实施例中，承载媒体包括视频，并且被呈现的媒体包括通过其可投影或录制视频的透镜。在进一步的实施例中，所述信息包括与媒体有关的元数据。在另一实施例中，所述信息标识(identify)视频回放的时间和位置。在进一步的实施例中，所述信息标识版权的拥有者或媒体的接收方。在另一附加的实施例中，所述信息包括对数据库的引用。进一步的实施例包括从所述承载媒体中选择多个媒体組分；选择每个所述媒体组分的至少一部分；强调来自所述媒体组分的所述部分；以及組合来自所述媒体组分的所迷部分。在另一实施例中，强调所述媒体组分的部分包括对每个媒体组分应用高通滤波。在进一步的实施例中，强调所述媒体组分的部分包括从含有所述体。在另一实施例中，所述承载媒体包括视频序列；所述嵌入媒体包括数字图像；每个媒体组分是视频帧，并且被强调的每个视频帧的部分包括一组像素。在进一步的实施例中，将所述媒体组分的每个部分组合在一起包括对所述媒体组分的每个部分求平均。在另一附加实施例中，在组合所述媒体组分的所述部分之后，通过一设备来识别所述嵌入媒体。在进一步的实施例中，所述承载媒体包括音频序列；所述嵌入媒体包括音频序列；音频的每个组分包括音频序列的组分；并且所述音频序列的每个组分的所述部分包括一组音频取样。

在附图中，在全部不同的视图中，类似的附图标记一般涉及相同的部件。此外，在图解说明本发明的原理时，附图没有必要按比例画出，通常代替地给予强调。图1是示出根据本发明实施例的媒体分发系统的示意图。图2是示出根据本发明实施例的配置来在^L频序列和/或音频序列中嵌入媒体标记的用户电子设备的示意图。图3是示出根据本发明实施例的将媒体标记嵌入媒体中的处理流程图。图4是示出根据本发明实施例的生成媒体标记的处理流程图，该媒体标记可被嵌入视频序列或图像组中。图5是示出根据本发明实施例的对用于媒体标记的信息进行编码的处理流程图。图6是示出根据本发明另一实施例的对用于媒体标记的信息进行编码的处理流程图。图7是示出根据本发明实施例的呈现媒体标记的处理流程图。图8是根据本发明实施例应用的文本信息的媒体标记的示例，其被呈现成具有几何变化的图像。图9是示出根据本发明实施例的用于选择嵌入媒体标记的预定的媒体组分的处理流程图。图10是示出根据本发明实施例的用于选择要嵌入媒体标记的媒体组分的处理流程图。图ll是示出根据本发明实施例的用于组合媒体标记和媒体组分的处理流程图。图12是示出根据本发明实施例的用于利用感知模型来修改媒体组分以包括来自媒体标记的信息的处理流程图。图13是嵌入处理的图解说明示例，其中包括具有文本"ABC 12 " 的标识图形的标记被可感知地整形并与显示地球的视频帧組合。图13A是根据本发明另一实施例的在模拟视频的投影或录制期间利用透镜的媒体标记应用的图解说明示例。图14是示出根据本发明实施例的揭示媒体标记的处理流程图。图15是根据本发明实施例的通过累计结果来揭示媒体标记的处理流程图。图16是根据本发明另一实施例的用于通过在几个视频帧中强调数据操作和组合结果来揭示媒体标记的揭示处理的图解说明示例。
具体实施方式
现在参考附图，示出了根据本发明实施例的嵌入和揭示媒体标记的系统和方法。在许多实施例中，媒体标记是以信息的形式存在，其被重复地嵌入媒体序列或媒体组中，并且嵌入的信息通常对于人类观察者来讲是察觉不到的。然而，构成媒体标记的信息是可恢复的，并且通常该信息被设计成一旦被恢复便为人可理解的。在多个实施例中，通过强调和组合来自媒体序列或媒体组中的所选择的媒体组分的信息来揭示媒体标记。在媒体标记被重复地嵌入媒体中的实施例中，组合来自多个媒体组分的信息相对于基础媒体信息增强了标记。通过重复地将标记嵌入媒体中，难以通过对媒体的操作去除媒体标记。此外，在媒体系列中嵌入媒体标记使得在诸如由重定格式或录制引起的品质下降后，媒体序列或媒体组能保持媒体标记。根据本发明实施例的嵌入和揭示媒体标记的处理是不对称的。嵌入和揭示处理是利用不同算法实现的不同处理。揭示媒体标记时所需要的或所获得的信息不足以从媒体中去除媒体标记。此外，嵌入和揭示处理通常由计算机来执行，但是实际的识别和解译通常由人来执行。在媒体序列是一系列视频帧的实施例中，媒体标记可采用可视信息的形式，其被重复地与来自视频序列的帧的图像信息组合。在多个实施例中，感知掩蔽(perceptual mask )被用来以减少人类观察者将察觉所呈现的视频帧中存在可视信息的可能性的方式来组合该可视信息和视频帧的图像信息。在其它实施例中，媒体标记是音频信息，其被周期地嵌入音频序列中，或者媒体标记是可视信息，其被嵌入图像组中类似的位置处。媒体标记可以是插入数字媒体中的数字信息或者利用模拟处理插入的数字信息。根据本发明实施例的媒体标记可被用来鉴别(标识)媒体的接收方以及跟踪特定媒体序列或媒体组的分发。此外，媒体标记可被用来将档案信息嵌入媒体中、执行拷贝控制、执行广播监视和/或分发保密通信。用于嵌入媒体标记的系统图l中示出了用于分发媒体的根据本发明的系统的实施例。系统 10包括多个服务器12，其通过网络14被连接到多个设备。在图解说明的实施例中，网络是有线电视网，而被连接到网络的设备之一是计算机16，其通过有线调制解调器17而连接到网络。连接到网络的另一设备是向电视机20提供输出的电视译码器18。服务器12存储可被提供给连接到网络的设备的媒体。在多个实施例中，在服务器和设备之间的媒体传递利用加密码来保护。通常压缩媒体以减少被要求来传送的数据量。从服务器接收的加密媒体通常被解密和解压缩以进行呈现(render),并且部分解密和解压缩处理包括将媒体标记嵌入被解密的和被解压缩的媒体中。在由诸如电视译码器 18的用户电子设备接收的媒体的情况下，经常在硬件中执行解密和嵌入处理。当可配置接收加密的媒体软件的设备(例如，计算机16)时，在硬件中执行或利用客户端软件执行解密、解压缩和/或在媒体中嵌入媒体标记。如果媒体被复制或被传递，那么一旦媒体标记被嵌入解密的和解压缩的媒体中，媒体标记将出现在媒体中。在多个实施例中，媒体标记对于接收和解密媒体的设备是唯一的。在多个实施例中，媒体标记包括涉及接收内容的日期和时间以及用于接收设备或用户的标识的信息。诸如日期、时间和标识的将被嵌入的信息可由服务器产生并且可使其随着媒体来交付，或者所述设备可以使用本地存储的信息，例如其序列号以及根据其内部时钟的日期和时间。在压缩加密的媒体的实施例中，在解压缩之前或之后，媒体标记可被嵌入媒体。在下面将进一步讨论用于嵌入媒体标记的技术。尽管图l所示的实施例包括有线电视网，但是本发明的其它实施例可包括其它使得能在连接到网络的服务器和设备之间进行通信的网络技术。此外，根据本发明实施例的可接收媒体和嵌入的媒体标记的设备不限于电视译码器和计算机。根据本发明实施例，任何多种连接和断开的用户电子设备和计算设备可嵌入媒体标记。图1中所示的实施例包括通过网络的媒体分发和在分发后媒体标记的嵌入。本发明的多个实施例包括在媒体分发之前将媒体标记嵌入媒体中。在多个实施例中，媒体标记通过服务器(即，在头端)被嵌入媒体中。当通过服务器嵌入媒体标记或者将被嵌入的信息由服务器来确定时，服务器可记录有关嵌入的媒体标记的信息。例如，服务器可存储有关请求者的账单信息的信息和/或有关接收设备以及关于传输的媒体和信息的通信协议的信息。在许多实施例中，在媒体的分发或处理中，或者同时或者在不同阶段地将多个媒体标记嵌入媒体中。可才艮据揭示的标记来跟踪添加单独标记的每一个分发或处理步骤。此术兼容，其中，在相同的媒体中媒体标记可与传统的水印技术共存而没有明显的干扰。所以，本发明的实施例可被用来在形成水印的媒体中嵌入媒体标记或者将水印施加到含有媒体标记的媒体中。图2示出了根据本发明实施例的可将媒体标记嵌入媒体中的用户电子设备的实施例。用户电子设备40包括连接到存储器46的处理器 44、 1/0控制器48和视频转换器50。 1/0控制器48被连接到网络接口设备52、输入接口设备54、附加存储器56和音频输出设备58。在图解说明的实施例中，网络接口设备52被连接到网络并且通过网络接收媒体。所接收的媒体由处理器来操作以进行呈现。如上所述，可由处理器执行的操作之一是将媒体标记嵌入媒体中。处理器可利用固件或软件配置的微处理器的形式而存在。或者，可将处理器实现为一部分数字信号处理电路或专用集成电路。在多个实施例中，将微处理器和其它电路进行组合以用来实现处理器。尽管在图2中示出了特定的结构，但是本发明的实施例可采用任何用户电子器件、嵌入设备和计算设备的形式。例如，本发明的实施例包括VHS磁带播放器、DVD播放器、视频投影仪、像机、数字视频摄像机、处理媒体数据的个人计算机、手持视频回放设备(包括蜂窝式电话和游戏机)以及可处理视频的个人信息管理器。嵌入媒体标记以上的讨论包括根据本发明实施例的可将媒体标记嵌入媒体中的系统的描述。图3中示出了根据本发明实施例的可被用来在媒体中嵌入媒体标记的处理。处理60包括产生媒体标记(62)并且然后选择其中将嵌入标记的媒体组分(64)。然后将该媒体标记与媒体组分进行组合以形成其中嵌入了标记的修改后的媒体组分(66)。然后对其中要嵌入标记的任何另外的媒体是否可获得做出判断(68)。如果存在另外的媒体，那么选择另一媒体组分并且将媒体标记与该媒体组分进行组合直到没有另外的媒体为止。一旦没有另外的媒体，就通过再组合该多个媒体组分来完成该处理(70)。在许多实施例中，由于当媒体组分被播放时媒体标记与媒体组分进行了组合，所以再组合不是必要的。在上述处理中，其中嵌入媒体标记的媒体可以是媒体序列或媒体组的部分。如以下将详细描述的，在媒体序列或媒体组中不需要媒体标记与每个媒体组分进行组合。当只将媒体标记与多个媒体组分中的一些进行组合时，然后将修改的多个媒体组分与未修改的多个媒体组分进行组合以创建其中嵌入媒体标记的媒体。以下的讨论更加详细地针对上述处理的多个方面。生成媒体标记如上所讨论的，根据本发明实施例的媒体标记通常采用以人可理解的形式表示的信息形式。例如，将被嵌入视频序列或图像组中的媒体标记可包括文字和/或图像。由特定的大小、形状、紋理、字体类型或符号的位置也可表示信息。要被嵌入音频序列的媒体标记可包括声音、音调或口语单词。在多个实施例中，媒体标记也可包括诸如条形码或OCR字体的机器可理解的信息。可包括在媒体标记中的信息其多样性方面几乎是无限的。在多个实施例中，媒体标记包括有关接收方、拥有者和/或传送或显示的时间和位置的信息。媒体标记也可包括作为大量信息的散列码和/或对其它信息(诸如数据库记录)的索引的信息。在多个实施例中，媒体标记包括关于分发或处理限制的信息，该处理限制表示允许的工作流、对媒体的修改、允许拷贝的量或允许的媒体文件拷贝的接收方。生成用于视频序列或图像组的媒体标记图4中示出了产生可被嵌入视频序列或图像组的媒体标记的处理。处理72包括确定要被嵌入的信息(74)、对该信息编码(76)和呈现编码的信息(78)。如上所讨论的可被嵌入媒体标记的信息实际上没有限制。该信息可以是人可理解的和/或机器可理解的。一旦已经确定要被嵌入的信息，就对该信息进行编码。可将该信息仅仅编码为然后被呈现的一系列字母数字符号。在其它实施例中，在呈现之前修改基本信息。在多个实施例中，可对信息进行压缩、用错误鉴别或纠错信息对其进行补偿和/或对其进行编码。该呈现处理包括利用编码的信息来生成媒体。在视频序列或图像组中将被嵌入的媒体标记的情况下，呈现编码的信息为图像。在音频序列中将被嵌入的媒体标记的情况下，将编码的信息转换为音频序列。对信息编码以呈现为媒体标记根据本发明实施例的对信息编码包括确定包含在媒体标记中的信息将被表示的方式。如上所讨论的，嵌入视频序列或图像组中的媒体标记可包括文字和/或图像，而嵌入音频序列中的媒体标记可包括声音、音调或口语单词。在多个实施例中，利用大的符号和/或诸如AHal之类的简单字体 (例如，大约视频帧的l/4高度)来表示信息。大的符号具有很少的细节并且因此大部分由较低频率分量组成。低频分量是非常鲁棒的并且在视频通过诸如压缩、再录制和滤波之类的各种处理而降级后，低频分量保留在视频内。可以这样的方式来进一步选择符号，该方式为该符号对于人们来讲较为熟悉以易于识别，诸如根据文字的符号，且当其被嵌入时最好为不易见到，诸如垂直和圆滑线而不是水平或垂直线，例如，或者其具有彼此之间的最大差，诸如垂直和水平条。当选择要表示嵌入信息的符号时的另一考虑是符号可被机器应用的效率，例如可有效地存储和应用的块(blocks)。在多个方式中，通过符号的位置来表示信息。将帧大小逻辑地划分为几个不同的区，并且通过使能或无效在区域中的符号来对信息进行编码。在多个实施例中，在特定位置中符号的存在或不存在被用来编码二进制信息。在几个实施例中，将同一类的信息存储在相同的位置，使得被平均以去除媒体标记的标记视频在每一类中维持共同的信息。以分等级的方式进一步构建信息以在相同的位置具有显著的值。例如，如果将包含不同时间码但包含相同邮政区号(zip code)的几部电影进行平均，那么邮政区号信息不会被平均处理弱化。如果来自不同区域的拷贝被平均，那么根据彼此接近的并且差异不大的邮政区号来维持第一数字位。在其它实施例中，从几个不相关的区域中选择标记的位置，使得 ;故求平均的标记浮见频可能包含几个可读的标记而不重叠。一组实施例对信息进行编码以在固定位置提供固定的符号，从而鉴别某部电影已被标记。如果试图通过对来自多个不同的媒体拷贝的帧进行组合来去除嵌入的媒体标记，那么可弱化不在所有媒体拷贝中出现的、在媒体标记中的信息。然而，可揭示包含在每一个拷贝的媒体标记中的共同信息(即，在多个固定位置中的多个固定符号)。除了信息的表现，编码处理可包括设计来压缩或保护在媒体标记内包含的信息的附加处理以及设计来纠正由随后的媒体处理引入信息的错误的处理。图5中示出了根据本发明实施例的包括压缩和嵌入纠错码的编码信息的处理。处理90包括提供(92)接着被压缩(94) 的信息，以及处理接着的压缩以生成纠错信息，该纠错信息被附加到压缩的信息(96)。用于纠错的附加信息增加了冗余，其可被用来纠正潜在的错读，并且恢复在识别揭示的媒体标记期间缺失的或不可识别的符号。当对信息编码以形成媒体标记时，可应用任何种类的处理。图6 中示出了根据本发明实施例的包括加密的用于对信息进行编码的另一处理。处理90，包括提供随后被压缩(94，)和被加密(96，)的信息。对包括在媒体标记中的信息加密使得在媒体中的信息能安全传送。在多个实施例中，包括(或以视频或音频格式的)加密信息的媒体标记可被用来发送媒体内的保密消息。因为根据以上的讨论显而易见，在呈现为媒体标记之前，任何不同的编码技术和处理可被用来编码信息。编码处理的特性通常取决于存储在媒体中的信息、该信息的随后使用和该信息的期望的降级以及与存储在标记中的信息相关的信息的可用性。呈现编码的信息以形成媒体标记一旦编码被期望处于媒体标记内的信息，通过呈现作为媒体的编码信息可创建根据本发明实施例的媒体标记。在用于嵌入视频序列或图像組中的媒体标记的情况下，通常将编码信息呈现为图像，而在用于嵌入音频序列中的媒体标记的情况下，通常将编码信息呈现为音频序列。在编码为符号的信息被嵌入视频序列或图像组中的实施例中，可将该符号呈现为图像，使得符号具有与背景不同的色彩和亮度信息。在多个实施例中，要形成媒体标记的图像的背景是中等灰度。在嵌入媒体标记后，具有中等灰度背景色彩的区域通常不会修改视频帧。在几个实施例中，当使暗的内容具有亮边界而在符号的轮廓处提供强的对比时，呈现符号。在许多实施例中，最亮和最暗的区域从中等灰度改变大约8%。对于8位灰度图像，像素值范围为0至255。中等灰度具有127的像素值，而最小和最大像素值分别是大约107和147。此外，利用较强的标记可强调用来识别字符的感知重要的区域，使得每一个字符线的端点较暗，从而实现更强的嵌入。更强的嵌入在所揭示的媒体标记中可提供更好的可读性，即使内容被降级的情况。作为根据本发明实施例的呈现媒体标记的部分处理，在生成图像后，可应用各种滤波和/或转换。由滤波和转换导致的变化通常不妨碍人识别揭示的媒体标记。然而，利用针对自动识别而提高保护的机器，该变化可使媒体标记位置的检测变得复杂。图7中示出了根据本发明实施例的呈现嵌入视频序列或图像组中的媒体标记的处理。处理IOO 包括使用编码的信息生成图像(102)以及对所生成的图像应用滤波 (104)。在图解说明的实施例中，该滤波是具有大约0.5的西格马的高斯模糊和大约0.5的标准偏差。应用高斯模糊可去除在标记的内容中是可视的强的边缘。在应用滤波后，对图像进行转换(106)。在图解说明的实施例中，该转换包括将伪随机几何变化应用到图像。例如，应用-5和+5度之间的旋转、图像大小的-10%和+10%之间位置变化以及在水平和垂直方向上+10%和-10°/。之间的拉伸。尽管在其它实施例中，可应用其它伪随机变化。在多个实施例中，伪随机变化的应用取决于保密密钥的使用而生成伪随机序列，根据该伪随机序列可得到针对变化的参数。可由用户提供密钥或者随机地生成密钥。当以上述方式应用伪随机变化来生成媒体标记时，媒体标记不能从媒体中理想地去除，在该媒体中嵌入该媒体标记而不用知道密钥。所以，根据本发明的系统的多个实施例存储密钥以使得能使用密钥来从其中嵌入媒体标记的媒体中去除媒体标记。如果不用去除媒体标记，那么在嵌入媒体标记后可丢弃该密钥，这是因为对于检测不需要该密钥。除了上述的参考图7的滤波和转换，本发明的实施例还在呈现媒体标记时可利用任何的滤波、转换或数据操作处理。例如，对用于嵌入视频序列或图像组中的媒体标记的呈现可包括紋理、字体类型或符号形状的修改。通常，基于使用媒体标记的特定应用的要求来确定针对基本呈现的媒体所执行的处理。图8示出了根据本发明实施例的所呈现的媒体标记。媒体标记210 包括文本信息205和图形206,其利用应用的几何变化而呈现到图像 200。在图解说明的实施例中，文本信息205和图形206呈现为具有亮的边界区域207和暗的内部区域208。应用到图像的几何变化的至少一个是图像的部分旋转，使得文本信息的线条没有与图像的边缘相平行地延伸。在其它实施例中，使用单色或不同的区域组合可呈现文本和图形。此外，各种其它滤波、转换和/或处理可被用来创建图像的其它变化(见以上说明)。此外，可使用滤波或字体，其消弱(breakup) 媒体标记中的线条，并且可向媒体标记应用伪随机噪音模式以进一步减少已嵌入的媒体标记的可视性。选择其中将嵌入媒体标记的媒体如上所讨论的，根据本发明实施例的媒体标记被重复地嵌入媒体中。随着时间扩展媒体标记可增加媒体标记的鲁棒性，这是因为揭示处理包括随着时间根据若干媒体组分累积结果。尽管媒体标记通常不能根据单个媒体组分来恢复，所以每个媒体組分对总的检测结果有贡献。当处理高度降级的媒体时，通过使用较长周期的媒体和处理更多的单独媒体組分可使媒体标记经常被揭示(即使媒体标记在单独媒体组分中已经明显地被减弱)。在多个实施例中，遍及媒体分发媒体标记包括选择其中将以周期间隔嵌入媒体标记的媒体组分。在其它实施例中，基于媒体组分的特性来选择其中将嵌入媒体标记的媒体组分。例如，可只将媒体标记嵌入不可能使媒体标记的存在为可观察到的多个媒体组分中。图9中示出了根据本发明实施例的选择其中将嵌入媒体标记的媒体组分的处理。处理220包括选择笫一媒体组分(222 )、忽略预定份的媒体(224 )、确定是否还有另外的媒体(226 )以及选择另一媒体组分直到没有另外的媒体保留为止(222 )。为此，结束该处理(228 )。在其中处理被用来从视频序列中选择帧的以上处理的实施例中，媒体标记可被嵌入数字视频的每个帧、数字视频的每隔N个帧或随机的数字视频的多个帧中。在多个实施例中，在每隔N个帧嵌入媒体标记的第一部分，而数字视频的每隔M个帧嵌入媒体标记的第二部分。遍及媒体重复地嵌入不同的多个媒体组分标记可增加定位媒体标记的困难以及从媒体中去除媒体标记的复杂性。图10中示出了用于选择其中将嵌入媒体标记的媒体组分的另一处理。处理240包括检查(242 )媒体组分以确定(244 )该媒体组分是否具有适于根据一组标准嵌入(246)媒体标记的特性。例如，该标准可包括在媒体中变化的程度和/或背景噪声。当在包括高程度的变化和/或背景噪声的媒体組分内进行嵌入时，媒体标记不大可能被检测。如果该媒体组分的特性被确定为合适的，那么选择该媒体组分 (246)以嵌入媒体标记。该处理确定是否还有另外的媒体(248)。如果存在另外的媒体，那么对下一組分的特性进行检查(242 )。一旦已检查了所有的媒体，那么该处理就完成了 (250)。在多个实施例中，以上处理的组合可被用来选择其中将嵌入媒体标记的多个媒体组分。此外，根据本发明的实施例可使用其它处理来确定其中将嵌入媒体标记的多个媒体组分。组合媒体标记和媒体根据本发明的实施例，可使用多种技术来组合媒体标记和媒体。该处理的属性通常取决于媒体的属性以及在特定应用中指定的任何的不可见性、性能和格式要求。如上所讨论的，媒体的属性影响被用来组合媒体标记和媒体的处理。该媒体可被压缩或被解压缩，并且可使根据本发明实施例的媒体标记与或被压缩的或解压缩的媒体信息进行组合。图11中示出了根据本发明实施例的组合媒体标记和媒体的处理。处理260包括将初始的媒体组分转换到嵌入域中(如果被要求的话) (262 )。一旦在嵌入域中，那么修改形成初始的媒体组分的信息以包括媒体标记的信息。该修改通常在单个媒体组分中不明显。在对于几个媒体组分的所选位置中弱修改的分布使得使用空间和时间域并且使得三维(即，高、宽和时间)标记嵌入媒体中。以上讨论涉及嵌入域。嵌入域是信息的属性，其中可嵌入媒体标记。例如，用于视频帧或图像的嵌入域可以是空间域或频域。在媒体組分是视频帧的多个实施例中，嵌入域是解压缩的空间域。可以以适于其中将嵌入媒体标记的媒体组分的嵌入域的任何方式来执行根据本发明实施例的对媒体组分的修改。在将媒体标记与视频帧或图像进行组合的多个实施例中，该组合是逐个像素地将媒体标记加到初始视频帧的亮度分量。从呈现在中等灰度级背景上的媒体标记中减去中等灰度值，使得媒体灰度值不对帧进行修改，并且要嵌入的图形由正和负数组成。只有这些被呈现的媒体标记的较亮和较暗的区对该媒体组分引入了修改。图12中示出了根据本发明实施例的用于修改视频帧的部分的处理。处理280包括将感知掩蔽应用到媒体标记(282 )、施加表示对媒体标记的嵌入长度的加权(284 )并且然后将应用掩蔽和加权的媒体标记与视频帧或图像的像素进行组合(286 )。以上处理涉及感知掩蔽的使用。感知掩蔽用来将对区域的媒体组分的改变限制到该改变对人类观察者来讲不可能可见的区域。下面将更为详细地讨论感知掩蔽。在多个实施例中，根据以下公式来执行应用掩蔽和加权的媒体标记与视频帧或图像的像素的组合Sx，y，f = Ox,y,f + (Cx,y - (V/2))* Mx，y/R 其中Sx，y，f是在帧号为f的加标记的视频中、在位置x， y处的像素。S被限制在允许的像素值范围内；Ox，y，f是在帧号为f的初始未加标记的视频中、在位置x， y处的像素；C、y是在呈现的媒体标记图像的位置x， y处的像素； V/2是中等灰度值；Mx，y，f是在帧号为f中、在位置x， y处感知模型计算的结果； R是确定多么强的修改被应用到视频帧或图像上、并且因此其的可视性是多大以及媒体标记抵制内容的修改是多强的鲁棒性值。将越高的R值嵌入可视性更高但也对修改抵制更强的标记，其中在较低品质版本的媒体标记视频中很快可以检测到它。在优选实施例中，R具有1的值。在其它实施例中，从视频中减去媒体标记，并且在多个实施例中，只有背景被标记(即，不包含信息的媒体标记的区域)，其使负像被嵌入。在一些实施例中，按照类似的帧之间的差对媒体标记编码。利用阈值来测量相似性。该阈值可以是固定的或根据视频来动态确定，例如使得5%的帧是在具有至少一个其它类似的帧的组中。在编码时，差被引入彼此类似的帧之间。在由媒体标记覆盖的区域中，通过在帧之间引入差来对媒体标记进行编码。可根据可视性考虑和安全性考虑来选择这些区域。如上所讨论的，多个本发明的实施例在除了亮度的域中修改了视频帧或图像。在多个实施例中，修改单个或多个色彩分量值。可根据诸如lab、 RGB、 YUV、 HSL和CMYK之类的色彩空间得到色彩分量。嵌入域的选择可通过处理能力来确定以将承载媒体转换成那一处理域。这对应用来讲特别相关，其中要求标记的有效应用，诸如在回放或下载期间嵌入。如果媒体被解压缩以回放，那么可使用解压缩的域，而如果亮度域例如在YUV像素格式中是可用的，那么亮度、解压缩的像素域可被用来应用标记。如果例如在下载期间视频在压缩域中是可用的，那么标记可被应用在压缩域中，如下面将进一步说明的。感知模型组合媒体标记和媒体组分的以上讨论涉及感知掩蔽的应用。通常使用感知模型来生成感知掩蔽以分析该媒体组分以及鉴别何处对该媒体组分的改变对人类观察者来讲可视性较低。根据本发明实施例的感知模型通常以这样的下述方式来生成与媒体标记组合的掩蔽，该方式即为通过与掩蔽的媒体标记的组合创建的媒体组分的改变在其中降低人对该媒体组分的改变的察觉能力的区域中相对较大。在多个实施例中，感知掩蔽限定了最大不可感知的修改，该最大不可感知的修改可在进行媒体组分的改变时被执行。当为了组合媒体标记和视频帧或图像而创建感知掩蔽时，考虑人的视觉系统的属性。人的视觉系统的属性限定了人根据区域的局部和时间相邻(temporal neighborhood)的属性而看见对一见频帧或图像的修改(即，嵌入的媒体标记的信息)的能力。该属性包括亮度、对比度、噪声、色彩以及这些特性在时间和空间上发生的变化。例如，在作为非常暗或非常亮的区域中、在包含对比度的区域中、在与诸如场景变化之类的先前帧或随后帧不同的区域中、以及在包含大量高频信息的区域中，对帧的修改可察觉性较低。根据本发明实施例的感知模型也可考虑其上将显示视频的设备以根据使用的显示设备来适应不同的—见频感知。以下将讨论根据本发明实施例的用于生成感知掩蔽的处理，该感知掩蔽表示在视频帧或图像中对于每一个像素的允许修改量。在下列等式中，Px,y，f表示在帧号为f中在位置x,y处的亮度的像素值。V是对于该^泉素值的最大值。此外，M是不可感知值Mlx，y，f、 M2x，y，f和M3x，y，f的加权的总和，其由下迷的几个不同感知属性的分析得到。在其它实施例中，M可形成为相同或其它不可感知值的函数。Mlx，y，f是对于Px，y，f的空间对比度掩蔽的量度并且是针对那一像素的对比度，其被测量为Px，y,f和相邻像素之间绝对差的平均值。下列公式限定了对于3x3像素的区域的这一计算，其适于640x480像素的帧大小。<formula>formula see original document page 22</formula>通过增加计算量并对于较大的帧尺寸使用更大的范围，以上用于 Mlx,y,f的z^式可容易地适应于对应于超过640x480的帧大小或小于 640x480的帧大小的像素区。M2x,y，f是Px，y，f的亮度并对于很暗和很亮的区具有更高的值，如由以下/〉式所确定的。M2-ld广K/2|，其中V/2是中等灰度。M3 x，y，f是时间对比度掩蔽并且是Px，y，f和先前帧的相同位置中的像素之间的^对差，即，M3wHc「d作为处理的部分，使无感知值M1至M3标准化以具有范围从0至1 的值。可进一步限定M1至M3为最大值以对于特定的或不寻常的帧内容避免极端值。无感知值的加权总和由以下等式来确定<formula>formula see original document page 22</formula> 其中，W1是M1的加权，W2是M2的加权，而W3是M3的加权。加权W1、 W2和W3确定感知属性对感知掩蔽的影响并且可4艮据可^L性测试或视频内容来改善。在优选实施例中，M1和M3具有1的加权，而M2具有0.5的加权。以上的讨论说明了关于空间域的感知掩蔽的创建。在多个实施例中，当压缩的内容被标记时，将用于压缩的信息用于感知模型。普遍在MPEG1和MPEG2中使用的压缩分量包括运动矢量，其表示再使用在不同位置中的先前帧的帧内容。运动矢量确定所包括的运动量，其是感知模型的重要属性。具有长运动矢量(long motion vector )或缺失运动矢量的帧通常与先前的帧有很少的相似性。压缩帧或压缩区的大小也可以是在帧或区域中噪声或频率量的表示。如果表现多个频率，那么所述帧包含大量信息并且可被标记而无感知降级。通过使用压缩信息来创建感知掩蔽，获得有关图像和特征的有价值的信息而不消耗时间的分析。数据可被用于在嵌入之前可感知地对媒体标记整形并且动态地适配在特定区域中嵌入的长度。在几个实施例中，执行一次对于视频序列或图像组的感知模型的生成，并且将其应用到几个单独标记的视频序列或图像组的拷贝。也可电子地压缩、传送所生成的信息并在稍后的阶段被应用。例如，可将感知模型分开地存储并且可将其在视频序列或图像组的每次回放期间进行应用而不用修改所存储的媒体。存储分开的感知模型可允许以灵活的方式使能、无效或修改的暂时性标记。图13中示出了根据本发明的嵌入处理的图解说明的示例。消息 "ABC12⑥，，301被编码并被呈现以形成媒体标记305。在嵌入期间，针对在嵌入期间修改的区域来创建感知掩蔽310。根据感知掩蔽310来组合媒体标记305和本例中为地球315的视频帧以生成具有嵌入媒体标记320的帧。在多个实施例中，因为感知模型将针对类似帧提供类似的结果，所以在类似的帧中以类似的方式嵌入媒体标记。对于类似的帧生成类似结果的能力可妨碍通过比较在两个可视类似的帧中引入的差而确定媒体标记的属性的统计分析的使用。此外，以类似的方式在每帧中嵌入媒体标记增加了媒体标记将表现在任何新的视频序列的可能性，其中该新的视频序列是通过对其中嵌入媒体标记的视频序列的帧一起求平均或者通过改变视频序列的帧的顺序而创建的。在多个实施例中，感知模型可被简化，并且要被修改的像素和嵌入符号的数量及大小可根据性能要求而改变。此外，可将初始视频划分为几段并且利用不同的媒体标记来标记以隐藏大量信息。
对媒体标记和压缩媒体进行組合
在几个实施例中，通过修改压缩的元素来执行修改。可在诸如
DCT、 Wavelet(小波)和快速傅立叶之类的普通压缩域中执行感知模型的分析以及实际的组合。媒体标记以及帧被表示并被组合在特定的域中。对于用于MPEG1、 MPEG2和MPEG4的DTC域，空间对比度量度Ml是包含Px,y，f的块(block)的所有DCT分量的绝对总和，亮度量度M2可根据DC分量的值得到，以及时间对比度量度M3是在当前帧和先前帧中频率之间的绝对差的总和。媒体标记与DCT压缩的帧的组合是对应DCT系数的相加并且可按以下公式来计算
标记帧0<:1分量=初始视频001分量+ (媒体标记DCT分量-中等灰度值DCT分量)*M*R
在另一实施例中，媒体标记浮皮嵌入诸如Wavelet或快速傅立叶域的不同域中。当在经转换的域中对媒体标记与媒体组分进行组合时，在经转换的域或空间域中，该媒体标记是人可识别的。例如，可将标记的空间表示嵌入初始视频的经转换的域中(揭示的媒体标记在经转换的域中是可识别的，当在经快速傅立叶变换的图像中查看时可视的图像)，或者标记的转换表示被嵌入初始视频的经转换的域中。在经转换的域中嵌入空间信息可导致伪像(artifact)，其不可识别为人可读的符号而却是噪声。
在多个实施例中，将信息嵌入多个嵌入域中。将信息放入多个域中可减少其中嵌入了媒体标记的媒体的操作将导致所有媒体标记信息消除的可能性。不同的域也可用作由每一个用户独立嵌入的不同信息的栽体，以保护在相同内容中的不同位置和时间应用的若干独立的标记。
嵌入位置的修改在另一实施例中，利用密码处理使嵌入位置得到保护以防止未经授权地去除媒体标记。该处理包括根据密钥或密钥序列来改变嵌入位置。在时间间隔中可伪随机地被生成密钥序列，或者可根据有效载荷生成密钥序列以便被嵌入，或者可通过用户来提供密钥序列。在一些本发明的实施例中，在每一个帧内实施变化，并且使用帧的相同位置以嵌入比其它位置更强的标记。这些变化对于每一个帧和对于不同电影中的相同帧来讲不相同。该变化妨碍了在不知道密钥的情况下嵌入处理的理想反转。因为对于揭示或识别媒体标记不需要密钥，所以密钥是非对称的。仅对于嵌入和去除媒体标记需要密钥。在嵌入后，如果不需要去除，那么可丢弃该密钥。
在本发明的其它实施例中，使用另一密钥或密钥序列来通过改变在帧中图形的位置而对帧序列实施变化。可在时间间隔中伪随机地生成密钥序列，或者可根据要被嵌入的有效栽荷生成密钥系列，或者可通过用户来提供密钥序列。取决于密钥序列，不同的帧序列会包含不同位置的图形，并且因而形成的电影的间隔会包含不同的标记。由于去除内容的试图通常实施到整部电影，所以提高了安全性，并且尽管其可能影响一个间隔，但是在其它间隔中可能不明显地影响标记。为了揭示，可存储该密钥序列，因为其在揭示期间会有帮助于而鉴别具有相同位置的媒体标记的帧序列。
在音频中嵌入媒体标记
尽管上述的许多实施例说明了媒体标记对视频的应用，但是以对视频所描述的类似方式可将音频媒体标记添加到音频。媒体标记是短音频，其由信号音调或口述的单词或数字組成。媒体标记(音频标记) 以弱的、不可听见的方式被重复地嵌入媒体内容中。在一个实施例中，对音频标记可感知地整形，在修改的可听见性较弱的位置应用较强的标记。这些是表示许多其它可听见频率的周期。通过对音频应用高通滤波并且对短音频标记的长度的子区段求平均来执行揭示。
在多个实施例中，音频媒体标记的长度是s秒，其被可感知地整形以及被重复地加到音频。在检测期间，将数字音频分成s秒长度的多个区段。利用高通滤波来处理这些区段并且对其进行平均直到隐藏的声音对人成为可听见的。
利用透镜将媒体标记嵌入视频中除了在媒体中嵌入媒体标记的数字技术，本发明的实施例还可利
用模拟技术。图13A中示出了根据本发明实施例的利用透镜可在视频序列中嵌入媒体标记的系统的实施例。该系统利用具有视频投影仪 605或记录装置的透镜610将媒体标记嵌入模拟视频中，透镜610被用来在投影期间或录制视频期间嵌入标记。透镜610包括一个或多个半透明字符615。字符615起着媒体标记的作用并且表示视频的标识信息。当通过该透镜投影视频时，标识信息被重叠在所显示的视频上，并且该字符被轻微地叠合在所投影的视频上，以及因此造成了对所投影视频的修改，其类似于在本发明中公开的数字处理。这些字符的透明度被调整到足够弱，使得它们在投影的图像上通常是不可察觉的 (为了说明的目的而在图13A中示出)，并且这些字符的透明度还被调整到足够强来轻微地改变所投影的视频。利用根据再录制内容的数字版本的本发明中公开的过程，这些改变通常可被揭示。在另一实施
例中，透镜被安全地固定在投影仪上或者利用防篡改密封来密封。该应用对于在所投影的视频中隐藏像机标识信息是有用的并且在录制时间保护运动画面内容。在另一实施例中，利用像机镜头来执行媒体标记的嵌入，并且媒体标记的嵌入被用来鉴别用于录制的像机。
揭示媒体标记
根据本发明实施例的揭示媒体中嵌入的媒体标记通常包括使用被设计来强调其中嵌入媒体标记的媒体组分之间的细微差别的处理。强调该差别使得对由嵌入处理引入的媒体的细微变化进行强调。通过对媒体的几个间隔进行结果累计，该差别可被显示以进行识别。在多个实施例中，由人来执行所提取的媒体标记的识别和解译。人感知的能力经常较高地适于降级的图像或音频的识别。在多个实施例中，通过来自多个媒体组分的组合信息来揭示标记，并且当组合信息时，执行检查。根据媒体的不同部分使用多个媒体组分的能力意味着不需要媒体的同步来揭示媒体标记。当与信息的组合同时执行检查时，当利用足够的清晰度揭示了媒体标记时，用户可停止组合处理。在其它实施例中，所有的媒体组分被组合或者可组合预定的媒体组分，并且然后执行检查。图14中示出了根据本发明实施例的揭示、识别和解译嵌入媒体中的媒体标记的处理。处理340包括选择第一媒体组分(342 )以及将来自另外的媒体组分的信息与第一組分进行组合以强调媒体标记 (344)。然后检查组合的信息(346)，以及对关于媒体标记是否已用足够的清晰度来揭示而执行识别做出判断(348)。当媒体标记没有被充分地揭示时，来自另外的媒体组分的信息与先前组合的信息进行组合(344 )直到揭示媒体标记为止。一旦媒体标记被揭示，则可执4亍识别(350 )。在许多实施例中，组合来自媒体組分的信息以强调媒体标记包括高通滤波。其可通过处理每帧的每一个像素来实现，其中通过对其分配对应于在围绕该像素的NxN像素区(例如，9x9)上拉伸的直方图的值来处理每一个帧的每一个像素。该操作是特定版本的高通滤波。在一些实施例中，与密钥无关地实施揭示处理，并且该揭示处理只根据其内容处理视频的所有位置。在其它实施例中，以由密钥限定的间隔来处理媒体，如上所述。在许多实施例中，诸如对比度提高、钝化掩蔽、如直方图拉伸的直方图功能、自动达到级别(auto to level)和利用诸如Sobel滤波器或其它边缘检测滤波器的滤波器进行滤波的应用的其它处理被用来强调媒体标记。在几个实施例中，对多个帧求平均，并且然后应用滤波处理。在其它实施例中，对多个帧进行滤波，并且然后平均经过滤波的帧以强调媒体标记。图15中示出了根据本发明实施例的揭示视频序列中嵌入的媒体标记的处理。如以上所讨论的，该揭示处理包括对不同的媒体组分所共同的不十分明显的信息加高亮。在图解说明的实施例中，将揭示处理应用到潜在地经受了一些转换的标记视频中，该转换诸如再录制、再编码或滤波。首先，对于揭示处理，选择可包括媒体标记的视频序列(405)。从视频序列中获得视频的帧(410)。如果有必要，那么将该帧转换到检测域。在一些实施例中，对检测域进行解压缩。根据该帧，选择适于对媒体标记加高亮的像素的相关区域(415)。根据自从媒体标记的嵌入起视频已经经受了的降级，由于媒体标记造成的改变在每帧的某些区域中可能较强，并且因此对于揭示媒体标记更为相关。这些相关的区域可包括与先前的帧相比存在差异的像素区、包括相当数量的低频信息的像素区或者通常适于揭示媒体标记的像素区。然后强调像素区内的细微差别(420)。然后可对揭示的帧进行组合(425)，并且将该结果呈现给人类观察者以便检测(430 )。在一些实施例中，然后可使用该结果来查询数据库项、停止机器进行录制或者将该视频是非法的拷贝通知给拥有者或初始接收方。在许多实施例中，强调细微差别的处理包括在每一个色彩域(诸如红、绿和蓝)中针对每帧f的每一个位置x，y处的每一个像素Px，y,f的下列处理的应用。该处理包括NxN高通滤波的应用(见以上讨论)。A. 选择区域Gx，y，f。这是围绕像素Px，y,f的区域。在该示例中，GX，y，f的大小是9x9像素区，并且在这种情况下，其由4个角落的像素位置 (x-4，y-4)， (x+4，y-4)， (x-4，y+4)， (x+4，y+4)来限定。根据应用到视频和/ 或帧分辨率的变化，该区域的大小、宽度和高度可改变。B. 通过计算在区域Gx，y，f上的直方图拉伸来强调区域Gx，y，f中的像素之间的差别。然后，根据下述的公式，值Lp，x，y，f (直方图拉伸的结果)被存储在像素Px，y,f的位置。Lp， x，y,f = ( Px，y,f - Lmin xy，f) *V/ ( Lmax x，y,广Lmin x，yf) 其中，Lminx，y，f=在区域Gw中的任何像素的最小值；Lman x，y，f =在区域Gx，y，f中的任何像素的最大值;以及 Lp， x，y,f =对于像素Px,y，f的这种直方图拉伸的结果。 V=最大像素值，最小像素值为O。C.通过确定在揭示的媒体标记的位置(x， y)处的对应像素Ex，y 来对每一个位置(x， y)处的每一个像素的处理过的帧求平均作为对所有帧的Lp，的平均，如下列等式中所示的。Z7 — / ='其中，Nf =用于揭示处理的标记帧的总量 Ex，y-在位置x， y处的已揭示的媒体标记的像素在几个实施例中，以上算法的步骤B包括对比度提高、钝化掩蔽、高通滤波、直方图拉伸、直方图均衡化和诸如边缘检测滤波器实现的边缘检测。最佳结果可根据视频内容和降级来改变。根据不同揭示方法的结果可通过人员来分析，以便在任何给定应用中选择用于识别的最佳结果。在几个实施例中，例如，直接使用诸如在DCT压缩帧而不是像素中的DC系数之类的压缩分量来执行检测。当使用如MPEG1、 MPEG2 或H.264的DCT压缩的视频时，DCT块可被作为要被分析的区域。或者，如果视频序列具有足够高的分辨率(例如，640x480像素)，那么可分析DC分量而不是单独的像素。尽管根据本发明实施例不需要初始视频序列来揭示媒体标记，但是接入初始视频基本上可改进所揭示的媒体标记的清晰度。在处理之前，可从利用媒体标记所标记的帧中减去初始视频帧。图16中示出了根据本发明实施例的应用于视频序列的揭示处理的图解说明示例。利用嵌入的媒体标记示出了三个数字电影帧505、 510、 515，为了示范的目的，其为可视的。处理每一个视频帧505、 510、 515以强调媒体标记，如上所述。该处理分别产生了三个修改的帧520、 525、 530。如上所述，组合^务改的帧520、 525、 530以获得可视的且人可读的揭示的媒体标记540。当在视频序列或图像组中揭示媒体标记时，尽管由于应用到视频序列或图像组的诸如旋转、移位和拉伸之类的转换造成了一些几何变形，但是人的视觉系统通常可执行配准并且可识别字符。几何变形的根源可包括在诸如利用摄像机再录制的视频处理期间所引入的几何转换。此外，即使视频已经具有主动应用的几何转换来破坏水印或者即使(例如，通过压缩、转换、色彩变换、附加噪声等等)使视频明显地降级，但是所揭示的媒体标记仍然可读。媒体标记的机器识别在另一实施例中，媒体标记包括计算机可读信息。在利用揭示处理对其进行揭示之后，通过机器解译揭示的媒体标记以使能自动读出。机器可读信息可包括诸如或者字符(OCR字体，如OCR-A或 OCR-B)、条形码(例如，线性条码、堆叠式条码、二维条码)或者可由计算机识别的符号的机器可读元素。例如，条形码包括以下符号表示UPC、 Interleaved 2 of 5、 Code 39、 Code 93、 Code 128、 EAN，堆叠式条码符号表示，如PDF417，利用符号表示的也称作矩阵码的2D条码，如Aztec Code、 Bullseye、 DataGlyphs、 Datamatrix、 DotCode。为了识别，使用条码读取、模式识别或光学字符识别。去除媒体标记在嵌入处理期间，只有某些视频数据被修改，然而，为了揭示，使用所有的视频数据。因此，即使可识别揭示的媒体标记，但是个体变化的精确位置不能通过分析或者逆向操纵揭示处理而被观察到。所以，使媒体标记免于未授权的去除，因为对于去除来讲必须知道嵌入位置和修改。然而，如果知道媒体标记、嵌入参数和所有随后的修改，那么嵌入处理是可逆的。如果需要去除媒体标记，那么嵌入处理可以被逆转，使得视频好像从来未被标记过。去除媒体标记的处理基本上包括^f吏用嵌入处理的知识来反向地应用嵌入处理。应用的说明可将上述系统和技术用于基本上无限制范围的应用。提供下列作为一系列应用的示例，其中根据本发明实施例的系统和处理可以是有用的。跟踪保密的或取得版权的信息的无授权分发面对许多产业的问题是信息的未授权分发。可使用根据本发明实息中。可利用诸如接收方标识号和时戳之类的信息来唯一地标记每一个分发的拷贝，并且如果该拷贝是公共可获得的、或处于未经授权来拥有该信息的个体或实体的拥有中，那么可揭示该信息并且可鉴别作为媒体的接收方和未经授权分发的可能的源的个人或实体。在多个实例中，在制作和授权的分发期间，保密的或取得版权的信息在几个不同的实体和/或个体之间传递。在几个实施例中，在没有授权的情况下信息从其被分发的点可在交付前、通过嵌入与信息的最终接收方关联的媒体标记来确定。可基于被加到媒体的最终媒体标记来鉴别负责未授权分发的实体或个体然后。其中分发取得版权的信息的一般实例是通过网络对媒体播放器分发取得版权的媒体。在多个实施例中，播放器是诸如机顶盒或个人计算机之类的用户电子设备。通常以压缩和加密的形式将取得版权的媒体分发到播放器。在解密后，根据本发明的实施例可将媒体标记嵌入媒体中。媒体标记可包含与播放器的拥有者相关的信息以及标识传送或播放的时间的信息。如果知道信息的接收方，那么将被嵌入的信息可通过提供媒体的服务器(或首端)来生成。也可通过服务器将嵌入的信息存入数据库，其包括诸如用户的账单信息之类的有关交易的附加信息和有关接收设备的细节。在其它实施例中，播放器维持诸如播放器标识号和时间的信息，其在存储和/或回放期间作为媒体标记被嵌入。其中未授权的分发是普遍问题的另一实例是在媒体的制作中。在制作期间，内容易于被未授权的分发，其可能对媒体的出品人造成极大的损害。在多个实施例中，媒体标记在制作的各个阶段期间被嵌入媒体中，其标识媒体的接收方和媒体的接收时间。如果使拷贝可^^共地获得，那么可揭示媒体标记并且可鉴别负责人或实体。在上述的多个实施例中，针对分发的媒体而创建感知模型，并且利用该媒体对其进行存储和分发。因为媒体标记被嵌入媒体中，所以然后可使用感知模型。在其它实施例中，每当媒体标记被嵌入媒体中时，创建感知模型。所有权的验证一旦媒体经历了公共分发，在媒体中验证版权的所有权可能成了问题。在多个实施例中，使媒体标记嵌入媒体中以验证内容的所有权。在多个实施例中，媒体标记包括对于取得版权的内容的所有权信息或标识。该标记可被自动读取并且可评估它的存在与否以限制或允许分发，或者证明分发媒体的源是该媒体的合法分发者。也可以使用该标记，使得相对于内容有兴趣获得权利的实体或个体通过揭示嵌入的媒体标记可鉴别内容的拥有者。对于由特定用户或用户组拥有的内容来讲，标识拥有者的媒体标记的另一使用是在例如通过因特网可接入的公共可用的数据库中自动鉴别内容以防止进一步地分发。最终，在争论的情况下，该标记可被用来验证所有权。存储鲁棒的元信息在长期的存储和存档期间，利用媒体存储的信息可能被丟失，这或是因为其被偶然地删除或是因为其不可被读取。本发明的许多实施例被配置成利用媒体标记来存储有关媒体的信息。利用媒体标记存储信息可使得能在格式改变后取回信息，并且不需要额外的存储空间。拷贝控制在多个实施例中，机器可读的强媒体标记可被嵌入媒体中。然后通过播放器可使用媒体标记以控制媒体的回放和/或录制。播放器可揭示媒体标记并且确定播放媒体所需要的授权。如果播放器具有适当的授权，那么播放器可播放媒体或拒绝回放。广播监视通过电视或广播台，根据本发明实施例的机器可读媒体标记也可被嵌入媒体广播中。然后通过接收设备可使用机器可读媒体标记以自动录制作为广播的内容并且跟踪广播的频率和时间。嵌入媒体中的媒体标记针对每项工作和广播可能是不同的。保密通信如上所述，媒体标记可用来利用媒体传送保密信息。尽管可观察到媒体的传送，但是事实上媒体包含另外的媒体标记是不明显的并且可被用来传送信息，而不允许其它人观察到除了媒体内容之外还传送信息。公共显示的媒体的标识被公共显示的媒体经常是录制的对象。在多个实施例中，媒体标记被嵌入公共显示的媒体中，其标识公共显示的时间和/或位置。如果在公共显示期间再录制媒体，那么媒体标记被嵌入未授权的再录制，并且揭示该信息可有助于阻止将来在其中进行再录制的场所再录制公共显示的媒体。尽管以上说明包含了许多特定的本发明的实施例，但是这些将不构成对本发明范围的限制，而是作为本发明的一个实施例的示例。所以，通过图解说明的实施例并不应该确定本发明的范围，而是通过所附权利要求和它们的等价物来确定。
权利要求
1.一种在承载媒体中嵌入信息的方法，包括以媒体的形式呈现所述信息；从所述承载媒体中选择多个媒体组分；将被呈现的媒体的至少一部分与该承载媒体的所选择的媒体组分中的每个媒体组分组合以形成修改后的媒体组分，其中对所述修改后的媒体组分的所述修改对于人类观察者是不可见的；以及使用所述修改后的媒体组分来创建修改后的承载媒体。
2. 如权利要求l所述的方法，其中所迷承载媒体包括视频序列；承载媒体的每个所述媒体组分是单个视频帧；并且所述被呈现的媒体是图像。
3. 如权利要求2所述的方法，还包括改变表示所述被呈现的媒体的所迷图像的几何形状。
4. 如权利要求l所述的方法，其中，将所述被呈现的媒体的部分与所述承载媒体的每个所述媒体组分组合包括根据感知模型来修改所述被呈现的媒体。
5. 如权利要求l所述的方法，其中，伪随机地选择被呈现的媒体的、与所述承载媒体的媒体组分组合的部分。
6. 如权利要求l所述的方法，其中所述承栽媒体包括音频序列，所述承栽媒体的每个所述媒体组分是一段音频，并且所述被呈现的媒体是音频序列。
7. 如权利要求l所述的方法，其中所述承载媒体包括视频；并且所述被呈现的媒体包括通过其可投影或录制视频的透镜。
8. 如权利要求l所述的方法，其中，所述信息包括与所述媒体相关的元数据。
9. 如权利要求l所述的方法，其中，所述信息标识视频回放的时间和位置。
10. 如权利要求l所述的方法，其中，所述信息标识版权拥有者或媒体的接收方。
11. 如权利要求l所述的方法，其中，所述信息包括对数据库的引用。
12. —种从承载媒体揭示嵌入媒体的方法，包括从所述承载媒体中选择多个媒体组分；选择每个所述媒体組分的至少一部分；强调来自所述媒体組分的所述部分；以及组合来自所述媒体组分的所述部分。
13. 如权利要求12所述的方法，其中，强调所述媒体组分的部分包括对每个媒体组分应用高通滤波。
14. 如权利要求12所述的方法，其中，强调所述媒体组分的部分体的所述承载媒体。
15. 如权利要求12所述的方法，其中所述承载媒体包括视频序列；所述嵌入媒体包括数字图像；每个媒体组分是视频帧，并且被强调的每个视频帧的部分包括一组像素。
16. 如权利要求12所述的方法，其中，将所述媒体组分的每个部分组合在一起包括对所述媒体组分的每个部分求平均。
17. 如权利要求12所述的方法，其中，在组合所述媒体组分的所述部分之后，通过一设备来识别所述嵌入媒体。
18. 如权利要求12所述的方法，其中所述承载媒体包括音频序列；所述嵌入媒体包括音频序列；音频的每个组分包括音频序列的组分；并且所述音频序列的每个组分的所述部分包括一组音频取样。
全文摘要
描述了将信息重复嵌入媒体中的系统和方法，该信息可通过强调媒体之间的细微变化而恢复。在许多实施利中，感知模型被用来鉴别媒体组分，其中所嵌入的信息不大可能被人类观察者看到。本发明的一个实施例包括以媒体的形式呈现所述信息；从所述承载媒体中选择多个媒体组分；将被呈现的媒体的至少一部分与该承载媒体的所选择的媒体组分中的每个媒体组分组合以形成修改后的媒体组分，其中对所述修改后的媒体组分的所述修改对于人类观察者是不可见的；以及使用所述修改后的媒体组分来创建修改后的承载媒体。
文档编号G06K9/00GK101273367SQ200680032570
公开日2008年9月24日申请日期2006年7月19日优先权日2005年7月19日
发明者尼尔斯·索维尔瑟申请人:美国唯美安视国际有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尼尔斯.索维尔瑟
技术所有人：美国唯美安视国际有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。