数据内容识别的制作方法

文档序号：6411707阅读：216来源：国知局

专利名称：数据内容识别的制作方法
背景技术：
发明领域本发明涉及数据内容识别。这样的内容的例子包括一个或多个视频内容、音频内容、元数据内容、文本内容、图像内容等等，例如视听(audio visual)内容。
现有技术描述包括数字设备和高速度网络的新的数字基础设施的发展，与不断增长的处理器能力相组合，使得内容创建、处理、和分发更加简单和快速。虽然这大大地帮助合法地使用内容，但缺点是这样的内容(特别是版权内容)的非法滥用或“盗版”，诸如非法复制或分发，变得越来越容易和越来越损害内容拥有者。
这种情形变得更加复杂，因为商业考虑需要内容拥有者允许潜在的客户尝试地查看或使用内容-这或许是作为内容的专业评审的一部分，或在向拥有者承诺购买内容使用权之前。例如在电影的情形下，该内容的许多拷贝以这样的方式被发布。
已经提出，使用所谓的“指纹”技术把识别数据加到内容上。虽然这不能防止非法复制，但它允许检测出非法复制品的来源。可应用于视频信号的指纹技术在GB-A-2383221和US-A-5664018中描述。
然而，这种技术的实现会花费很长的时间。使用在本申请之前的日期的当前的技术，可能会花费例如10小时来把指纹处理应用到一部完整长度的电影。
发明概要本发明提供检测输入数据内容的版本的方法，所述数据内容有多种不同的版本，其中所述数据内容按照分段模式安排为两个或多个分段；以及所述数据的所述版本通过相应的识别数据模式是可识别的，按照所述相应的识别数据模式，至少一些所述分段具有各自的识别数据；所述方法包括以下步骤(i)对于所述输入数据内容的所述分段检测所述识别数据；
(ii)对所述检测到的识别数据与相应于所述数据内容的所述不同的版本的所述识别数据模式进行比较；以及(iii)如果在所述检测到的识别数据与一个确定的版本的所述识别数据模式之间的得到的匹配的数目之和超过阈值数，则检测所述输入数据内容是否包括来自所述数据内容的所述这个确定的版本的至少一个组成部分。
本发明建立在一个未公布的建议方案的基础上，它建议通过组合内容的多个主拷贝的部分或“分段”(它们之中至少某些带有指纹数据)来生成加指纹的内容。(这里，术语“指纹”是指把识别数据保密地加到内容上，理想地是这样加入的，即它的存在对于用户几乎是不会觉察的。)这些分段按照对于该内容拷贝的特定用户是独特的或准独特的分段模式进行组合。这个未公布的建议的优点在于，内容的独特的指纹拷贝能以比起把全部指纹处理加到每个单独的拷贝所需要的时间短得多的时间被生成。
如果发现内容的可疑的盗版拷贝，则能够识别藉以复制该盗版的内容来源是有用的。这可以识别盗版的拷贝的制造者或识别由允许由另外的人制作盗版的拷贝的用户造成的保密性失效。在未公布的建议中，这需要检测在每个分段上检测的指纹数据与被使用于发布给用户的版本中的每个分段的已知的指纹数据之间的100％的匹配。
然而，这种基本检测技术没有考虑在一个或多个加指纹的分段中对检测指纹的失败。如果内容受到过某种处理，诸如在电影的情形下所谓的“摄像机盗版”，就会出现这样的失败。这种基本检测技术也没有考虑所谓的“串通攻击”，其中盗版的拷贝被做成为多个合法拷贝的组合，试图去除或冲淡指纹数据。
本发明通过提供在检测到的识别数据与用户的版本的识别数据模式之间的匹配数之和的阈值以检测用户的版本是非法拷贝的源而解决至少某些这样的问题。
特别是在其中各个分段可以产生多个识别数据的串通攻击的情形下，为了确信想要的虚假确信检测率(false positive detectionrate)，最好从在对于输入数据内容的分段检测到的识别数据得出阈值数。具体地，最好是阈值数取决于对于输入数据内容的每个分段，识别数据有多少个事例被检测。优选地，阈值数这样来设置，以使得在对于输入数据内容的每个分段上检测到的识别数据的事例是给定的数目的情况下，输入数据内容被错误地检测为一个确定的版本的统计机会要小于阈值概率。
在替换的/附加的技术中，优选地，该方法包括按照对于输入数据内容的该分段检测到的识别数据的事例的数目，对于在输入数据内容的分段上检测到的识别数据之间的匹配进行加权，各匹配之和是匹配的加权和值。
当加权是这样进行的，以致于一个其中检测到了识别数据的多个事例的分段，比起一个其中检测到了识别数据的单个事例的分段，对于特定的版本的检测的贡献更小的场合下，预期将得到更可靠的结果。然而，与直观相反，在原型的某些实验测试中检测到当加权是这样进行的，以致于一个其中检测到识别数据的多个事例的分段，比起一个其中检测到识别数据的单个事例的分段，对于特定的版本的检测的贡献更大的场合下，将得到更好的结果。
为了缓和某些分段不产生识别数据的问题，最好是，如果对于输入数据内容的两个或多个分段没有检测到识别数据，则这些分段被组合成两个或多个分段的组，以及对于分段的所述组合后的组进行识别数据的检测。这个过程优选地可迭代地重复进行。
优选地，阈值数代表小于分段总数的分段数，和/或小于在该识别数据模式中具有相关的识别数据的分段总数的分段数。
虽然可以使用那些其中只有某些分段载有识别数据的识别模式，但最好是数据内容的版本是可以通过相应的识别模式识别的，其中几乎所有的分段都依据所述相应的识别模式而具有各自的识别数据。
本发明也提供把识别数据应用到输入数据内容的方法，所述方法包括以下步骤(i)生成所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例所载有的所述各自的识别数据是独特的；以及(ii)通过从所述n个事例中选择分段而生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有来自所述事例的识别数据；
接着是以下步骤的一次或多次迭代(iii)生成所述输入数据内容的m个另外的事例，其中m是1或大于1，每个所述m个事例载有各自对于所有其他所述事例独特的识别数据；以及(iv)通过从所述m个事例中选择分段来生成所述输入数据内容的另外的版本，一组所述事例包括所述m个事例或所有的所述生成的事例，从而按照一个相关的识别数据模式，所述输入数据内容的每个版本载有来自所述事例的识别数据。
为了更好地检测盗版的拷贝的来源，最好是在步骤(i)中所有的事例要载有各自的对于其他事例独特的识别数据。
本发明也提供把识别数据应用到输入数据内容的方法，所述方法包括以下步骤(i)提供所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例所载有的所述各自的识别数据是独特的；以及(ii)通过从所述n个事例中按预定的分段模式选择分段来生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有来自所述事例的识别数据；其中所述分段模式使得在所述输入数据内容内至少一个所述分段是不相邻的。
本发明的这个方面可以提供避免所谓的串通攻击的优点，其中加指纹的数据的多个拷贝被加以组合。通过使用非相邻的分段，一组串通者(colluder)更难识别分段边界。
本发明特别适用于包括具有多个接续图像的视频内容的数据内容。优选地，识别数据被编码在代表至少某些图像的数据内，例如在至少某些图像的空间频率分量的一个子组内。
本发明还提供用于检测输入数据内容的版本的设备，所述数据内容有多个不同的版本，其中所述数据内容按照分段模式被安排成两个或多个分段；以及所述数据内容的所述版本是可以通过相应的识别模式识别的，其中至少某些所述分段依据所述相应的识别模式而具有各自的识别数据；所述设备包括识别数据检测器，用来对于所述输入数据内容的所述分段检测识别数据；比较器，用来比较所述检测的识别数据与相应于所述数据内容的所述不同版本的所述识别数据模式；以及贡献检测器，用于当在所述检测的识别数据与一个确定的版本的所述识别数据模式之间获得的匹配数之和超过一个阈值数，则检测所述输入数据内容将包括至少来自所述数据内容的所述那个确定的版本的贡献。
本发明还提供用于把识别数据应用到输入数据内容的设备，所述设备包括(i)事例生成器，用来生成所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例载有的所述各自的识别数据是独特的；以及(ii)版本生成器，用来通过从所述n个事例选择分段而生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有所述事例的识别数据；(iii)事例生成器控制器，用于控制所述事例生成器去生成所述输入数据内容的m个另外的事例，其中m是1或大于1，所述m个别外的事例载有各自的识别数据，它对于所有其他所述事例是独特的；以及(iv)版本生成器控制器，用于控制所述版本生成器通过从所述m个事例中选择分段而生成所述输入数据内容的另外的版本，一组所述事例包括所述m个事例或所有的所述生成的事例，从而按照一个相关的识别数据模式，所述输入数据内容的每个版本载有来自所述事例的识别数据。
本发明还提供用于把识别数据应用到输入数据内容的设备，所述设备包括(i)提供器，用来提供所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例载有的所述各自的识别数据是独特的，以及(ii)版本生成器，用于通过从所述n个事例中按预定的分段模式选择分段而生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有所述事例的识别数据；其中所述分段模式使得至少一个所述分段在所述输入数据内容内是不相邻的。
本发明的另外的各个方面和特性在附属权利要求中规定。
附图简述当结合附图阅读说明性实施例的以下的详细说明时将明白本发明的以上的和其他的目的、特性和优点，其中

图1是指纹编码设备的示意图；图2示意地显示通过使用多个主拷贝的分段来生成内容的加了指纹的拷贝；图3示意地显示该技术在DVD中沿VOBU边界的应用；图4示意地显示非相邻的分段；图5示意地显示该技术应用于视频点播传输；图6示意地显示该技术应用于互联网下载文件；图7示意地显示指纹检测设备；图8示意地显示图7的设备的运行；图9示意地显示分段分析运行；以及图10示意地显示主拷贝生成运行。
发明详细描述本技术可用于对内容加标记，以便以后能够通过使用法庭分析来唯一地识别该内容(或至少部分内容的拷贝)。这个概念可应用于任何可分组的数据，诸如视频和音频基本数据或复接的数据流。这并不是说，数据必须具有正式的分组化的形式，而是数据可被处理成分段或部分，它们代表要被加标记的整个数据量的子集。该技术可被应用于封装的媒体(诸如被存储在诸如光盘的存储媒体上的内容)、从因特网(所谓的内容“拉出”系统)下载的内容、例如通过数字电视业务(所谓的内容“推入”系统)而广播的内容、或其他内容传递的格式。
创建加指纹的内容的过程牵涉到创建两个或多个(一般是m个)主拷贝M1。各个主拷贝都可通过使用加指纹而被独特地加标记，或一个原始的内容可以被保留为未加标记的。在视频内容的情形下，在以上参考文献中描述的技术允许这样地来把识别数据加到内容上，以使得识别数据的存在对于观众基本上是不会觉察的，识别数据可以以后用短的内容分段(或许几秒的视频的量级)来编码，而且识别数据对于把内容进行处理(诸如改变尺寸、数据压缩或甚至摄像机盗版(通过把视频摄像机对准显示内容的屏幕而获取内容)基本上是很健全的。
然后主内容被相同地划分成n个部分(分段或部分)。
在基本系统中，分割方式是简单的时分，这样，分段1包括第一时间间隔的内容，分段2跟随在分段1后面，分段3跟随在分段2后面，等等。分段可以具有相等的长度或可以具有不同的长度。
在更先进的设备中，每个分段潜在地占用多个不相邻的时间间隔。这种设备具有对抗所谓的串通攻击的优点，以及将在下面参照图4进行描述。
在另一种可能性中(它可以与以上描述的两个可能性的任一项相组合)，分段可被安排为视频内容的空间划分，这样，例如，图像的上部可以代表一个与图像的下部的不同的分段。
根据从m个主拷贝伪随机生成n个分段的组合，创建了内容的一个版本，它包含相同的n个分段，但加到这些分段的识别数据是以伪随机方式组合的。只要使用足够数目的主拷贝和分段以提供足够大的一组排列组合以便能包含要分发的版本的数目，就没有两个版本再具有分段识别数据的相同的排列。这意味着，每个版本具有独特的指纹，而不需要应用耗时的约定的指纹生成的处理来产生每个这样的版本。
图1是通过使用该技术的指纹编码设备的示意图。
在图1上，未加标记的(未加指纹的)视频文件10被提供给两个指纹编码器20，30。使用两个不同的指纹数据组来对该视频进行指纹编码，产生两个主拷贝M1，M2。将会看到，一个主拷贝实际上仍旧被保留为未加指纹的，也将会看到，指纹编码处理可作为串行处理被实行，而不是图1所示的并行处理。而且，主拷贝的数目可以大于2。
两个主拷贝被编码器40，50进行MPEG2编码，以及像AC3这样的音频数据的压缩音频数据被复接器60，70复接到数据中。这产生两个所谓的DVD图像，也就是说，具有准备好被记录到DVD盘的形式的视频数据。每个图像包含相应于主拷贝M1或主拷贝M2的指纹。
两个图像分段组合器80，90接收来自用户数据库100的识别矢量，并按照识别矢量组合两个主拷贝DVD图像M1，M2的分段。通过安排以使得主拷贝数目和分段变形的数目可以给出足够大数目的识别矢量以用于要产生的所需要的版本的数目，则识别矢量可被认为是唯一的(或至少是准唯一的)。每个组合器的输出被提供到各自的DVD写入器(所谓的“刻录机(burner)”)110，120，以及各自的DVD盘130，140被写入。为了从每个刻录机产生另一个DVD盘，从数据库提供新的识别矢量，以及产生两个主DVD图像M1，M2的分段的新的组合。
虽然图1显示相同的数目的主拷贝、组合器和刻录机(即，每种两个)，但将会看到，这只是为了附图的简明性。没有任何技术理由要求组合器和刻录机与主拷贝具有相同的数目。
一个用于使每个盘与存储在数据库100的(保密的)识别矢量相联系的非保密代码可被写入到盘上，或可看见地打印在盘上，或同时执行这两种操作。这不是一种技术特性，而是对于把盘路由到正确的用户是有用的。事实上，用户的名字可存储在数据库100，也可打印在各个DVD盘的表面。
作为例子，假设有三个主拷贝，以及每个主拷贝被划分成5个分段。这个安排示意地显示于图2。每个版本由5位数字的“识别矢量”诸如’13213’或’22131’规定。这表示按预订的分段次序，哪个主拷贝被用来提供该版本的每个分段。参照图2，在图的下部，用于四个示例版本(a到d)的ID矢量是版本a32212版本b11332版本c13222版本d23221在再现时，在用户欣赏的音频/视频材料中在版本之间应当没有差别(假设指纹数据以基本上不会觉察的方式加入)。版本之间的唯一差别是指纹数据。
识别矢量可以用这样的方式存储在数据库，以使其被链接到接收该版本的用户。
各个指纹的可能的组合取决于3个因素(i)主拷贝数目m；(ii)分段数目n；(iii)可被交换的分段的最大数目k。
用于确定不同于单个主拷贝的组合数目(c)的公式是(i)如果全部n个分段是可交换的，则数目是c＝mn-1(ii)如果n个分段中最大k个分段是可交换的，则数目是c=Σj=1k(m-1)jnCj]]>例如，如果使用120分钟电影划分成60(＝n)个分段的2(＝m)个主拷贝，以及60个分段中只有20(＝k)个是可交换的，则不同于单个主拷贝的组合数目超过7×1015。对于较简单的方案，假设m＝2，n＝20，以及全部20个是可交换的，则不同于单个主拷贝的组合数目是1,048,575。以下的表展示不同于单个主拷贝的组合数如何随主拷贝数目和分段数目而按比例改变。
图3示意地显示该技术沿DVD的VOBU边界的应用。
VOBU(视频对象单元)是存储在DVD上的小的(典型地几秒)相邻的序列的视频(和相关的音频)。它必须包括一个或多个可被DVD放像机的MPEG译码器理解的自包含的“图像组”(GOP)。保证在再现时所有的搜寻、跳跃等等出现在VOBU边界，以使译码器不需要重新启动，并且跳过的位置总是在有效的MPEG流的开始。VOBU可被组织为VOBU组，它又进而可被安排在VOB(视频对象)中。每个VOBU组是独立的复接的单元，以及对于以前的和以后的单元没有相关性。VOBU组可以具有与所必须的或适当的那样多的VOBU。
为了附图的简单性，图3只显示两个主拷贝M1和M2。这两个主拷贝可以单独地加指纹，或一个加指纹而另一个不加指纹。两个主拷贝被MPEG2编码，以及被预复接成VOBU和VOBU组结构。为了本技术的目的，主拷贝沿VOBU组边界被分段。
然后，根据上述的准唯一的识别矢量，分段按伪随机方式被组合以便重新创建唯一的DVD记录，它然后(例如)可被刻录到可记录的DVD上(DVD-R)。这个过程比起准备约定的加指纹的DVD-R花费少得多的时间，因为加指纹必须只对主拷贝进行，然后被预复接。关于每个版本的个性化过程只与级联的数据分段有关。
一旦VOBU组被组合，就进行IFO生成过程，该过程计算在新建立的VOB内每个VOBU的偏移。(在DVD视频盘编码中，IFO是存储在DVD盘上的、包含信息的文件。DVD的主要分量由MPEG-2编码的音频、视频和子标题流的VOB文件代表，而IFO文件则把关于DVD章节在哪里开始，某些音频轨道位于什么地方等等信息提供给DVD放像机。)对于DVD放像机，VOB似乎是完全独立自主的，正如任何正确地编码的DVD那样，但从内部看，它是来自两个或多个不同的DVD编码的VOBU组的组合。VOB遵从DVD技术说明约束条件。
如果这些DVD中的一个DVD是通过直接复制(所谓的“剥离”)或通过重新编码成例如所谓的DiVx或Xvid格式而被盗版，则应当也可能识别盗版的拷贝的来源，即，藉以作出盗版的拷贝的版本的拥有者。为了做到这一点，对盗版的拷贝的视频流进行分析。分段边界被加以识别，以及在每个分段上由指纹载有的识别数据被加以识别。这生成一个识别矢量，并把它与在光盘被刻录时创建的、被存储在数据库的识别矢量进行比较。因为每个光盘具有准唯一的识别矢量，这应当允许识别该来源。
图4示意地显示使用非相邻的分段的安排。这里，分段被编号为1，2，3，4，5，…，以及可以看到，在视频材料的长度期间(在该页上从左到右地观看)，每个分段被分裂成两个或多个非相邻的部分。下面将讨论帮助击败所谓的串通攻击的方法。
同样的概念可被使用于例如互联网下载或视频点播安排，或其他内容传递机制，其中各个内容包被传递到每个用户或用户组。
图5示意地显示该技术应用于的视频点播(VOD)传输。这里，被划分成分段(为简单起见，被显示为相邻的分段)的两个主拷贝M1，M2被组合器80’按从数据库100’接收的识别矢量被组合。组合的视频流被VOD服务器200处理，以及被有线网络发送到用户的VOD机顶盒210。用户在电视机220上观看该文件。
类似地，在图6上，数据库100”把识别矢量提供给组合器80”，以便组合两个主拷贝M1，M2。组合的文件由网络服务器230通过互联网连接被发送到客户个人计算机(PC)240。
应当指出，就VOD服务器和以后的处理而言，以及就网络服务器230和以后的处理而言，被保护的文件就像任何其他文件。通过把加指纹的主拷贝加以组合而得到的安全性与VOD服务器或网络服务器无关，也与内容的最终用户的欣赏无关。
不管基础的指纹技术的觉察的健全性和低的虚假确信率，不恰当地使用本技术的分段系统潜在地具有更高的虚假确信率和小的串通健全性。这方面的至少某些困难可以通过适当的译码策略来解决。
图7示意地显示指纹检测设备。
图7的设备包括个人计算机300，它具有显示器310、键盘320和用户输入设备，诸如鼠标330。个人计算机具有中央处理机340，只读存储器350、随机存取存储器360、硬盘存储器370、网络接口380(用来完成对诸如互联网390的网络连接)、以及输入/输出处理400(例如进行从DVD盘410读出数据和/或写入数据到DVD盘410)。可以借助个人计算机实施本技术的软件(事实上，该软件控制这里描述的版本生成技术)被提供到存储媒体(诸如硬盘存储器370)、或可移动的媒体，(诸如光盘410)、和/或经由网络或互联网连接(诸如经由网络接口380的连接)。
图8示意地显示图7的设备的运行。
在图8上，从DVD盘读出保护的内容的可疑的盗版的拷贝500。在510，内容按照预定的(和保密的)分段模式被划分成分段，以及为了指纹数据分析这些分段，在520从这个分析得出阈值量。下面将描述得出阈值的方法，但基本上，这是一种统计计算，以便在给定了识别数据在分段之间的分布后，给出需要的或想要的虚假确信率(即，为了最终结果是有效而所需的保证)。
在530，对于从数据库100的拷贝读出的用户识别矢量，测试分段识别数据。检测识别数据匹配情形。
最后，在550，把阈值应用到在530实行的测试的结果。任何一个其识别矢量充分地匹配以致于导致测试得分超过阈值的用户被认为是盗版的拷贝的来源。
在基本级别上，如上所述，译码器可以译码来自盗版的拷贝的每个分段的识别数据，从而产生译码后的识别矢量，然后试图把这个译码的识别矢量与各个用户以前存储的识别矢量进行匹配。然而，为了在从分段识别数据进行译码能强有力地对付可能的失败(例如，如果内容被太严重地处理，或如果分段从内容中被删除)，重要的是，译码器不对每个单独的分段搜索识别数据的匹配。而是，良好的译码器策略是要测试在足够多的分段上是否有识别数据匹配。究竟多大的匹配的阈值数才被认为是足够的，将取决于想要的虚假确信率-如果阈值太小，则无罪的接收者的随机识别矢量将充分地与译码的识别矢量匹配，从而表明一次匹配。
在存在串通的情形下，基础指纹译码器也可能设法对于每个分段对多个输入数据内容译码(取决于串通攻击如何被执行)。
在这种情形下，良好的译码策略仍旧是测试用户的识别矢量与译码的识别矢量是否有足够多的匹配数量。然而，正如指出的，译码的识别矢量可能会在每个分段具有多个识别数据。这一事实增加了这样的可能性，即无罪的用户的伪随机识别矢量恰好会充分地匹配于解码的识别矢量，以致于将无罪的用户认为是盗版的拷贝的源。所以应当设置匹配分段的阈值以便避免这个问题。应当指出，阈值实际上取决于每个分段有多少个识别数据被译码，而它本身取决于串通如何被执行。
在译码后的识别矢量中，令分段的权重w是从该分段中译码的信息数据的数目。假设有m个主拷贝，则对于每个分段，0、＜w、＜m。权重为0的分段在匹配过程中没有提供信息，因为匹配是不可能的。类似地，权重m的分段在匹配过程中没有提供信息，因为匹配总是可能的。
优选的译码策略是，对于每个接收者，对在接收者的识别矢量与译码的识别矢量之间的匹配的数目进行计数，这里只集中在权重1≤w＜m的分段。如果对于特定的接收者的识别矢量的匹配的数目大于或等于阈值t，则那个接收者可被指责为参与盗版。接着跟随的是一个通过计算t以保证规定的虚假确信率p的方法。
对于1≤w＜m，令cw是在译码的识别矢量中权重w的分段数，即，从中已译码w个识别数据的分段数。
这样，l=Σw=1m-1cw]]>代表权量1≤w＜m的分段的总数。
对于1≤w＜m，令Bw～Bin(cw，w/m)。对于在译码的识别矢量中权重为w的任一分段，它与在独立的随机识别矢量中相应的分段相匹配的概率是w/m。由于在译码的识别矢量中有cw个这样的分段，所以当只考虑权重w的分段时，Bw代表在译码后的识别矢量与独立的随机识别矢量之间匹配的数目的二项式概率分布。
对于任何随机识别矢量(与译码的识别矢量无关)，令A是一个随机变量，它代表当只考虑译码的识别矢量中权重1≤w＜m的分段时，在随机识别矢量与译码的识别矢量之间匹配的数目。于是P(A=a)=Σ0≤b1≤c10≤b2≤c2s.t.b1+b2+···+bm-1=a0≤bm-1≤cm-1···P(B1=b1)P(B2=b2)···P(Bm-1=bm-1).]]>如果总数(population)具有大小y，则阈值t可被计算为最小的正整数，以使得Σa=llP(A=a)≤py,]]>其中虚假确信率是p。
现在将描述另一个可能的算法。有利的是，把更大的重要性与一个权重的分段的匹配相联系，而不是与另一个权重的的分段相匹配。所以，希望能有一个用于计算匹配数目的加权的和值。对于1≤w＜m，令αw是正整数。
对于任意识别矢量V，令cw，V是在译码的识别矢量中与在V中相应的分段相匹配的、权重为w的分段的数目(对于1≤w＜m)。然后令用于计算匹配数目的加权的和值是应当指出，当αw＝1时，对于1≤w＜m，这等价于以前的策略。
对于任何随机识别矢量(与译码的识别矢量无关)，令A是随机变量，它代表当只考虑译码的识别矢量中权重1≤w＜m的分段时，在随机识别矢量与译码的识别矢量之间匹配的加权和。于是P(A=a)=Σ0≤b1≤c10≤b2≤c2s.t.α1b1+α2b2+···+αm-1bm-1=a0≤bm-1≤cm-1···P(B1=b1)P(B2=b2)···P(Bm-1=bm-1).]]>如果总数具有尺寸y，则阈值t可被计算为最小的正整数，以使得Σa=llP(A=a)≤py,]]>其中虚假确信率是p。
测试表明，使用匹配计数的加权的和值比起非加权的匹配计数来说，有时略好而有时更坏。当然，有可能使用非加权的和多重加权的和值来执行许多测试。在这种情形下，对于每次测试，虚假确信率p必须被减小，以使得来自所有的测试的总的组合的虚假确信率足够低。
实验结果表明，对于1≤w＜m，αw=m2m-w+1]]>的加权其结果良好。
在不存在串通的情形下，加权和非加权译码策略是等价的，且都工作得非常好。例如，对于(i)只有两个主拷贝，(ii)10000个接收者，(iii)120个分段(例如，2小时电影，每个分段1分钟)，和(iv)10-8的虚假确信率，当只有40个分段产生分段识别数据时，就有可能成功地检测出盗版的拷贝的来源。对于4个主拷贝，为了确定盗版的拷贝的来源，只需要20个分段产生分段识别数据。
然而，串通使得情形变得错综复杂得多。很难确定一组串通者应当采取的最好的串通策略。在不考虑基础指纹技术的串通应答的情况下，串通者的一个策略是这样一种生成识别矢量，它的每个分段至多只有一个识别数据。如果分段模式是已知的(或可被确定的)，则串通者可以简单地通过从他们可得到的已有拷贝中选择不同的分段而形成一个攻击的拷贝(例如，如果有z个串通者，则攻击的版本中1/z个分段来自每个串通者)。
所以，重要的是，攻击者不能够确定电影的哪些部分构成分段。所以，编码方式最好应当这样来规定，即(i)使用大量分段，和(ii)用电影上伪随机地分布的更小的部分来形成每个分段(如以上图4所示的)。这应当使得攻击者隔离开各个分段成为不可能或至少非常困难，这意味着，每个分段将会以所有的或然率产生一个以上的分段识别数据。
替代地，串通者可以选择比如说把帧合在一起取平均的更惯用的串通攻击。在这样的方法中，对基础指纹技术的串通应答是重要的。对于给定的分段，指纹检测器有希望检测到某些或全部分段识别数据。随着分段输入数据内容的数目增加，检测作为盗版的拷贝的来源的用户，会变得更加容易。然而，如果有足够多的串通者，则这样的攻击使得检测器无法在分段的间隔内检测到任何识别数据。所以，重要的是分段足够长，从而足以经受得住预期的攻击(假如是串通或更一般的处理，诸如压缩、改变尺寸等等)。
在(i)保证分段足够长以允许指纹检测器检测出分段识别数据与(ii)保证有尽可能多的分段使得尽可能难地得出分段模式之间必须作出折衷。
减小总数的大小也有助于改进译码。生成一组加指纹的主拷贝后，分段的复接操作就可开始产生用于分发的加指纹的拷贝。同时，随着背景处理，可以生成新的加指纹的主拷贝组。一旦完成这一点，就可以使用这些主拷贝作为替代。这有效地减小了每个主拷贝组的总分发数的大小。替换地，在使用老的主拷贝以外还可以使用新的主拷贝。由此，增加了用于将来的拷贝的主拷贝数目。这个过程将在下面参照图10进行描述。
在不是每个分段产生输入数据内容的情形下(这或许是因为处理操作或摄像机盗版被应用到内容上)，现在将描述通过使用聚集的分段以试图从这些分段得出识别数据的技术。当然，这假设分段曾经打算载有识别数据。从分段模式和主拷贝的性质(即，一个主拷贝是未加指纹的文件吗？)，将能获知对于每个分段是否预期有识别数据。这确实指出使用所有的加指纹的主拷贝(而不是一个未加标记的加指纹的主拷贝)的优点，因为预期每个分段将载有某种识别数据。
参照图9，在步骤600，分析分段以搜寻识别数据。在步骤610，进行关于所有的分段是否至少产生一个识别数据的检测。如果这是真实的，则处理过程(有关于分析分段)结束。如果这不真实的，则控制进到步骤620。
在步骤620，对于那些预期会有识别数据但还没有得到识别数据的分段进行是否可被聚集的检测。基本上，这个问题可被看作为检测一个以上的分段是否没有按预期地产生识别数据。
如果回答是“否”，即，只有一个这样的分段，于是处理过程结束。如果回答是“是”，则控制处理过程进到步骤630，在该步骤630，未成功译码的分段被聚集。
聚集分段的处理可以以几个阶段实现。例如，如果几个分段预期载有识别数据但在译码时没有产生这样的识别数据，则分段可被成对地组合成任意的编组(或许，不成功地译码的分段的临时相邻的那些对可被组合)。在这种情形下，如果有奇数个分段，则其中的一个对可以由三个分段的组组成。或例如可以应用不同的法则，以使得不成功地译码的分段被聚集成三个分段的组，等等。聚集的分段然后被传送回步骤600，以用于重复分析，以便试图检测识别数据。
当然，有可能是，组成一个聚集的分段的那些不成功地译码的分段正好都载有相同的识别数据。在这种情形下，分段聚集将意味着译码器更可能检测识别数据。(通常，加指纹的视频材料的分段越长，译码器越可能检测到识别数据。)如果分段没有载有相同的识别数据，则仍旧有机会靠聚集分段来帮助检测，或替换地，随着组成聚集分段的初始分段的组变大，更有可能在两个或多个初始分段中载有相同的识别数据。
所以，在进行一个阶段的聚集分段后，如果仍有两个或多个不成功译码的(聚集的)分段，则可进行另一个聚集的阶段。这可以以迭代方式重复进行，直至只留下一个不成功译码的聚集的分段为止。
图10示意地显示另一个生成主拷贝的操作。在本例中，使用三个并行指纹编码器，称为编码器1、2和3。图10被划分成四列，显示在最左面三列上编码器1、2和3的运行，以及在最右面一列上组合器/刻录机装置(80、110、或90、120)。
在编码的第一阶段，编码器生成三个主拷贝M1、M2、M3。这三个主拷贝被组合，并从这三个主拷贝产生DVD。
一旦产生三个主拷贝，编码器然后就可任意产生三个另外的主拷贝M4、M5、M6。在准备这些另外的主拷贝的期间，由组合器/刻录机产生的DVD基本上只根据M1到M3。然而，一旦另外的主拷贝M4到M6是可提供的，组合器/刻录机有可能根据以下各项来产生版本·只是主拷贝M4到M6·全部的M1到M6，或·它们的任何排列组合处理过程可以迭代地继续进行。通常，通过使用当前的技术，预期要花费在产生一个加指纹的主拷贝时的十倍时间来完成单个输出版本的组合和写入。
虽然本发明的说明性实施例在这里是参照附图详细说明的，但应当看到，本发明并不限于这些精确的实施例，以及可以由本领域技术人员作出各种改变和修正，而不背离如附属权利要求规定的本发明的范围和精神。
权利要求
1.检测输入数据内容的版本的方法，所述数据内容有多个不同的版本，其中所述数据内容按照分段模式被安排为两个或多个分段；以及所述数据的所述版本通过相应的识别数据模式是可识别的，按照所述的相应的识别数据模式，至少一些所述分段具有各自的识别数据；所述方法包括以下步骤(i)对于所述输入数据内容的所述分段检测所述识别数据；(ii)对所述检测的识别数据与相应于所述数据内容的所述不同的版本的所述识别数据模式进行比较；以及(iii)如果在所述检测的识别数据与一个确定的版本的所述识别数据模式之间的得到的匹配的数目之和超过阈值数，则检测所述输入数据内容是否包括来自所述数据内容的所述确定的版本的至少一个组成部分。
2.按照权利要求1的方法，包括从对于所述输入数据内容的所述分段检测到的所述识别数据中得出所述阈值数的步骤。
3.按照权利要求2的方法，其中所述阈值数取决于对于所述输入数据内容的每个所述分段检测到所述识别数据的多少个事例。
4.按照权利要求3的方法，其中所述阈值数目被设置为，在对于输入数据内容的每个分段所检测到的识别数据的事例数目被给定为多少个的情况下，使得输入数据内容被不正确地检测为一个确定的版本的统计机会小于一个阈值概率。
5.按照权利要求1的方法，还包括以下步骤按照对于所述输入数据内容的该分段检测到所述识别数据的多少个事例，来对对于在所述输入数据内容的一个所述分段检测到的所述识别数据之间的匹配进行加权，所述匹配的和值是匹配的加权和值。
6.按照权利要求5的方法，其中所述加权步骤是使得一个其中检测到所述识别数据的多个事例的分段，比起一个其中检测到所述识别数据的单个事例的分段，对于所述匹配的加权和值有更多贡献。
7.按照权利要求5的方法，其中所述加权步骤是使得一个其中检测到所述识别数据的多个事例的分段，比起一个其中检测到所述识别数据的单个事例的分段，对于匹配的所述加权和值有更少贡献。
8.按照权利要求1的方法，还包括以下步骤如果对于所述输入数据内容的两个或多个所述分段上没有检测到识别数据，则把这些分段组合成两个或多个所述分段的组，并且对于所述分段的所述组合的组检测所述识别数据。
9.按照权利要求8的方法，还包括以下步骤如果在所述输入数据内容的两个或多个所述分段上没有检测到识别数据，则把所述分段的所述组迭代地组合成所述分段的更大的组，并且对于所述分段的所述组合的组检测所述识别数据。
10.按照权利要求1的方法，其中所述阈值数代表一个小于所述分段总数的所述分段数。
11.按照权利要求10的方法，其中所述阈值数代表小于所述分段总数的所述分段数，所述分段具有按照一个所述识别数据模式的所述相应的识别数据。
12.按照权利要求1的方法，其中所述数据内容的所述版本是通过所述相应的识别模式而可识别的，所有的所述分段依据所述相应的识别模式基本上具有所述各自的识别数据。
13.把识别数据应用到输入数据内容的方法，所述方法包括以下步骤(i)生成所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例所载有的所述各自的识别数据是独特的；以及(ii)通过从所述n个事例中选择分段而生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有来自所述事例的识别数据；接着是以下步骤的一次或多次迭代(iii)生成所述输入数据内容的m个另外的事例，其中m是1或大于1，每个所述m个事例载有各自对于所有其他所述事例独特的识别数据；以及(iv)通过从所述m个事例中选择分段来生成所述输入数据内容的另外的版本，一组所述事例包括所述m个事例或所有的所述生成的事例，从而按照一个相关的识别数据模式，所述输入数据内容的每个版本载有来自所述事例的识别数据。
14.按照权利要求13的方法，其中，在步骤(i)中，全部所述事例载有对于其他所述事例是独特的各自的识别数据。
15.按照权利要求13的方法，其中步骤(iv)包括通过从所述m个事例中选择分段而生成所述输入数据内容的所述另外的版本。
16.按照权利要求13的方法，其中步骤(iv)包括通过从包含所述m个事例的一组所述事例中选择分段而生成所述输入数据内容的所述另外的版本。
17.按照权利要求16的方法，其中步骤(iv)包括通过从所有的所述生成的事例中选择分段而生成所述输入数据内容的所述另外的版本。
18.把识别数据应用到输入数据内容的方法，所述方法包括以下步骤(i)提供所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例所载有的所述各自的识别数据是独特的；以及(ii)通过从所述n个事例中按预定的分段模式选择分段来生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有来自所述事例的识别数据；其中所述分段模式使得在所述输入数据内容内至少一个所述分段是不相邻的。
19.按照权利要求18的方法，其中至少大多数所述分段包括两个或多个非相邻的子组。
20.按照权利要求1的方法，其中所述数据内容包括具有多个接连的图像的视频内容。
21.按照权利要求20的方法，其中所述识别数据被编码在代表至少一些所述图像的所述数据内。
22.按照权利要求21的方法，其中所述识别数据被编码在至少一些所述图像的空间频率分量的子集内。
23.按照权利要求13的方法，其中所述数据内容包括具有多个接连的图像的视频内容。
24.按照权利要求23的方法，其中所述识别数据被编码在代表至少一些所述图像的所述数据内。
25.按照权利要求24的方法，其中所述识别数据被编码在至少一些所述图像的空间频率分量的子集内。
26.按照权利要求18的方法，其中所述数据内容包括具有多个接连的图像的视频内容。
27.按照权利要求26的方法，其中所述识别数据被编码在代表至少一些所述图像的所述数据内。
28.按照权利要求27的方法，其中所述识别数据被编码在至少一些所述图像的空间频率分量的子集内。
29.具有用于实行按照权利要求1的方法的程序代码的计算机软件。
30.用以提供按照权利要求29的软件的媒体。
31.按照权利要求30的媒体，所述媒体是存储媒体。
32.按照权利要求30的媒体，所述媒体是传输媒体。
33.具有用于实行按照权利要求13的方法的程序代码的计算机软件。
34.用以提供按照权利要求33的软件的媒体。
35.按照权利要求34的媒体，所述媒体是存储媒体。
36.按照权利要求34的媒体，所述媒体是传输媒体。
37.具有用于实行按照权利要求18的方法的程序代码的计算机软件。
38.用以提供按照权利要求37的软件的媒体。
39.按照权利要求38的媒体，所述媒体是存储媒体。
40.按照权利要求38的媒体，所述媒体是传输媒体。
41.用于检测输入数据内容的版本的设备，所述数据内容有多个不同的版本，其中所述数据内容按照分段模式被安排成两个或多个分段；以及所述数据内容的所述版本是可以通过相应的识别模式识别的，其中至少某些所述分段依据所述相应的识别模式而具有各自的识别数据；所述设备包括识别数据检测器，用来对于所述输入数据内容的所述分段检测识别数据；比较器，用来比较所述检测的识别数据与相应于所述数据内容的所述不同版本的所述识别数据模式；以及贡献检测器，用于当在所述检测的识别数据与一个确定的版本的所述识别数据模式之间获得的匹配数之和超过一个阈值数，则检测所述输入数据内容将包括至少来自所述数据内容的所述那个确定的版本的贡献。
42.用于把识别数据应用到输入数据内容的设备，所述设备包括(i)事例生成器，用来生成所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例载有的所述各自的识别数据是独特的；以及(ii)版本生成器，用来通过从所述n个事例选择分段而生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有所述事例的识别数据；(iii)事例生成器控制器，用于控制所述事例生成器去生成所述输入数据内容的m个另外的事例，其中m是1或大于1，所述m个事例载有各自的识别数据，它对于所有其他所述事例是独特的；以及(iv)版本生成器控制器，用于控制所述版本生成器通过从所述m个事例中选择分段而生成所述输入数据内容的另外的版本，一组所述事例包括所述m个事例或所有的所述生成的事例，从而按照一个相关的识别数据模式，所述输入数据内容的每个版本载有来自所述事例的识别数据。
43.用于把识别数据应用到输入数据内容的设备，所述设备包括(i)提供器，用来提供所述输入数据内容的n个事例，其中n大于1，至少除了一个以外的所有的所述事例载有各自的识别数据，载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例载有的所述各自的识别数据是独特的；以及(ii)版本生成器，用于通过从所述n个事例中按预定的分段模式选择分段而生成所述输入数据内容的版本，从而按照一个相关的识别数据模式，所述输入数据内容的每个所述版本载有所述事例的识别数据；其中所述分段模式使得至少一个所述分段在所述输入数据内容内是不相邻的。
44.载送具有相关的识别数据的数据内容的存储媒体，所述数据内容包括按照预定的分段模式的分段，所述分段载有按照相关的数据模式的各自的识别数据，其中所述分段模式使得在所述输入数据内容内至少一个所述分段是不相邻的。
45.按照权利要求36的存储媒体组，所述组的每个所述存储媒体载送按照所述预定的分段模式的相同的数据内容，所述识别数据模式在所述组中的每个所述存储媒体之间是不同的。
全文摘要
检测输入数据内容的版本的方法，所述数据内容有多个不同的版本，其中所述数据内容按照分段模式被安排为两个或多个分段；以及所述数据的所述版本通过相应的识别数据模式是可识别的，为此至少某些所述分段具有相应的识别数据；所述方法包括以下步骤(i)对于所述输入数据内容的所述分段检测所述识别数据；(ii)把所述检测的识别数据与相应于所述数据内容的所述不同版本的所述识别数据模式进行比较；以及(iii)如果在所述检测的识别数据与某个版本的所述识别数据模式之间得到的匹配数超过阈值，则检测所述输入数据内容是否包括来自所述数据内容的某个版本的至少一个贡献。
文档编号G06T1/00GK1577391SQ20041005455
公开日2005年2月9日申请日期2004年7月23日优先权日2003年7月23日
发明者J·C·佩尔利, D·W·塔普森, M·J·鲁斯塞尔申请人:索尼英国有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.C.佩尔利;D.W.塔普森;M.J.鲁斯塞尔
技术所有人：索尼英国有限公司
我是此专利的发明人

上一篇：电子装置的制作方法
上一篇：使用x－标记保持图像平滑度和锐度的自适应半色调方案的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。