视频的处理方法和装置与流程

文档序号：13763893阅读：239来源：国知局

本发明涉及视频处理领域，具体而言，涉及一种视频的处理方法和装置。

背景技术：

随着互联网技术的发展，成千上万的视频被上传到网络。然而，这些视频中的相当数量是非法拷贝，或是现有媒体的修改版本。这广泛的视频版权侵犯使得视频版权管理在互联网上成为一个复杂的过程，大大加速最近要求快速和准确的复制检测算法的发展。视频拷贝探测任务是确定一个给定的视频是否为视频资料的复制版本。一般来说，视频指纹是最广泛使用的方法对视频拷贝检测保护未经授权使用数字视频。视频指纹基本上是一个基于内容的签名，该签名来自原创视频片段，这样视频指纹可以代表视频在许多小型高效的搜索和匹配过程。最传统的视频指纹识别算法可以根据提取的特征包括色彩空间、时间和空间。这几种方法都有不足的地方，例如，对于第一类，基于颜色空间的指纹主要来源于颜色直方图的区域内的时间和/或空间视频，并且RGB图像通常转成YUV(Y表示明亮度，也就是灰阶值；U和V表示的是色度，作用是描述影响色彩及饱和度，用于指定像素的颜色)和LAB色彩空间。但是，采用色彩空间对视频进行处理时，黑白的视频没有颜色，就无法用色彩空间的方法来提取视频指纹，导致利用视频指纹在识别视频时不准确的技术问题。

针对上述的问题，目前尚未提出有效的解决方案。

技术实现要素：

本发明实施例提供了一种视频的处理方法和装置，以至少解决利用视频指纹在识别视频时不准确的技术问题。

根据本发明实施例的一个方面，提供了一种视频的处理方法，包括：获取目标视频的关键帧；根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列，其中，所述目标编码序列用于表示所述目标视频基于时空特性的图像序列，将所述目标编码序列作为所述目标视频的视频指纹；利用所述视频指纹与参考视频库中视频的视频指纹进行比对；若比对出所述视频指纹与所述参考视频库中的第一视频的视频指纹一致，则确定出所述目标视频与所述第一视频为相同的视频。

根据本发明实施例的另一方面，还提供了一种视频的处理装置，包括：获取单元，用于获取目标视频的关键帧；第一提取单元，用于根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列，其中，所述目标编码序列用于表示所述目标视频基于时空特性的图像序列，将所述目标编码序列作为所述目标视频的视频指纹；比对单元，用于利用所述视频指纹与参考视频库中视频的视频指纹进行比对；确定单元，用于在比对出所述视频指纹与所述参考视频库中的第一视频的视频指纹一致时，确定出所述目标视频与所述第一视频为相同的视频

在本发明实施例中，获取目标视频的关键帧；根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列，其中，所述目标编码序列用于表示所述目标视频基于时空特性的图像序列，将所述目标编码序列作为所述目标视频的视频指纹；利用所述视频指纹与参考视频库中视频的视频指纹进行比对；若比对出所述视频指纹与所述参考视频库中的第一视频的视频指纹一致，则确定出所述目标视频与所述第一视频为相同的视频。由于该视频指纹是视频在变换域中的特性，不受图片的色彩的影响，因此，黑白的视频也能获得该视频的关键帧的视频指纹，使得获得视频指纹可以准确的表达目标视频，解决了现有技术中表达目标视频不准确的问题，达到了准确表达目标视频的效果。并且，扩大了获取视频指纹的视频文件的范围，使得上述方式可以更广泛的应用在多种视频中。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种网络架构的示意图；

图2是根据本发明实施例的视频的处理方法的流程图；

图3是根据本发明实施例的分解图像的示意图；

图4是根据本发明实施例的4个尺度的测试图像的示意图；

图5是根据本发明实施例的进行分解和编码的示意图；

图6是根据本发明实施例的视频识别的流程图；

图7是根据本发明实施例的视频的处理装置的示意图；

图8是根据本发明实施例的服务器的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例，提供了一种可以通过本申请装置实施例执行的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

根据本发明实施例，提供了一种视频的处理方法。

可选地，在本实施例中，上述视频的处理方法可以应用于如图1所示的终端102和服务器104所构成的硬件环境中。如图1所示，终端102通过网络与服务器104进行连接，上述网络包括但不限于：移动通信网络、广域网、城域网或局域网，终端102可以是手机终端，也可以是PC终端、笔记本终端或平板电脑终端。

图2是根据本发明实施例的视频的处理方法的流程图，以下结合图2对本发明实施例所提供的视频的处理方法做具体介绍，如图2所示，该视频的处理方法主要包括如下步骤：

步骤S202，获取目标视频的关键帧。在识别视频之前，先要确定出目标视频的关键帧。目标视频的关键帧可以采用时域信息代表图像算法(Temporal Information Representative Image，简称为TIRI)来提取。具体的提取方法在后文详细说明。

步骤S204，根据关键帧在多尺度变换域上的表达信息提取关键帧的目标编码序列，其中，目标编码序列用于表示目标视频基于时空特性的图像序列，将目标编码序列作为目标视频的视频指纹。

在本实施例中，采用稳定小波变换(Stationary Wavelet Tranform，简称SWT)来获取目标编码序列。一般来说，如果一张普通的图像被劣化，低尺度上的线性关系会被保留，但是在高尺度上会被干扰，尤其是高精细尺度。基于此，SWT具有多尺度分析的特性，并且，SWT可以克服离散小波变换(Discrete Wave Transform,简称DWT)的时移不变性。具体地，时移不变性采用无下采样的滤波设计算法。

图3示出了SWT的实现过程。如图3所示，先对输入的图像进行两通道无下采样的分解，然后递归的将分解后的图像再次进行分解，分解成低通的图像和高通的图像。按照下面的条件下可以比较容易的获得上述分解：

H₀(z)G₀(z)+H₁(z)G₁(z)＝1，其中，H₀(z)和H₁(z)分别是低通滤波器和高通滤波器的变换函数。

图4示出了SWT的4个尺度的测试图像。其中，图像S4是在第一次分解进程中的高通图像，图像S1是在最后一次分解中的低通图像。基本上，S1尺度至S4尺度分表代表不同的频段低尺度的信息(低频)和高尺度的更多细节信息(高频)。

以下结合图5对本实施例的提取目标编码序列进行说明。

首先，对输入的图像f(m,n)进行SWT分解，得到低通图像和高通图像。其中，低通图像采用H₀(z)表达，高通图像用H₁(z)表达。输入的图像f(m,n)是本实施例中的关键帧，该关键帧采用N×N的矩阵表达。

然后，对分解后得到的低通图像H₀(z)再次进行分解，同样得到高通图像H₁(z²)和低通图像H₀(z²)。对低通图像H₀(z²)再次进行分解，得到高通图像H₁(z⁴)和低通图像H₀(z⁴)。

在完成上述三次分解之后，得到S1尺度上的低通图像H₀(z⁴)、S2尺度上的高通图像H₁(z⁴)、S3尺度上的高通图像H₁(z²)和S4尺度上的高通图像H₁(z)。

对上述4个尺度中的S2尺度上表达的图像(即第二分解图像)和S1尺度上表达的图像(即第一分解图像)进行下采样。

即，提取关键帧的目标编码序列包括：利用稳定小波变换对关键帧进行分解，得到在S1尺度上表达的第一分解图像和在S2尺度上表达的第二分解图像；对第一分解图像进行编码处理得到第一编码序列，对第二分解图像进行编码处理得到第二编码序列；连接第一编码序列和第二编码序列，得到目标编码序列。

即，对第一分解图像进行编码处理得到第一编码序列，对第二分解图像进行编码处理得到第二编码序列包括：对第一分解图像进行下采样处理得到采用第一矩阵表示的图像，对第二分解图像进行下采样处理得到采用第二矩阵表示的图像；对第一矩阵进行哈希编码得到第一编码序列，对第二矩阵进行哈希编码得到第二编码序列。

具体地，在进行分解的过程中，表达第一分解图像和第二分解图像的矩阵始终为N×N，通过下采样之后，将S2尺度上表达第二分解图像的矩阵和S1尺度上表达第一分解图像的矩阵变为更小的M×K的矩阵。具体地，将S1尺度上的图像变成M₁×K₁矩阵(即第一矩阵)进行表达，将S2尺度上的图像变成M₂×K₂矩阵(即第二矩阵)进行表达。通常情况下M₁与K₁相等或者不等，M₂与K₂相等或者不等。在本实施例中采用M₁＝K₁＝M₂＝K₂＝M。

对下采样后的图像进行哈希编码。即，对第一矩阵进行哈希编码得到第一编码序列包括：获取第一矩阵的中值；判断第一矩阵中每个元素与中值的差值；将第一矩阵中差值大于0所对应的元素的值设为1，将第一矩阵中差值小于0所对应的元素的值设为0；依次连接相邻的两个元素，得到第一编码序列，其中，第一编码序列为0、1的组合。

具体地，S1尺度上的图像的哈希编码方式与S2尺度上的图像的哈希编码的方式相同。以S1尺度上的图像为例进行说明。

获取第一矩阵M₁×K₁的中值。将这个中值作为阀值，并用M₁×K₁中的每个元素与这个阀值进行比较，对于那些元素值大于阀值的元素，将这些元素的值替换为1；对于那些元素值小于阀值的元素，将这些元素的值替换为0。经过上述比较过程，将M₁×K₁变换为由0和1组成的矩阵。由于在本实施例中，采用M₁＝K₁＝M₂＝K₂＝M，因此，得到的矩阵为M×M的矩阵。

对S2尺度上的图像做同样的变换，此处不再赘述。

将M×M的矩阵进行蛇形扫描，如图5所示，按照图5的箭头的方向扫描矩阵中的元素，将矩阵变成一维的序列。对S1尺度上的M×M的矩阵进行蛇形扫描，得到第一编码序列；对S2尺度上的M×M的矩阵进行蛇形扫描，得到第二编码序列。将第一编码序列和第二编码序列连接在一起，就得到了目标编码序列。该目标编码序列就可以作为目标视频的视频指纹。连接的方式可以是第一编码序列和第二编码序列首尾相连。

在选择参数的过程中，S1尺度上哈希编码的长度应该大于31比特，因为，在该长度下可以获得比较低的误报率(false positive rate)。基于此，上述的输入图像(关键帧)的矩阵中N＝128，下采样后S1尺度和S2尺度上表达图像的第一矩阵和第二矩阵中M＝6。因此，第一编码序列和第二编码序列的长度为36比特，因此，目标编码序列的长度为72比特。

步骤S206，利用视频指纹与参考视频库中视频的视频指纹进行比对。

步骤S208，若比对出视频指纹与参考视频库中的第一视频的视频指纹一致，则确定出目标视频与第一视频为相同的视频。

参考视频库中的视频也采用上述方法获得视频指纹，由于该视频指纹是视频在变换域中的特性，不受图片的色彩的影响，因此，黑白的视频也能获得该视频的关键帧的视频指纹，使得获得视频指纹可以准确的表达目标视频，解决了现有技术中表达目标视频不准确的问题，达到了准确表达目标视频的效果。并且，扩大了获取视频指纹的视频文件的范围，使得上述方式可以更广泛的应用在多种视频中。

在获取到视频指纹后，可以利用视频指纹判断目标视频是否为拷贝的视频，还可以通过与参考视频库中的视频比较后确定出目标视频的名称等信息，视频指纹还可以应用在除了版权检测、视频识别以外，还可以引用在视频归类等其他场景。以下分别在版权检测和视频识别两个场景下进行说明。在以下场景中，都采用上述方式获取视频指纹。

场景一：

在确定出目标视频与第一视频为相同的视频之后，发出第一指示信息，其中，第一指示信息用于指示目标视频为第一视频的拷贝文件。

参考视频库中存储了非拷贝视频，在比较出目标视频与参考视频库中的某个视频具有相同的视频指纹时，确定出该目标视频为拷贝视频。由于参考视频库中的视频为非拷贝视频，且这些视频可以通过视频播放应用程序进行播放，但是不能通过视频播放应用程序进行下载，因此，与该参考视频库中的视频具有相同视频指纹的目标视频就是拷贝视频。

基于此可以实现对视频文件的版权保护，以下结合图6进行说明。

S601，在参考视频库中存储大量受版权保护的正版视频。

S602，参考视频库中的每个视频都具有视频指纹。参考视频库中的视频指纹的提取方法与上述提取视频指纹的步骤相同，不再赘述。

S603，对视频指纹进行哈希编码。

S604，将哈希编码存储到数据库中。

S605，获取目标视频的视频片段，该视频片段可以是上述的关键帧。

S606，提取视频片段的视频指纹。

S607，对视频片段的视频指纹进行哈希编码。

S608，在数据库中搜索与视频片段的视频指纹相匹配的参考视频库中视频的视频指纹。

S609，在匹配到视频指纹后，确定该视频片段所属的视频为没有版权的拷贝视频。

在图6所示的系统中，采用TIRI(Temporal Informative Representative Image)来获取视频片段，即获取目标视频的关键帧,TIRI可以获取视频的时域特性，利用该时域特性生成视频指纹。

因此，在前期处理的过程中需要将视频图像分成多个部分，每个部分具有S个图像。一版来说，TIRI通过计算这S个图像的平均权重值得到。基本上，TIRI是一个模糊图像，该图像包括视频序列中可能存在的运动信息。生成TIRI的过程可以采用如下公式：

$<mrow> <msub> <msup> <mi>p</mi> <mo>′</mo> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> </msub> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>S</mi> </munderover> <msub> <mi>w</mi> <mi>i</mi> </msub> <msub> <mi>p</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>i</mi> <mo>)</mo> </mrow> </msub> </mrow>$

其中，p_(x,y,i)是S个图像中第i个图像在(x,y)th轴上的亮度值，w是一个加权因子，可以是常数、线性数和指数。实验数据表明，指数可以具有更好的获取运动信息的能力。因此，在图6所示的CBCD(Content-based Copy Detection System，基于内容的拷贝探测系统)中，指数采用w_i＝βⁱ，且β＝0.65。在图6所示的CBCD系统中，获取视频指纹时采用本实施例提供的视频指纹的获取方法来得到。

在本实施例中，健壮的CBCD系统达到精度(分辨率)和召回率(鲁棒性)的平衡。本实施例采用F_λ作为一个综合指标来衡量CBCD系统的性能，其中，F_λ被定义为：

$<mrow> <msub> <mi>F</mi> <mi>λ</mi> </msub> <mo>=</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <msup> <mi>λ</mi> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mfrac> <mrow> <mi>p</mi> <mo>*</mo> <mi>r</mi> </mrow> <mrow> <msup> <mi>λ</mi> <mn>2</mn> </msup> <mi>p</mi> <mo>+</mo> <mi>r</mi> </mrow> </mfrac> </mrow>$

其中，λ是精度和召回率的组合的权重，p表示精度，r表示召回率。在本实施例中，当λ取1时可以获得精度和召回率的平衡。

进一步地，探测和定位视频片段的拷贝是CBCD系统的两个主要功能。探测的主要目的是检测任何复制的参考视频片段，定位的主要目的是定位复制段匹配的视频。CBCD系统的检测错误率低于0.01％。

通常定位拷贝视频片段的准确率可以反映系统的探测性能，并且可以确定有多少定位请求被准确定位，本实施例中CBCD系统的平均准确率在98％左右。

场景二：

在确定出目标视频与第一视频为相同的视频之后，提取参考视频库中第一视频的视频名称和第一视频的播放路径；推送视频名称和播放路径。

推送视频名称和播放路径的方式可以应用在即时通讯应用客户端、视频客户端和视频直播客户端等，通过拍摄一段视频(目标视频)上传到服务器中，服务器利用上传的目标视频在参考视频库中查找视频，若查找到目标视频与参考视频中的某个视频为相同的视频，可以推送参考视频中第一视频的名称和播放路径。

通过视频播放客户端或者浏览器客户端等可以播放视频的应用程序客户端来按照上述播放路径播放目标视频所对应的完整视频。这样，在用户看到一个视频的片段但是并不知道该视频的名称和播放路径时，可以播放该视频的片段所对应的完整视频。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

根据本发明实施例，还提供了一种用于实施上述视频的处理方法的视频的处理装置，该视频的处理装置主要用于执行本发明实施例上述内容所提供的视频的处理方法，以下对本发明实施例所提供的视频的处理装置做具体介绍：

图7是根据本发明实施例的视频的处理装置的示意图，如图7所示，该视频的处理装置主要包括：

获取单元10用于获取目标视频的关键帧。在识别视频之前，先要确定出目标视频的关键帧。目标视频的关键帧可以采用时域信息代表图像算法(Temporal Information Representative Image，简称为TIRI)来提取。

第一提取单元20用于根据关键帧在多尺度变换域上的表达信息提取关键帧的目标编码序列，其中，目标编码序列用于表示目标视频基于时空特性的图像序列，将目标编码序列作为目标视频的视频指纹。

在本实施例中，采用稳定小波变换(Stationary Wavelet Tranform，简称SWT)来获取目标编码序列。一般来说，如果一张普通的图像被劣化，低尺度上的线性关系会被保留，但是在高尺度上会被干扰，尤其是高精高尺度。基于此，SWT具有多尺度分析的特性，并且，SWT可以克服离散小波变换(Discrete Wave Transform,简称DWT)的时移不变性。具体地，时移不变性采用无下采样的滤波设计算法。

H₀(z)G₀(z)+H₁(z)G₁(z)＝1，其中，H₀(z)和H₁(z)分别是低通滤波器和高通滤波器的变换函数。

以下结合图5对本实施例的提取目标编码序列进行说明。

在完成上述三次分解之后，得到S1尺度上的低通图像H₀(z⁴)、S2尺度上的高通图像H₁(z⁴)、S3尺度上的高通图像H₁(z²)和S4尺度上的高通图像H₁(z)。

对上述4个尺度中的S2尺度上表达的图像(即第二分解图像)和S1尺度上表达的图像(即第一分解图像)进行下采样。

可选地，提取单元包括：分解子单元，用于利用稳定小波变换对关键帧进行分解，得到在S1尺度上表达的第一分解图像和在S2尺度上表达的第二分解图像；处理子单元，用于第一分解图像进行编码处理得到第一编码序列，对第二分解图像进行编码处理得到第二编码序列；连接子单元，用于连接第一编码序列和第二编码序列，得到目标编码序列。

可选地，处理子单元包括：采样模块，用于对第一分解图像进行下采样处理得到采用第一矩阵表示的图像，对第二分解图像进行下采样处理得到采用第二矩阵表示的图像；编码模块，用于对第一矩阵进行哈希编码得到第一编码序列，对第二矩阵进行哈希编码得到第二编码序列。

具体地，在进行分解的过程中，表达第一分解图像和第二分解图像的矩阵始终为N×N，通过下采样之后，将S2尺度上表达第二分解图像的矩阵和S1尺度上上表达第一分解图像的矩阵变为更小的M×K的矩阵。具体地，将S1尺度上的图像变成M₁×K₁矩阵(即第一矩阵)进行表达，将S2尺度上的图像变成M₂×K₂矩阵(即第二矩阵)进行表达。通常情况下M₁与K₁相等或者不等，M₂与K₂相等或者不等。在本实施例中采用M₁＝K₁＝M₂＝K₂＝M。

对下采样后的图像进行哈希编码。即，编码模块包括：获取子模块，用于获取第一矩阵的中值；判断子模块，用于判断第一矩阵中每个元素与中值的差值；设置子模块，用于将第一矩阵中差值大于0所对应的元素的值设为1，将第一矩阵中差值小于0所对应的元素的值设为0；连接子模块，用于依次连接相邻的两个元素，得到第一编码序列，其中，第一编码序列为0、1的组合。

具体地，S1尺度上的图像的哈希编码方式与S2尺度上的图像的哈希编码的方式相同。以S1尺度上的图像为例进行说明。

获取第一矩阵M₁×K₁中值。将这个中值作为阀值，并用M₁×K₁中的每个元素与这个阀值进行比较，对于那些元素值大于阀值的元素，将这些元素的值替换为1；对于那些元素值小于阀值的元素，将这些元素的值替换为0。经过上述比较过程，将M₁×K₁变换为由0和1组成的矩阵。由于在本实施例中，采用M₁＝K₁＝M₂＝K₂＝M，因此，得到的矩阵为M×M的矩阵。

对S2尺度上的图像做同样的变换，此处不再赘述。

比对单元30用于利用视频指纹与参考视频库中视频的视频指纹进行比对。

确定单元40用于在比对出视频指纹与参考视频库中的第一视频的视频指纹一致时，确定出目标视频与第一视频为相同的视频。

可选地，装置还包括：发出单元，用于在确定出目标视频与第一视频为相同的视频之后，发出第一指示信息，其中，第一指示信息用于指示目标视频为第一视频的拷贝文件。参考视频库中存储了非拷贝视频，在比较出目标视频与参考视频库中的某个视频具有相同的视频指纹时，确定出该目标视频为拷贝视频。由于参考视频库中的视频为非拷贝视频，且这些视频可以通过视频播放应用程序进行播放，但是不能通过视频播放应用程序进行下载，因此，与该参考视频库中的视频具有相同视频指纹的目标视频就是拷贝视频。

可选地，装置还包括：第二提取单元，用于在确定出目标视频与第一视频为相同的视频之后，提取参考视频库中第一视频的视频名称和第一视频的播放路径；推送单元，用于推送视频名称和播放路径。

实施例3

根据本发明实施例，还提供了一种用于实施上述视频的处理方法的服务器，如图8所示，该服务器主要包括处理器801、数据接口803、存储器805和网络接口807，其中：

数据接口803则主要通过数据传输的方式将第三方工具获取到的视频片段(目标视频)传输给处理器801。

存储器805主要用于存储参考视频库中的视频和目标视频。

网络接口807主要用于与终端进行网络通信，接收终端采集的参考视频。

处理器801主要用于执行如下操作：获取目标视频的关键帧；根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列，其中，所述目标编码序列用于表示所述目标视频基于时空特性的图像序列，将所述目标编码序列作为所述目标视频的视频指纹；利用所述视频指纹与参考视频库中视频的视频指纹进行比对；若比对出所述视频指纹与所述参考视频库中的第一视频的视频指纹一致，则确定出所述目标视频与所述第一视频为相同的视频。

处理器801还用于根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列包括：利用稳定小波变换对所述关键帧进行分解，得到在S1尺度上表达的第一分解图像和在S2尺度上表达的第二分解图像；对所述第一分解图像进行编码处理得到第一编码序列，对所述第二分解图像进行编码处理得到第二编码序列；连接所述第一编码序列和所述第二编码序列，得到目标编码序列。

处理器801还用于对所述第一分解图像进行编码处理得到第一编码序列，对所述第二分解图像进行编码处理得到第二编码序列包括：对所述第一分解图像进行下采样处理得到采用第一矩阵表示的图像，对所述第二矩阵进行下采样处理得到采用第二矩阵表示的图像；对所述第一矩阵进行哈希编码得到所述第一编码序列，对所述第二矩阵进行哈希编码得到所述第二编码序列。

处理器801还用于对所述第一矩阵进行哈希编码得到所述第一编码序列包括：获取所述第一矩阵的中值；判断所述第一矩阵中每个元素与所述中值的差值；将所述第一矩阵中所述差值大于0所对应的所述元素的值设为1，将所述第一矩阵中所述差值小于0所对应的所述元素的值设为0；依次连接相邻的两个元素，得到所述第一编码序列，其中，所述第一编码序列为0、1的组合。

处理器801还用于在确定出所述目标视频与所述第一视频为相同的视频之后，所述方法还包括：发出第一指示信息，其中，所述第一指示信息用于指示所述目标视频为所述第一视频的拷贝文件。

处理器801还用于在确定出所述目标视频与所述第一视频为相同的视频之后，所述方法还包括：提取所述参考视频库中所述第一视频的视频名称和所述第一视频的播放路径；推送所述视频名称和所述播放路径。

可选地，本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例，本实施例在此不再赘述。

实施例4

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于存储本发明实施例的视频的处理方法的程序代码。

可选地，在本实施例中，上述存储介质可以位于移动通信网络、广域网、城域网或局域网的网络中的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：

S1，获取目标视频的关键帧；

S2，根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列；

S3，利用所述视频指纹与参考视频库中视频的视频指纹进行比对；

S4，若比对出所述视频指纹与所述参考视频库中的第一视频的视频指纹一致，则确定出所述目标视频与所述第一视频为相同的视频。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read‐Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地，在本实施例中，处理器根据存储介质中已存储的程序代码执行根据所述关键帧在多尺度变换域上的表达信息提取所述关键帧的目标编码序列包括：利用稳定小波变换对所述关键帧进行分解，得到在S1尺度上表达的第一分解图像和在S2尺度上表达的第二分解图像；对所述第一分解图像进行编码处理得到第一编码序列，对所述第二分解图像进行编码处理得到第二编码序列；连接所述第一编码序列和所述第二编码序列，得到目标编码序列。

可选地，在本实施例中，处理器根据存储介质中已存储的程序代码执行对所述第一分解图像进行下采样处理得到采用第一矩阵表示的图像，对所述第二矩阵进行下采样处理得到采用第二矩阵表示的图像；对所述第一矩阵进行哈希编码得到所述第一编码序列，对所述第二矩阵进行哈希编码得到所述第二编码序列。

可选地，在本实施例中，处理器根据存储介质中已存储的程序代码执行获取所述第一矩阵的中值；判断所述第一矩阵中每个元素与所述中值的差值；将所述第一矩阵中所述差值大于0所对应的所述元素的值设为1，将所述第一矩阵中所述差值小于0所对应的所述元素的值设为0；依次连接相邻的两个元素，得到所述第一编码序列，其中，所述第一编码序列为0、1的组合。

可选地，在本实施例中，处理器根据存储介质中已存储的程序代码执行发出第一指示信息，其中，所述第一指示信息用于指示所述目标视频为所述第一视频的拷贝文件。

可选地，在本实施例中，处理器根据存储介质中已存储的程序代码执行在确定出所述目标视频与所述第一视频为相同的视频之后，所述方法还包括：提取所述参考视频库中所述第一视频的视频名称和所述第一视频的播放路径；推送所述视频名称和所述播放路径。

可选地，本实施例中的具体示例可以参考上述实施例1和实施例2中所描述的示例，本实施例在此不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：布礼文;徐敘遠;简伟华;黄嘉文;袁方;
技术所有人：腾讯科技（深圳）有限公司;
我是此专利的发明人

上一篇：一种电视播放控制系统及控制方法与流程
上一篇：电视与移动终端的互动方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。