一种视频流隐藏信息检测方法和装置与流程

文档序号:17844919发布日期:2019-06-11 21:37阅读:120来源:国知局

本申请涉及视频处理技术领域,尤其涉及一种视频流隐藏信息检测的方法和装置。



背景技术:

随着科技的快速发展,日常生活中视频技术逐渐得到广泛的应用,从而攻击者容易利用视频流隐藏信息进行攻击,造成恶意代码扩散和信息泄露等安全威胁。尤其是采用h.264编码算法的视频流,因其具有较高的压缩效率、广泛的网络适应性和大量的离散余弦变换(英文:discretecosinetransform,缩写:dct)系数,导致h.264视频流中dct系数隐藏信息的可能性更大。

由于基于dct系数修改在视频流中隐藏信息会不同程度的影响视频流中数据的空间相关性,则可基于视频流解压缩后数据的空间相关性检测视频流中的隐藏信息。现阶段,首先,对视频流解压缩得到视频帧进行卷积和量化截断操作,然后,基于量化截断后的特征人工设计得到检测特征,最后,利用支持向量机或集成分类器对视频流隐藏信息进行检测。

发明人经过研究发现,上述方法检测特征具有局限性,检测特征是人工设计得到,耗时耗力耗计算资源;该检测特征对视频流隐藏信息的检测结果影响较大;并且由于视频相对于其他多媒体数据结构方面更加复杂,所需检测特征的维度也更高,人工设计检测特征具有更高的挑战难度。



技术实现要素:

本申请所要解决的技术问题是,提供一种视频流隐藏信息检测的方法和装置,极大的节省时间、精力和计算资源,且可一定程度的提升视频流隐藏信息的检测效率和检测结果质量。

第一方面,本申请实施例提供了一种视频流隐藏信息检测的方法,该方法包括:

调用解码库对待检测视频流进行解压缩获得多个视频帧;

利用a个预设卷积核对每个所述视频帧进行卷积操作,获得每个所述视频帧的a个残差噪声矩阵;

利用b个不同量化截断参数对每个所述视频帧的a个所述残差噪声矩阵进行量化截断操作,获得每个所述视频帧的a×b个量化残差噪声矩阵;

将每个所述视频帧的a×b个所述量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得所述待检测视频流的检测结果。

可选的,a个所述预设卷积核为16个4×4卷积核,16个所述4×4预设卷积核的构造函数为:

其中,n=4。

可选的,所述预设卷积神经网络模型包括b个卷积神经网络子模型,所述卷积神经网络子模型包括a个第一卷积层、全局平均池化层、2个全连接层和softmax层;所述a个第一卷积层中不同第一卷积层之间包括快捷连接。

可选的,若所述快捷连接两端输入数据和输出数据的数据维度相同,所述快捷连接为恒等快捷连接。

可选的,若所述快捷连接两端输入数据和输出数据的数据维度不同,所述快捷连接包括第二卷积层,所述输第二卷积层用于匹配所述输入数据和所述输出数据的数据维度。

第二方面,本申请实施例提供了一种视频流隐藏信息检测的装置,该装置包括:

视频帧获得单元,用于调用解码库对待检测视频流进行解压缩获得多个视频帧;

残差噪声矩阵获得单元,用于利用a个预设卷积核对每个所述视频帧进行卷积操作,获得每个所述视频帧的a个残差噪声矩阵;

量化残差噪声矩阵获得单元,用于利用b个不同量化截断参数对每个所述视频帧的a个所述残差噪声矩阵进行量化截断操作,获得每个所述视频帧的a×b个量化残差噪声矩阵;

检测结果获得单元,用于将每个所述视频帧的a×b个所述量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得所述待检测视频流的检测结果。

可选的,a个所述预设卷积核为16个4×4卷积核,16个所述4×4预设卷积核的构造函数为:

其中,n=4。

可选的,所述预设卷积神经网络模型包括b个卷积神经网络子模型,所述卷积神经网络子模型包括a个第一卷积层、全局平均池化层、2个全连接层和softmax层;所述a个第一卷积层中不同第一卷积层之间包括快捷连接。

可选的,若所述快捷连接两端输入数据和输出数据的数据维度相同,所述快捷连接为恒等快捷连接。

可选的,若所述快捷连接两端输入数据和输出数据的数据维度不同,所述快捷连接包括第二卷积层,所述输第二卷积层用于匹配所述输入数据和所述输出数据的数据维度。

与现有技术相比,本申请至少具有以下优点:

采用本申请实施例的技术方案,调用解码库对待检测视频流进行解压缩获得多个视频帧;利用a个预设卷积核对每个视频帧进行卷积操作,获得每个视频帧的a个残差噪声矩阵;利用b个不同量化截断参数对每个视频帧的a个残差噪声矩阵进行量化截断操作,获得每个视频帧的a×b个量化残差噪声矩阵;将每个视频帧的a×b个量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得待检测视频流的检测结果。由此可见,将视频流进行解压缩、卷积和量化截断等操作后,结合预设卷积神经网络模型进行隐藏信息检测,该模型可自动提取量化残差噪声矩阵中的检测特征,极大的节省时间、精力和计算资源,且可一定程度的提升视频流隐藏信息的检测效率和检测结果质量。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例中一种应用场景所涉及的系统框架示意图;

图2为本申请实施例提供的一种视频流隐藏信息检测的方法的流程示意图;

图3为本申请实施例提供的一种预设卷积神经网络模型中卷积神经网络子模型的结构示意图;

图4为本申请实施例提供的一种部分卷积神经网子模型示意图;

图5为本申请实施例提供的一种快捷连接相关结构示意图;

图6为本申请实施例提供的一种视频流隐藏信息检测的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,压缩效率较高、网络适应性较广的h.264视频流具有大量的dct系数,该dct系数中隐藏信息的可能性更大。常见的基于dct系数修改隐藏信息的方法包括lin方法、ma方法、nakajimak方法和wongk方法等,虽然这些方法尽可能的消除信息隐藏对视频流的影响,但仍会不同程度的影响视频流中数据的空间相关性,则可基于视频流解压缩后数据的空间相关性检测视频流中的隐藏信息。现有技术中对视频流解压缩、卷积和量化截断操作,基于量化截断后的数据人工设计得到检测特征利用支持向量机或集成分类器对视频流隐藏信息进行检测。但是,发明人经过研究发现,现有技术中方法检测特征是人工设计得到,耗时耗力耗计算资源;该检测特征对视频流隐藏信息的检测结果影响较大;且由于视频相对于其他多媒体数据结构方面更加复杂,所需检测特征的维度也更高,人工设计检测特征具有更高的挑战难度。

为了解决这一问题,在本申请实施例中,调用解码库对待检测视频流进行解压缩获得多个视频帧;利用a个预设卷积核对每个视频帧进行卷积操作,获得每个视频帧的a个残差噪声矩阵;利用b个不同量化截断参数对每个视频帧的a个残差噪声矩阵进行量化截断操作,获得每个视频帧的a×b个量化残差噪声矩阵;将每个视频帧的a×b个量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得待检测视频流的检测结果。由此可见,将视频流进行解压缩、卷积和量化截断等操作后,结合预设卷积神经网络模型进行隐藏信息检测,该模型可自动提取量化残差噪声矩阵中的检测特征,极大的节省时间、精力和计算资源,且可一定程度的提升视频流隐藏信息的检测效率和检测结果质量。

举例来说,本申请实施例的场景之一,可以是应用到如图1所示的场景中,该场景包括用户终端101和处理器102,用户终端101和处理器102之间进行交互。用户通过用户终端101将待检测视频流发送给处理器102,处理器102调用解码库对待检测视频流进行解压缩获得多个视频帧。处理器102利用a个预设卷积核对每个视频帧进行卷积操作,获得每个视频帧的a个残差噪声矩阵。处理器102利用b个不同量化截断参数对每个视频帧的a个残差噪声矩阵进行量化截断操作,获得每个视频帧的a×b个量化残差噪声矩阵。处理器102将每个视频帧的a×b个量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得待检测视频流的检测结果。处理器102将待检测视频流的检测结果发送给用户终端101以便将其展示给用户终端101的用户。

可以理解的是,在上述应用场景中,虽然将本申请实施方式的动作描述由处理器102执行,但是,本申请在执行主体方面不受限制,只要执行了本申请实施方式所公开的动作即可。

可以理解的是,上述场景仅是本申请实施例提供的一个场景示例,本申请实施例并不限于此场景。

下面结合附图,通过实施例来详细说明本申请实施例中视频流隐藏信息检测的方法和装置的具体实现方式。

示例性方法

参见图2,示出了本申请实施例中一种视频流隐藏信息检测的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:

步骤201:调用解码库对待检测视频流进行解压缩获得多个视频帧。

可以理解的是,目前h.264视频流是通过修改dct系数隐藏信息的,即在进行dct变化将图像具有的信号由空域变换到频域后,考虑人类视觉系统对于高频的信号不敏感因素,将信息隐藏在人类视觉系统并不敏感的高频分量的dct系数中。由于修改dct系数会影响视频流中数据的空间相关性,在视频流解码过程中,反dct变换操作是将dct系数转化为空域中像素值,修改后的dct系数会随之扩散到所有像素中,此操作为检测视频流中的隐藏信息提供了可能性。因此,在本申请实施例中,可以利用修改dct系数所引起的差异检测视频流隐藏信息,也就是说,对于待检测视频流,首先需要进行解压缩将其由频域变换至空域得到一系列的视频帧,以便执行后续处理进行隐藏信息的检测。

步骤202:利用a个预设卷积核对每个所述视频帧进行卷积操作,获得每个所述视频帧的a个残差噪声矩阵。

可以理解的是,步骤201所获得的视频帧内图像内容的信号较强而隐藏信息所产生的噪声信号较弱,不利于后续隐藏信息的检测,则需要将步骤201所获得的视频帧与一组预先设定的卷积核进行卷积操作,以抑制减弱视频帧内图像内容的信号并放大增强隐藏信息所产生的嗓声信号,即,视频帧与预设卷积核进行卷积操作可以得到利于隐藏信息检测的残差嗓声矩阵。

需要说明的是,不同尺寸的预设卷积核与视频帧进行卷积操作所得到的残差嗓声矩阵对后续隐藏信息的检测性能具有不同的影响。由于目前大多数视频流隐藏信息主要是通过针对视频帧内4×4亮度块对应的残差矩阵dct变换后的dct系数进行修改完成的,因此,只有采用4×4尺寸的卷积核与视频帧进行卷积操作才可以得到合适的使隐藏信息更容易于被检测的残差嗓声矩阵。因此,在本申请实施例的一些实施方式中,a个所述预设卷积核为16个4×4卷积核,16个所述4×4卷积核的构造函数为:

其中,n=4。

例如,在视频流隐藏信息检测实验中,可以利用2×2、3×3、4×4、5×5和8×8等各种尺寸的卷积核分别与视频帧进行卷积操作,测试对应的隐藏信息检测结果,可以得知其中4×4卷积与视频帧进行卷积操作所得的残差嗓声矩阵能够获得最佳的隐藏信息检测结果,则基于上述卷积核的构造函数得到16个4×4卷积核与每个视频帧进行卷积操作,每个视频帧在卷积操作后可以得到16个残差嗓声矩阵。

步骤203:利用b个不同量化截断参数对每个所述视频帧的a个所述残差噪声矩阵进行量化截断操作,获得每个所述视频帧的a×b个量化残差噪声矩阵。

可以理解的是,考虑到隐藏信息检测结果质量,需要增加步骤201获得的残差噪声矩阵进行多样化处理,由于量化截断操作具有将特征离散化、多样化等功能,则需要采用多个不同量化截断参数对步骤201获得的残差噪声矩阵进行量化截断操作获得更多的量化残差噪声矩阵,以便后续结合卷积神经网络模型,给卷积神经网络模型带来的多样性的残差噪声矩阵,使得后续隐藏信息检测结果质量更佳。

例如,在视频流隐藏信息检测实验中,可以利用4组不同量化截断参数(t=4,q=1、2、4)(t=6,q=1、2、4)、(t=8,q=1、2、4)和(t=10,q=1、2、4)分别与残差嗓声矩阵进行量化截断操作,测试对应的隐藏信息检测结果,可以得知其中(t=8,q=1、2、4)这组不同量化截断参数与残差嗓声矩阵进行量化截断操作所得的量化残差嗓声矩阵能够获得最佳的隐藏信息检测结果。则选取3个不同量化截断参数(t=8,q=1)、(t=8,q=2)和(t=8,q=4),对上述16个残差嗓声矩阵进行量化截断操作,获得48个量化残差噪声矩阵。

步骤204:将每个所述视频帧的a×b个所述量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得所述待检测视频流的检测结果。

可以理解的是,步骤203获得的a×b个量化残差噪声矩阵基于b个不同量化截断参数可以分为b组,这b组量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,对应的预设卷积神经网络模型由b个并行且相同的卷积神经网络子模型构成。该卷积神经网子模型包括a个第一卷积层、全局平均池化层、2个全连接层和softmax层,例如,如图3所示的预设卷积神经网络模型中卷积神经网络子模型的结构示意图。其中,第一卷积层和全局平均池化层是卷积神经网络模型的核心,通过学习和优化相关参数可以自动提取量化残差矩阵中隐藏信息检测特征;2个全连接层和softmax层可以基于检测特征检测得到检测结果。

例如,48个量化残差噪声矩阵基于3个不同量化截断参数可以分为3组输入预设卷积神经网络模型中3个并行且相同的卷积神经网络子模型,每个卷积神经网子模型包括16个第一卷积层和全局平均池化层的部分卷积神经网子模型,这部分卷积神经网子模型可以输出1个256维特征向量,例如,图4所示的部分卷积神经网子模型示意图。

需要说明的是,a个第一卷积层在每个第一卷积层采用了1个批量归一化bn层和非线性激励函数relu层。其中,bn层的引入是为了解决预设卷积神经网络模型反向传播过程中的“梯度弥散”问题,而relu层的引入是为了增加非线性因素以提升预设卷积神经网络模型的表达能力。

需要说明的是,卷积神经网络越深,理论上的学习效果越好,即,理论上训练出来卷积神经网络模型的检测准确率越高;但是在实际操作中,过深的卷积神经网络在训练时会出现梯度消失或者梯度爆炸的情况,导致随着层数加深卷积神经网络模型的检测准确度出现饱和甚至是下降的情况;则在预设卷积神经网络模型中的卷积神经网子模型中,通过借鉴残差学习思想,在a个第一卷积层的不同第一卷积层之间添加快捷连接构建残差学习单元以学习残差传导梯度。因此,在本申请实施例的一些实施方式中,所述a个第一卷积层中不同第一卷积层之间包括快捷连接。

需要说明的是,卷积神经网子模型的a个第一卷积层中部分第一卷积层卷积操作的步长为2,在输入数据的数据维度大小减半时增加卷积核数量以使输出数据的数据维度翻倍,从而保持卷积神经网子模型网络结构复杂性;而其余部分第一卷积层卷积操作的步长为1,此时输入数据与输出数据的数据维度相等。则不同第一卷积层之间包括的快捷连接的作用在于将使得其两端输入数据和输出数据的数据维度相同从而实现匹配。因此,在本申请实施例的一些实施方式中,若所述快捷连接两端输入数据和输出数据的数据维度相同,所述快捷连接为恒等快捷连接。若所述快捷连接两端输入数据和输出数据的数据维度不同,所述快捷连接包括第二卷积层,所述输第二卷积层用于匹配所述输入数据和所述输出数据的数据维度。例如,如图5所示的快捷连接相关结构示意图。

通过本实施例提供的各种实施方式,调用解码库对待检测视频流进行解压缩获得多个视频帧;利用a个预设卷积核对每个视频帧进行卷积操作,获得每个视频帧的a个残差噪声矩阵;利用b个不同量化截断参数对每个视频帧的a个残差噪声矩阵进行量化截断操作,获得每个视频帧的a×b个量化残差噪声矩阵;将每个视频帧的a×b个量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得待检测视频流的检测结果。由此可见,将视频流进行解压缩、卷积和量化截断等操作后,结合预设卷积神经网络模型进行隐藏信息检测,该模型可自动提取量化残差噪声矩阵中的检测特征,极大的节省时间、精力和计算资源,且可一定程度的提升视频流隐藏信息的检测效率和检测结果质量。

示例性装置

参见图6,示出了本申请实施例中一种视频流隐藏信息检测的装置的结构示意图。在本实施例中,所述装置例如具体可以包括:

视频帧获得单元601,用于调用解码库对待检测视频流进行解压缩获得多个视频帧;

残差噪声矩阵获得单元602,用于利用a个预设卷积核对每个所述视频帧进行卷积操作,获得每个所述视频帧的a个残差噪声矩阵;

量化残差噪声矩阵获得单元603,用于利用b个不同量化截断参数对每个所述视频帧的a个所述残差噪声矩阵进行量化截断操作,获得每个所述视频帧的a×b个量化残差噪声矩阵;

检测结果获得单元604,用于将每个所述视频帧的a×b个所述量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得所述待检测视频流的检测结果。

在本申请实施例一种可选的实施方式中,a个所述预设卷积核为16个4×4卷积核,16个所述4×4预设卷积核的构造函数为:

其中,n=4。

在本申请实施例一种可选的实施方式中,所述预设卷积神经网络模型包括b个卷积神经网络子模型,所述卷积神经网络子模型包括a个第一卷积层、全局平均池化层、2个全连接层和softmax层;所述a个第一卷积层中不同第一卷积层之间包括快捷连接。

在本申请实施例一种可选的实施方式中,若所述快捷连接两端输入数据和输出数据的数据维度相同,所述快捷连接为恒等快捷连接。

在本申请实施例一种可选的实施方式中,若所述快捷连接两端输入数据和输出数据的数据维度不同,所述快捷连接包括第二卷积层,所述输第二卷积层用于匹配所述输入数据和所述输出数据的数据维度。

通过本实施例提供的各种实施方式,调用解码库对待检测视频流进行解压缩获得多个视频帧;利用a个预设卷积核对每个视频帧进行卷积操作,获得每个视频帧的a个残差噪声矩阵;利用b个不同量化截断参数对每个视频帧的a个残差噪声矩阵进行量化截断操作,获得每个视频帧的a×b个量化残差噪声矩阵;将每个视频帧的a×b个量化残差噪声矩阵输入预设卷积神经网络模型进行隐藏信息检测,获得待检测视频流的检测结果。由此可见,将视频流进行解压缩、卷积和量化截断等操作后,结合预设卷积神经网络模型进行隐藏信息检测,该模型可自动提取量化残差噪声矩阵中的检测特征,极大的节省时间、精力和计算资源,且可一定程度的提升视频流隐藏信息的检测效率和检测结果质量。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述,仅是本申请的较佳实施例而已,并非对本申请作任何形式上的限制。虽然本申请已以较佳实施例揭露如上,然而并非用以限定本申请。任何熟悉本领域的技术人员,在不脱离本申请技术方案范围情况下,都可利用上述揭示的方法和技术内容对本申请技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本申请技术方案的内容,依据本申请的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本申请技术方案保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1