一种针对低嵌入率LSB音频隐写的特征向量提取方法与流程

文档序号:36139789发布日期:2023-11-22 22:56阅读:67来源:国知局
一种针对低嵌入率的制作方法

本发明涉及lsb音频隐写检测,具体来说,涉及一种针对低嵌入率lsb音频隐写的特征向量提取方法。


背景技术:

1、一、lsb音频隐写检测技术

2、随着计算机和互联网的快速发展,人们借由网络快捷的进行信息的沟通与交流,越来越多的数字化多媒体内容,比如音频、视频等,成为人们沟通与交流的主要载体。由于音频载体的数字化和信息编码的冗余特性,在人的生理感知无法察觉的情况下,可以将隐藏的信息嵌入到音频文件中,以实现数据的隐藏传输。lsb音频隐写指的是在音频文件的最低有效位(lsb)中嵌入隐藏信息,因为修改最低有效位对音频质量的影响较小。

3、lsb音频隐写检测技术是lsb音频隐写技术的对抗技术,它是对可疑音频进行分析,判断出音频文件是否被lsb隐写。

4、二、cnn

5、近几年来卷积神经网络cnn大放光彩,在图像和语音识别等领域应用广泛。基于卷积神经网络检测方法是当前最先进的lsb音频隐写检测方法,该方法相对于传统手工提取特征的方法,比如卡方检测和spa检测,可以实现各类特征提取的自动化;相对于只能提取部分特征的bagging 检测,可以实现全面高维的特征抽象。

6、三、特征向量

7、数字语音信号的获取,首先需要对连续语音信号间隔定时采样,然后对采样值四舍五入量化,最后进行二进制编码。但由于不存在理想的采集条件,使数字语音信号在获取过程中必然引入噪声。

8、语音信号采集序列可表示为,其中表示n时刻没有干扰的语音采样值;为n时刻噪声信号值。如果将lsb隐写视为一种人为制造的噪声,可为我们隐写分析中分布特性提取提供新的思路。

9、此时,对于 lsb 音频隐写后的语音信号的采集序列可以更新表示为,其中为lsb音频隐写后的综合噪声。也就是说,假设将 lsb 隐写视为一种噪声,在隐写前后噪声信号值由变成了。这种转变必将使隐写前噪声的原有的某种分布特性发生变化。若能量化这种分布特性,提取出有效的高维特征向量,就可作为cnn隐写检测模型的训练样本。而在cnn模型的训练过程中,一个高质量的特征向量训练集是提高模型训练的质量和预测准确率的关键。

10、目前有两种方式来量化lsb隐写引入的噪声序列特征变化,分别是基于局部相关性的噪声序列估计和小波信号重构的噪声序列估计。

11、基于音频信号相邻采样序列估计

12、由于语音存在短时相关性,在误差允许的范围内,我们可以认为相邻语音信号采样值是相等的,即。此时噪声随机影响语音信号采样值,据此,假设噪声仅叠加在或者中的任意一个,那么两者之差即为一个噪声值。据此可将相邻语音信号采样值的差分作为噪声,如下式所示:

13、;

14、2) 小波信号重构的噪声序列估计

15、小波去噪,主要是通过小波信号在小波空间选择恰当的小波系数对信号重构进而达到噪声消除的目的。研究提出了改进的小波变换 (sgwt)进行去噪。主要原因是由于传统的小波滤波器的输出值不是整数,而是浮点数,这存在一个严重问题,就是在对小波变换后的数据压缩量化时,存在较大的误差,音频失真严重。而提升的小波变换,又称为第二代小波变换,其构造的滤波器的输出值为整数,没有浮点数问题。若对语音信号进行两级小波变换分解,每一级上都可获得高频和低频信号。低频部分反映信号的平均值,高频部分反映信号的在细节的差异,所以信号的噪声主要体现在高频部分。在高频部分,对小波变换系数进行阈值化处理,处理方法包括两种,分别是硬阈值处理和软阈值处理。硬阈值会使去噪后的信号在奇异点附近振荡,一般采用软阈值处理1h高频带信号,即当小波系数的绝对值小于某一阈值时,将小波系数置零,当小波系数的绝对值大于某一阈值时,将小波系数与阈值的差值代替原小波系数。然后对小波信号进行重构操作,获得原始信号的估计 ,并取噪声序列:

16、。

17、基于局部相关性的噪声序列估计,简而言之,就是对邻近的采样值取差值,因为语音具有短时平稳性,我们可以将相邻采样值视为相等的,即。而嵌入的隐秘信息会叠加在某个采样值上,造成与邻近的采样值不再相等。所以可以视为一个噪声,于是我们可以构建采样值的差分序列,来量化这种特征。这种量化方式思路简单,可操作性强。另外一种是基于小波变换来量化lsb隐写引入的噪声,通过小波信号重构的噪声序列来量化该维度的特征变化,由于音频信号的噪声主要体现在高频部分,所以我们仅对高频部分进行阈值化处理。最后对小波信号进行反小波变换,获得原始信号的估计值,两者做差分操作,得到的差分序列,即为量化该特征变化的特征向量。但两者提取的特征向量对隐写的敏感度和秘密信息的嵌入率成正相关,嵌入率越高,检测性能越好。低嵌入率的lsb音频隐写检测效果不佳 。lsb隐写本身针对的就是最低有效位,其对采样幅值的改变本身很弱,再加上过低的嵌入率使得上述特征向量的表征能力更难以有效。由于隐写嵌入的秘密信息对整体内容造成的扰动非常小,所以必须进行更深入的研究和更高层次的数学分析才有可能在某个不易察觉的维度发现正常音频载体与隐写音频载体的不同特征。

18、针对上述问题,目前还没有有效的解决办法。


技术实现思路

1、针对相关技术中的上述技术问题,本发明提出一种针对低嵌入率lsb音频隐写的特征向量提取方法,能够克服现有技术的上述不足。

2、为实现上述技术目的,本发明的技术方案是这样实现的:

3、一种针对低嵌入率lsb音频隐写的特征向量提取方法,包括如下步骤:

4、s1基于条件概率提取特征向量,短时间内临近的语音采样点噪声具有较大的相关性,用条件概率表示在m时刻系统处于某种状态的已知条件下,在时刻m+1该系统转移到另一状态的可能性,其中m时刻采样值为,m+1时刻采样值为;

5、s1中基于条件概率提取特征向量具体步骤如下:

6、s11获取语音片段的数字编码序列;

7、s12确定音频采样离散值域;

8、s13统计音频采样离散值域中每个离散点在该语音片段的出现的次数和占比;

9、s14使用条件概率分布律对采样点相关性进行评估;

10、s15将步骤s14计算的概率值带入概率矩阵;

11、s16将概率矩阵转换成目标特征向量;

12、s2完整的lsb隐写检测模型训练过程;

13、s21 数据集的设置;

14、s22 cnn模型的训练:基于条件概率分布模型提取高维特征向量,将提取的向量作为输入值进行cnn网络模型训练,具体步骤如下:

15、s221对相同数量的原始音频和隐写音频分别提取出维度相同的的特征向量xi和;

16、s222 以作为输入向量和返回值对cnn进行训练。

17、进一步地,步骤s14中是通过古典概型来计算的。

18、进一步地,s21中数据集的设置具体步骤如下:

19、s211从公共数据集中随机选择未压缩的语音片段,并对原始语音片段进行等时切分成若干段小片段,每个音频的持续时间相同,获取一定数量的语音片段作为数据集并进行备份,原始数据集作为正常的未被隐写的数据集对备份的数据集进行lsb音频隐写处理;

20、s212对备份的数据集使用lsb音频隐写算法进行隐写操作,得到相同数量的正常音频和隐写音频,其中一半用于训练,剩余一半用于测试。

21、进一步地,步骤s211中每个音频的持续时间为5s。

22、进一步地,步骤s211中样本的采样频率为16khz。

23、进一步地,步骤s212中lsb隐写的嵌入率为5%。

24、进一步地,s222的具体步骤如下:

25、s2221使用超参数卷积核来对输入值进行预处理;

26、s2222对步骤s2221输出的预处理的数据进行卷积组的叠加运算,实现对数据的逐层降维和高层语义的提取;

27、s2223将步骤s2222输出的数据输入到分类器中,经过一个全连接层,处理之后的结果输入到softmax层,最终以概率的方式输出识别结果。

28、本发明的有益效果:本发明通过使用一阶离散性随机变量条件分布律来表征不同位置噪声信号的相关性,构建出音频数字编码序列的概率矩阵,并将其转为为一个高维特征向量,该特征向量能有效捕获隐写前后引入的局部微小差异,将其作为训练cnn模型的输入值,可以有效提高低嵌入率lsb音频隐写的识别准确度,为lsb隐写引入的噪声序列提供了概率分布建模手段。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1