一种基于MelGAN的水声信号仿冒方法

文档序号:32786720发布日期:2023-01-03 19:15阅读:26来源:国知局
一种基于MelGAN的水声信号仿冒方法
一种基于melgan的水声信号仿冒方法
技术领域
1.本发明涉及水声通信技术领域,尤其涉及一种基于melgan的水声信号仿冒方法。


背景技术:

2.在海上,主要通过水声信号来进行舰船探测,为了加强舰船隐藏能力,需要利用水声信号仿冒技术。人工智能技术快速发展,水声信号仿冒技术与人工智能结合应用是时代所需。
3.然而,目前传统的深度神经网络是有监督学习,训练模型需要大量信号质量较好的样本数据,而且非常耗时耗力,但水声信道很不稳定,受温度、洋流、海洋密度影响较大,有严重的多径衰落,因此在实际环境中测得的水声信号一般信噪比小,噪声干扰严重,信号质量很差,很难满足传统深度神经网络的训练标准。因此采用传统的深度学习技术来进行水声信号仿冒效果很不理想。


技术实现要素:

4.为了提高水声信号的仿冒效果,本发明提出一种基于melgan的水声信号仿冒方法。
5.本发明提供的一种基于melgan的水声信号仿冒方法,包括:
6.步骤1:采用melgan作为水声信号仿冒模型并训练;其中,将生成器中空洞卷积的内核大小设置为其步长的整数倍,将生成器中采样的帧移设为256;训练过程具体包括:将mel谱图输入至生成器,通过学习真实水声信号的分布生成仿冒水声信号;将所述仿冒水声信号和所述真实水声信号输入判别器,利用损失函数使得melgan模型进行收敛,收敛后的melgan模型即为水声信号仿冒模型;
7.步骤2:将测试样本输入至训练好的生成器中,得到仿冒水声信号。
8.进一步地,通过增减生成器中空洞卷积的层数来控制重叠区域的大小。
9.进一步地,采用hinge loss函数作为损失函数。
10.进一步地,在将真实水声信号输入至判别器前,对真实水声信号进行预处理;所述预处理包括:降频和预加重。
11.本发明的有益效果:
12.本发明提供的一种基于melgan的水声信号仿冒方法,首先对真实水声信号样本进行降频处理,接着对真实信号样本进行预加重处理得到特征明显的水声信号,然后将其转换成mel谱图格式输入至melgan模型进行训练以得到水声信号仿冒模型,最后利用训练好的模型进行水声信号仿冒。本发明能够产生以假乱真的仿冒水声信号,具有良好的效果。
附图说明
13.图1为本发明实施例提供的一种melgan的水声信号仿冒方法的流程示意图;
14.图2为本发明实施例提供的仿冒水声信号和真实水声信号频谱图对比示意图;
15.图3为本发明实施例提供的仿冒水声信号和真实水声信号语谱图对比示意图。
具体实施方式
16.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
17.如图1所示,本发明实施例提供一种melgan的水声信号仿冒方法,包括以下步骤:
18.s101:采用melgan作为水声信号仿冒模型并训练;其中,将生成器中空洞卷积的内核大小设置为其步长的整数倍,将生成器中采样的帧移设为256;训练过程具体包括:将mel谱图输入至生成器,通过学习真实水声信号的分布生成仿冒水声信号;将所述仿冒水声信号和所述真实水声信号输入判别器,利用损失函数使得melgan模型进行收敛,收敛后的melgan模型即为水声信号仿冒模型;
19.具体地,考虑到水声信号生成是使用中间格式mel谱图进行训练,而水声信号转换成mel谱图是一个有损压缩过程,因此从mel谱图逆映射回水声信号的过程中必定会出现失真情况;因此,为了减少数据间的格式转换,减少不必要的质量损失,本发明实施例中,在训练水声信号仿冒模型时,melgan的生成器的输入并未使用符合高斯分布的随机噪声输入,而是使用mel谱图;而事实上,发明人通过实验也确实发现,若melgan的生成器输入仍传统gan模型一样输入符合高斯分布的随机噪声,生成的水声信号效果会很差。此外,本实施例中,还将采样的帧移设为256,因此mel谱图的时间分辨率为水声信号的1/256,因此整个生成器要做256x的上采样使生成的水声信号与真实水声信号时间分辨率保持一致。
20.进一步地,为了减少数据量便于网络建模,以及为了去除见船辐射噪声信号中的环境或其他海洋生物噪声,本发明实施例中,在将真实水声信号输入至判别器前,对真实水声信号进行预处理;所述预处理包括:降频和预加重。通过该预处理操作,可以使得提取的水声信号特征更加明显有效。
21.进一步地,水声信号的生成过程中,其中一个难点是要让水声信号在时间尺度上只有相关性,为了解决该难点,melgan网络的原本结构设计是使mel谱图先经过上采样再经过残差块,这种结构设计主动引入了归纳偏差,使得信号帧之间存在重叠区域,从而产生相关性。但是,重叠区域的大小与生成的水声信号的质量密切相关,为了能够提高生成的水声信号的质量,发明人发现,可以通过增减空洞卷积的层数来控制重叠区域的大小从而影响信号质量,但并不是层数越多越好,实验证明当层数太多时信号质量反而更差,而且训练时间非常满,所以层数的选择应根据实际情况而定。
22.此外,为了解决在开始生成水声信号时,信号中常常出现的刺耳嘶嘶声这一问题,本实施例对空洞卷积的内核大小和步长进行了调整,具体为:将内核大小设置为步长的整数倍。
23.如图2所示,melgan中的判别器采用具有三个判别模块的多尺度架构,三个判别模块共同对信号做判别,提高判别能力。三个判别模型的网络结构完全一样,都由三个卷积层和4个4x下采样层组成。
24.在本发明中,每个判别模块用于对不同分辨率的水声信号做判别。其中,第一个判
别模块用于判别原始水声信号;第二个和第三个判别模块则是分别用于判别对原始水声信号做2倍和4倍的池化采样后的信号,池化层内核为4。
25.判别器工作时,通过让每个判别模块学习小信号块的数据分布进行分类,从而让判别器能学习整个水声信号的数据分布进行分类,判别器使用分组卷积的方法可以很好的学习水声信号中的高频数据,还可以学习长度不一样的水声信号序列。判别器的网络层与生成器的设计相似,判别器中的所有网络层也是使用权重归一化,激活函数都选用leakyrelu,负区间梯度设为0.2。优化器选用adam,学习率为0.0001。
26.作为一种可实施方式,本实施例使用hinge loss作为损失函数,如式(1)所示:
[0027][0028]
其中,x表示真实水声信号,z表示生成器的输入,i表示判别模块。还加入了特征匹配损失,它最小化了水声信号样本与生成水声信号在判别器中的l1距离。
[0029]
s102:将测试样本输入至训练好的生成器中,得到仿冒水声信号。
[0030]
本发明提供的一种基于melgan的水声信号仿冒方法,创新性地将melgan生成对抗网络应用到水声信号的仿冒生成领域中,通过听音识别和谱图识别两种方法对仿冒效果进行评估,仿冒水声信号的节奏感与真实信号相似,通过对比两者的谱图(如图2和图3)可知,二者的信号能量都主要在2500hz-8000hz之间,其他频段信号能量很低,说明仿冒水声信号和真实水声信号都处在几乎相同的频段,仿冒效果较好。
[0031]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1