一种基于条件对抗神经网络的水下目标数据扩增方法及系统与流程

文档序号:24121541发布日期:2021-03-02 11:44阅读:138来源:国知局
一种基于条件对抗神经网络的水下目标数据扩增方法及系统与流程

[0001]
本发明属于水下目标识别技术领域,具体而言,涉及一种基于条件对抗神经网络的水下目标数据扩增方法及系统。


背景技术:

[0002]
水下目标识别技术是根据水听器阵列接收到的舰船的辐射噪声信号,对目标的类型进行判别。
[0003]
在水下目标识别任务中,实践中发现基于深度学习的识别模型通常能获得比传统的支持向量机等方法更好的效果,但是基于深度学习方法的有效性依赖于足量的有标签的数据,当数据量不充足时会使得识别模型严重过拟合从而降低识别效果。由于实际数据获取的困难性和经济性,给深度学习方法在水下识别任务中的应用推广造成较大的阻碍。


技术实现要素:

[0004]
本发明的目的在于解决深度学习在水下目标识别的应用出现的数据过少导致训练出现过拟合的问题。
[0005]
为实现上述目的,本发明提出了一种基于条件对抗神经网络的水下目标数据扩增方法,所述方法包括:
[0006]
将某一目标类别对应的one-hot向量与随机高斯白噪声级联,输入预先训练好的生成器,输出该目标类别的生成样本。
[0007]
作为上述方法的改进,所述方法还包括:所述生成器的训练步骤,具体包括:
[0008]
构建由一个生成器和一个判别器组成的条件对抗生成网络;
[0009]
获取水听器阵列采集的每个目标类别声源信号,将声源信号转换成数字信号;对数字信号进行加窗预处理并分帧;对每一帧信号做傅里叶变换,得到离散频谱,然后提取每一帧信号的小波能量特征;将小波能量特征作为该目标类别的真实样本;
[0010]
将随机高斯白噪声与一个目标类别的one-hot向量形式级联输入生成器,输出生成样本;共有n对真实样本和生成样本;n为目标类别的个数;
[0011]
将每对真实样本和生成样本以标签“真”和“假”训练判别器,得到训练好的判别器;
[0012]
固定判别器的网络权重,以真的标签更新生成器的权重,通过迭代运算,当最小化的损失函数不大于阈值时,获得训练好的生成器;
[0013]
最小化的损失函数表示为:
[0014][0015]
其中,x为真实样本,p
data
为真实样本的概率分布,z为随机高斯白噪声,p
z
为随机高斯白噪声的概率分布,d表示判别器,g表示生成器,c为目标类别,l为lipschitz条件,用于限制判别器d在每次训练中参数更新的幅度,d(x)为判别器的输出结果,g(z,c)为生成器的输出结果,v(d,g)是所期望最小化的损失函数。
[0016]
作为上述方法的一种改进,所述对数字信号进行加窗预处理并分帧,具体包括:
[0017]
对数字信号取n0个采样点作为一帧,对每一帧数字信号先补零到n点,n0<n,n=2
i
,i为正整数;共m帧数字信号;
[0018]
对第j帧的数字信号进行加窗或预加重处理,加窗函数采用汉明窗或哈宁窗;窗函数的长度为l;窗函数沿时间序列进行n/2个点的移动,其中1≤j<m。
[0019]
作为上述方法的一种改进,所述对每一帧信号做傅里叶变换,得到离散频谱,然后提取每一帧信号的小波能量特征,具体包括:
[0020]
对t时刻的数字信号进行快速傅里叶变换,得到t时刻数字信号的离散频谱;其中,t时刻的数字信号的傅里叶变换系数为:
[0021][0022]
y
t,n
表示t时刻的第n个采样点的信号的值,y
t,f
表示信号在t时刻的第f个频点的傅里叶变换系数,其中f=0,1,

n-1;
[0023]
将t时刻的数字信号的离散频谱通过小波包滤波器组的每个滤波器后,计算每个滤波器内的离散频谱信号能量值,对离散频谱信号能量值取对数即为小波能量特征值;其中小波包滤波器组中滤波器的数量对应小波能量特征的维度;
[0024]
将小波包滤波器组输出的全部小波能量特征值进行拼接,得到每一帧信号的小波能量特征。
[0025]
作为上述方法的一种改进,所述方法还包括:对生成器输出的生成样本进行有效性评估的步骤:
[0026]
将生成样本输入到预先训练好的基础分类模型中,得到每一个生成样本的后验概率;若概率低于阈值,则认为其为无效样本数据,否则为有效样本数据,该阈值的取值范围为30%-50%。
[0027]
作为上述方法的一种改进,所述基础分类模型的训练步骤包括:
[0028]
建立训练样本,训练样本为:每个目标类型的真实数据,其标签为其对应的one-hot向量;
[0029]
由训练样本训练出所述基础分类模型。
[0030]
本发明还提供了一种基于条件对抗生成网络的水下目标数据扩增系统,所述系统包括:预先训练好的生成器和样本生成模块;
[0031]
所述样本生成模块,用于将某一目标类别对应的one-hot向量与随机高斯白噪声级联,输入预先训练好的生成器,输出该目标类别的生成样本。
[0032]
与现有技术相比,本发明的优点在于:
[0033]
1、本发明的方法能够利用少量的水下目标数据产生足量的与原样本类似的数据,使得其数据量能够满足深度学习的需求;
[0034]
2、本发明的方法利用一个模型实现多个目标类别的样本生成,对领域相关的不同信号源包括同一水域和同一接收源进行建模效果更佳。
附图说明
[0035]
图1为本发明的基于条件对抗神经网络的水下目标数据扩增方法的方法流程图;
[0036]
图2为本发明的基于条件对抗神经网络的水下目标数据扩增方法的设计方法示意图;
[0037]
图3为本发明的条件对抗生成网络的内部结构详细架构示意图;图中fc1024表示全连接层,每层包含1024个节点;relu为激活函数;
[0038]
图4为本发明的网络训练过程中生成器的损失函数随迭代次数增加变换的示意图。
具体实施方式
[0039]
下面结合附图和具体实施例对本发明进行详细的说明。
[0040]
本发明提出一种基于条件对抗神经网络的水下目标数据扩增方法,所述方法在常规的数据扩增技术的提升有限的情况下,依靠条件对抗生成网络在同一模型中实现多种水下目标数据的无限生成,可以有效地解决基于深度学习的水下目标识别任务中数据缺失的问题。
[0041]
对抗生成网络是一种概率生成模型,概率生成模型的目的是找出给定观测数据内部的统计规律,并且能够基于所得到的概率分布模型,产生全新的、与观测数据类似的数据。
[0042]
实施例1:
[0043]
如图1所示,本发明的实施例1提出了一种基于条件对抗神经网络的水下目标数据扩增方法,包括以下步骤:
[0044]
步骤101:将水听器阵列接收的一个目标类型的声源信号转换成数字信号;
[0045]
步骤102:对步骤101得到的数字信号进行加窗预处理并分帧;
[0046]
所述的对数字信号进行预处理包括:取n个采样点作为一帧信号,对每一帧数字信号先补零到n点,n=2
i
,i为正整数;然后,对每一帧的数字信号进行加窗或预加重处理,加窗函数采用汉明窗(hamming)或哈宁窗(hanning),利用窗函数对信号进行分帧,窗函数的长度即为帧长沿时间序列进行n/2个点的移动,得到第二帧信号,以此类推;具体包括:
[0047]
步骤102-1)对数字信号取n0个采样点作为一帧,对每一帧数字信号先补零到n点,n=2
i
,i为正整数;共m帧数字信号,所述m帧数字信号按时间顺序组成时间序列;
[0048]
步骤102-2)对第j帧的数字信号进行加窗或预加重处理,加窗函数采用汉明窗或哈宁窗;窗函数的长度为l;
[0049]
步骤102-3)当j<m时,窗函数沿时间序列进行n/2个点的移动,j值加1,执行步骤102-2);
[0050]
当j≥m时,结束。
[0051]
步骤103:将步骤102生成的每一帧信号做傅里叶变换,得到离散频谱,然后提取每一帧信号的小波能量特征,作为真实数据“x(真)”,包括:
[0052]
步骤103-1)对t时刻的数字信号进行快速傅里叶变换,得到t时刻数字信号的离散频谱;其中,t时刻的数字信号的傅里叶变换系数y
t,f
为:
[0053][0054]
y
t,n
表示t时刻的第n个采样点的信号的值,y
t,f
表示信号在t时刻的第f个频点的傅
里叶变换系数,其中f=0,1,

n-1;
[0055]
步骤103-2)将t时刻的数字信号的离散频谱通过小波包滤波器组后,计算每个滤波器内的离散频谱信号能量值,所述能量值取对数后即为需要的小波能量特征值;
[0056]
步骤103-3)将小波包滤波器组输出的全部小波能量特征值拼接成小波能量特征,其中小波包滤波器组中滤波器的数量对应着小波能量特征的维度;
[0057]
步骤104)训练条件对抗生成网络;条件对抗生成网络由一个生成器g和一个判别器d组成,如图2所示。
[0058]
将随机高斯白噪声与one-hot向量形式的类别标签的级联输入生成器g,输出为生成数据“x(假)”,然后将真实数据“x(真)”和生成数据“x(假)”分别以标签“真”和“假”训练判别器d,最后一步是固定判别器d的网络权重,以“真”的标签更新g的网络权重。即g的训练目标是使得生成的数据尽可能的“像”真实的数据,而判别器d的训练目标是尽可能的区分出真实数据和生成数据。如图3所示。
[0059]
训练的目标是最小化如下所示的损失函数:
[0060][0061]
其中,其中,x为真实样本,p
data
为真实样本的概率分布,z为随机高斯白噪声,p
z
为随机高斯白噪声的概率分布,d表示判别器,g表示生成器,c为目标类别,用于限制判别器d在每次训练中参数更新的幅度,d(x)为判别器的输出结果,g(z,c)为生成器的输出结果,v(d,g)是所期望最小化的损失函数。l为lipschitz条件,用于限制判别器d在每次训练中参数更新的幅度,这样做是为了避免过快地将判别器d训练至收敛,导致其总能准确的判决出“假”数据,使得生成器g的训练受到影响。在实际的应用中,通过训练5次生成器g后训练1次判别器d能够使得两个网络模型有效地协同更新。通过不断的迭代,g的生成能力和d的判别能力互相提升,最终使得生成器g可以获得与真实样本类似的生成数据。
[0062]
固定判别器d的网络权重,以真的标签更新生成器g的权重,通过迭代运算,当损失函数不大于阈值时,固定生成器g的网络权重,获得训练好的生成器g;
[0063]
如图4所示,训练过程中生成器g的损失函数随迭代次数增加变换变化,从图中可以看出,随着训练的不断进行,对抗生成网络的生成器g的损失函数逐渐变小,最终趋近于0,意味着判别器无法判别生成数据的样本和真实的样本。
[0064]
步骤105)将某一目标类别对应的one-hot向量与随机高斯白噪声级联,输入生成器g,得到生成样本;
[0065]
步骤106)对生成数据的质量进行有效性评估,通过阈值设定舍弃掉部分低质量的生成信号;即针对生成器g输出的生成样本,需要对其有效性进行筛选和评估,具体包括:
[0066]
利用原始真实样本数据及其对应的one-hot向量训练出一个基础的分类模型a和一个条件对抗生成网络m;
[0067]
通过one-hot向量与随机高斯噪声的级联输入到m中得到某一目标的样本;
[0068]
将生成样本输入到基础分类模型a中,得到每一个生成样本的后验概率;若概率低于某一阈值(30%,50%),则认为其为无效数据,否则为有效数据。
[0069]
实施例2
[0070]
本发明的实施例2提供了一种基于条件对抗生成网络的水下目标数据扩增系统,所述系统包括:预先训练好的生成器和样本生成模块;
[0071]
所述样本生成模块,用于将某一目标类别对应的one-hot向量与随机高斯白噪声级联,输入预先训练好的生成器,输出该目标类别的生成样本。
[0072]
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1