基于特征融合和残差CNN的水声目标识别方法

文档序号：34771853发布日期：2023-07-13 16:41阅读：83来源：国知局

本发明属于水声目标识别，具体涉及一种基于特征融合和残差cnn的水声目标识别方法。

背景技术：

1、水声目标识别对于海洋开发、国防安全有着重大意义，现已成为水声领域的研究热点之一。水下目标自动识别主要包括特征提取与构建分类器两大部分。随着传感器和智能信息技术的迅猛发展，传统方法已逐渐无法适应水下探测信息处理的智能化发展要求。

2、近年来在计算机领域获得广泛应用的机器学习方法为水下目标识别及定位的智能化提供了理论支持。在水下目标定位领域，机器学习方法在声源的距离、深度和方位估计上表现了良好的性能，niu将前馈神经网络(feedforward neural network,fnn)和支持向量机(support vector machine,svm)方法的机器学习分类模型应用到船舶的距离估计问题上，在缺少海洋环境参数的情况下，基于机器学习的分类器可实现有效定位。wang引入了grnn(generalized regression neural network,grnn)方法，实现了浅海高信噪比环境下有效的垂直阵目标距离估计，并利用swellex-96实验中无强干扰的s5航次数据验证了该方法的可行性。huang将声场模型数据用于训练，建立多层深度神经网络(deep neuralnetworks,dnn)模型，由卷积神经网络(convolutional neural network,cnn)-前馈神经网络(cnn-fnn)组合而成，结果表明，dnn可有效估计浅海声源位置，在缺乏海洋环境先验信息的前提下，定位性能优于mfp方法。ferguson等人在浅海波导环境中，提取声源信号的倒频谱图和广义互相关图特征，基于卷积神经网络实现目标方位估计。liu等人在深度范围大致确定的前提下，利用一维卷积神经网络和集成学习实现了水下目标距离估计。在水下目标识别领域，机器学习方法已应用在船舶和海洋生物等声音的识别中，kamal等将深度置信网络(deep briefnetwork,dbn)模型应用于水声信号被动目标识别任务中，实现了无标签的水下目标声信号识别。shamir等人在提取鲸鱼声学特征的基础上，利用机器学习方法实现了不同种类鲸鱼的自动识别。yue等人利用svm、dbn和cnn模型，实现了船舶目标声信号的有效识别。yu等人搭建了多种机器学习模型，用于检测北大西洋露脊鲸的发声，结果表明cnn模型可很大程度地提高准确度。mishachandar等人通过cnn模型有效识别了人为声音、自然声音和海洋动物声音。song等人利用cnn方法在不同信噪比下实现水下噪声有效分类，且识别性能优于svm方法。yang等人通过提取多属性之间的相关性信息，利用深度cnn模型实现船舶目标识别。escobar-amado等人通过提取频谱图中胡须海豹的感兴趣区域，并利用cnn模型实现了胡须海豹声音的有效分类。luo等人对输入不同长度的水下声音数据频谱，提出了一种局部能量归一化的方法，并将cnn模型应用于齿鲸回声定位声音的有效检测。

3、以上研究大多根据单一特征进行识别，因此识别准确度较差。

技术实现思路

1、针对上述背景技术中存在的技术问题，本发明提出了一种基于特征融合技术和残差cnn的水声目标识别方法，通过提取mfcc和gfcc特征，并经过领域成分分析实现特征降维，将降维后的两种特征融合后，输入以resnet18模型为框架的残差cnn，训练后的模型用于水声目标的识别。

2、本发明具体采用以下技术方案予以实现：

3、提供一种基于特征融合和残差cnn的水声目标识别方法，包括：

4、获取目标水声的音频数据，提取所述音频数据的mfcc特征参数和gfcc特征参数，用于残差cnn的训练和测试；

5、通过领域成分分析法实现所述mfcc特征参数和所述gfcc特征参数的降维，筛选出重要性较高的特征参数；

6、将筛选出的所述mfcc特征参数和所述gfcc特征参数融合后，输入残差cnn模型，训练所述残差cnn模型，并进行分类识别。

7、作为本发明的进一步说明，所述提取所述音频数据的mfcc特征参数，包括：

8、将所述音频数据进行预处理，所述预处理的过程包括预加重，分帧和加窗；

9、预处理完成后，对每帧信号做fft得到频谱；

10、将所述频谱通过一组三角带通滤波器滤波得到mel滤波；

11、计算每个滤波器输出的对数能量；

12、将计算得到的所述对数能量进行离散余弦变换，求出l阶的mfcc；

13、根据l个mfcc倒谱系数值计算一阶倒谱差分参数和二阶倒谱差分参数；

14、将mfcc、计算得到的一阶倒谱差分参数和二阶倒谱差分参数这三部分参数组合作为信号的特征向量，用于残差cnn的训练和测试。

15、作为本发明的进一步说明，所述分帧过程包括：

16、将所述音频数据进行分段，将信号划分为若干个短时段的信号，每段256个样本，每段偏移128个样本。

17、作为本发明的进一步说明，所述gfcc特征参数的提取过程与所述mfcc特征参数的提取过程差别在于将mel三角滤波器组换为gammatone滤波器组。

18、作为本发明的进一步说明，所述gammatone滤波器的滤波阶数n＝4，所述gammatone滤波器数量n＝64。

19、作为本发明的进一步说明，所述领域成分分析法具体为：

20、假设数据集为s＝{(xi,yi),i＝1,2,…,n}，其中xi为样本，样本维度为p，yi为对应类标；

21、在所述数据集中随机选取一个参考点xi，并认为下一个xj的类别与xi相同，这相当于一个1-近邻分类器；

22、所述参考点xi从所述数据集中被选出的为p(ref(x)＝xj|s)，另一个点xj被选出做参考点的与上一个参考点的距离有关，定义两者距离公式如下：

23、

24、其中wr为特征权重值；假设被选中的概率与上一个参考点的距离相关，即：

25、p(ref(x)＝xj|s)∝k(dw(x,xj))；

26、其中k为表示两点距离的核函数，当dw(x,xj)很小，即距离很近时，k值很大；公式如下：

27、

28、由于x属于数据集s，因此p(ref(x)＝xj|s)的和应为1；

29、

30、用留一法对上述的随机分类器进行测试，即预留测试样本(xi,yi)，所述数据集中的其它样本作为训练集，那么测试点xi被相同类别参考点选中的为：

31、

32、所述随机分类器使用留一法正确分类测试样本的平均为：

33、

34、其中当yi与yj相等时，l为1，否则为0，则上式化简如下：

35、

36、其中：

37、

38、那么在整个样本中随机分类器正确分类简写如下：

39、

40、再增加惩罚项，调节模型复杂度：

41、

42、根据梯度下降算法训练模型，即可得到特征的重要性权值。

43、作为本发明的进一步说明，所述mfcc特征参数和所述gfcc特征参数融合后得到的融合参数，如下式所示：

44、mmix＝[(c1,c2,…,cm),(g1,g2,…,gn)]；

45、式中，cm和gn分别为从mfcc、gfcc中选取的特征参数。

46、作为本发明的进一步说明，所述残差cnn模型具体为：

47、在resnet18模型的基础上，去掉其中的池化层，并将输入层、全连接层和输出层换为适合识别任务的尺寸，搭建残差cnn模型。

48、本发明与现有技术相比具有以下优点：

49、本发明针对常见的水声特征参数有效维数不足以及抗噪性能差等问题，利用nca方法将mfcc和gfcc中重要性较大的特征参数筛选出来，并组合成混合特征参数，再将混合特征参数输入svm、grnn、3-cnn和resnet18模型进行水声目标识别。结果表明，在低信噪比下，mfcc特征的识别结果较差，而gfcc特征的抗噪性能较好。由于mfcc-gfcc-resnet18模型充分发挥了特征融合优势和残差cnn的特征挖掘能力，所以，相比其它模型，该模型识别结果较好，在无噪声场景中，达到了97.52％的识别准确度，并且在低信噪比下也可实现有效识别，在0db时，仍可达到90.15％的识别准确度。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪勇姚琦海杨益新
技术所有人：西北工业大学
我是此专利的发明人

上一篇：一种高炉矿渣微粉制备工艺的制作方法
下一篇：一种倒闸操作智能管控方法和移动应用与流程

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！