本发明属于基频提取领域。
背景技术:
1、基频(fundamental frequency)是频域中一种重要的音频特征,获取基频特征,对解决船只的目标识别任务具有重要的意义。目前来说,由于水上环境较为复杂,加上船只的运动状态难以确定,导致基频特征的变化差异非常大。船只运动状态一旦变化,基频特征就极为不稳定。而当掌握了不同运动状态下的基频生成方法,就可以丰富目标船只的基频特征数据集,网络模型会更加准确的识别目标船只。运动状态不变条件下的基频提取是解决上述问题的基石,现存的研究对数据特征的提取方法做出了很多贡献,但处理方式较为复杂,大量的运用传统信号处理方法,对于不熟悉信号的基频提取存在难度高,鲁棒性差的问题。
技术实现思路
1、本发明是为了解决现有基频提取任务的声信号特征提取方法存在处理方式复杂、鲁棒性差的问题,提出了一种基于声重组特征网络的水面航行器声信号基频提取方法。
2、本发明所述基于声重组特征网络的水面航行器声信号基频提取方法,包括:
3、步骤一、将待进行基频提取的声信号按照lhs算法产生的最小帧长切割成等长的音频段;
4、步骤二、采用训练后的声重组特征网络提取音频段的声信号的基频特征;
5、步骤三、采用训练后的基频提取网络利用基频特征对音频段进行多个通道的基频特征提取;
6、步骤四、采用展平层对多个通道的基频特征展平,并利用决策层确定音频段的基频预测值。
7、进一步地,本发明中,步骤三中,声重组特征网络包括:卷积层,所述卷积层包括9个卷积块,所述9个卷积块的卷积核分别为3、5、7、9、11、13、15、17和19。
8、进一步地,本发明中,训练后的声重组特征网络接收音频段后,将每个音频段同时输入至9个卷积块获取9个基频特征信号,将9个基频特征信号拼接后,获得每个该段音频的完整基频特征信号。
9、进一步地,本发明中,基频提取网络包括第一一维卷积层、第一批标准化层、第一最大池化层、第二一维卷积层、第二批标准化层和第二最大池化层;声信号的基频特征依次经第一一维卷积层、第一批标准化层、第一最大池化层、第二一维卷积层、第二批标准化层和第二最大池化层获取多个通道的基频特征。
10、进一步地,本发明中,决策层确定音频段的基频预测值的方法为:决策层首先计算展平后的每个基频特征对应的基频值的后验概率,然后将后验概率最大的基频值作为该段音频信号的基频预测值。
11、进一步地,本发明中,还包括声重组特征网络和基频提取网络的训练步骤,具体为:
12、步骤a、利用已知数据集获取带有基频标记的训练数据,将带有基频标记的训练数据同时输入至声重组特征网络的9个卷积块,获取9段基频特征信号;
13、步骤b、将9段基频特征信号拼接后传输至基频特征提取网络;获得音频段的多个通道的基频特征;
14、步骤c、采用展平层对多个通道的基频特征进行展平,利用决策层计算展平后的基频特征的后验概率,并利用所述后验概率确定该段音频的基频预测值,利用所述基频预测值与该段音频标记的基频值计算损失函数,判断所述损失函数的曲线是否达到过拟合状态,若是,则完成声重组特征网络、基频提取网络的训练,否则,执行步骤d;
15、步骤d、采用反向传播法,对声重组特征网络、基频提取网络的参数值进行更新,返回执行步骤a。
16、进一步地,本发明中,步骤c中,利用所述基频预测值与该段音频标记的基频值计算损失函数的具体方法为:
17、在决策层设置4个全连接层,计算损失函数具体为:
18、
19、其中,li(x,y)为交叉熵损失函数,ai为第i个全连接层的损失权重项,n为全连接层个数。
20、进一步地,本发明中,步骤a中,还包括对已知数据集进行扩充的步骤,具体为:
21、采用多通道数据扩充方法对已知数据集进行扩充。
22、进一步地,本发明中,步骤a中,利用已知数据集获取训练数据的过程为:
23、将已知数据集中的声信号等间隔分割为音频段;分割后的音频段输入至lhs模型,获得带有基频标签的数据;将带有基频标记数据作为训练数据。
24、本发明先利用声重组特征网络提取水声信号的特征,然后将其输入到基频提取网络(采用卷积神经网络实现)中进行基频提取以验证特征提取有效。所述基频提取网络为了使网络学习到最优的结果,本发明提出基于权重选择的训练方法(weights select basedtraining method)。训练过程引入四个全连接层即实现分类器(classifier)功能,对于每个全连接层都施加一个权重。本发明设计了水面航行器发动机声信号数据集进行实验验证,实验结果表明,使用本发明提出的方法训练的第40轮次(epoch)即可达到70%准确率,比仅使用卷积神经网络进行基频提取的效果更加出色,说明声重组特征网络提取的特征比较全面。网络更为轻量,处理效率高,鲁棒性强。
1.基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,包括:
2.根据权利要求1所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,步骤三中,声重组特征网络包括:卷积层,所述卷积层包括9个卷积块,所述9个卷积块的卷积核分别为3、5、7、9、11、13、15、17和19。
3.根据权利要求2所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,步骤三中,训练后的声重组特征网络接收音频段后,将每个音频段同时输入至9个卷积块获取9个基频特征信号,将9个基频特征信号拼接后,获得每个该段音频的完整基频特征信号。
4.根据权利要求1、2或3所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,基频提取网络
5.根据权利要求4所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于决策层确定音频段的基频预测值的方法为:
6.根据权利要求4所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,还包括声重组特征网络和基频提取网络的训练步骤,具体为:
7.根据权利要求4所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,步骤c中,利用所述基频预测值与该段音频标记的基频值计算损失函数的具体方法为:
8.根据权利要求4所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,步骤a中,还包括对已知数据集进行扩充的步骤,具体为:
9.根据权利要求4所述的基于声重组特征网络的水面航行器声信号基频提取方法,其特征在于,步骤a中,利用已知数据集获取训练数据的过程为: