一种基于MFCC和支持向量机的水下机动小目标识别方法与流程

文档序号:12964175阅读:224来源:国知局
一种基于MFCC和支持向量机的水下机动小目标识别方法与流程
本发明涉及水下小目标的识别领域,具体涉及一种基于mfcc和支持向量机的水下机动小目标识别方法。
背景技术
:冷战时期,各国处在战争警戒状态,海上探测和防御的对象主要是敌对国家的舰船和潜艇等大型目标。随着冷战的结束,特别是前苏联解体后,水下武器装备小型化的迅速发展,蛙人、水下运载器及水下机器人等技术装备的日益成熟,这类目标具有隐蔽性好,破坏力强等明显“非对称”优势的攻击方式,已成为恐怖主义分子进行恐怖活动的重要方式。近年来,国内外等对蛙人等水下小目标的探测及识别进行了相关研究,但针对水下机动小目标的分类识别较少。很多国外海军的鱼雷自导系统,现在也已经具备了识别船舶要害部位的能力。文献[1](吴国,李靖,李训浩,陈耀明,袁毅.舰船噪声识别(iii)—双重谱和平均功率谱的特征提取和模板图.声学学报,1999,24(2):191-196页;吴国清,李靖,李训法,陈耀明,袁毅.舰船噪声识别(iv)—模糊神经网络.声学学报,1999,24(3):275-280页)对舰船的辐射噪声进行了大量的研究,提取了舰船辐射噪声的众多特征,并利用统计模式识别和模糊神经网络相结合的方式对舰船噪声进行识别。文献[2](liqihu,wangjinlin,weiwei.anapplicationofexpertsysteminrecognitionofradiatednoiseofunder-watertarget.beijing:instituteofacoustics,chineseacademyofsciences,1989.404-408)研制了水声目标专家识别系统,大多数情况下,当信噪比不低于3db时,信号的识别率超过了75%。在水声信号处理领域,目前常用的方法是将时域信号变换到时频联合域,通过时频联合分布揭示信号的非平稳性及频率随时间的变化特征。本专利借鉴语音识别中大量使用的mel倒谱系数(mfcc)提取方法,将mfcc特征提取方法应用到水下目标识别中。文献[3](石超雄.基于提升小波变换的mfcc在目标识别中的应用[j].声学技术,2014,33(4):372-375.)提出了使用提升小波变换的mfcc的方法,对水下被动声纳目标分类和识别。其仿真实验表明,提升小波变换方法提取mfcc具有识别率较高、对噪声鲁棒性较好的优点。文献[4](竺乐庆,张真.基于mfcc和gmm的昆虫声音自动识别[j].昆虫学报,2012,55(4):466-471.)将mfcc和高斯混合模型(gmm)应用于森林中昆虫的识别,在包含58种昆虫声音的样本库中进行了评估,取得了较高的正确识别率和较理想的时间性能。这些研究表明基于mfcc的方法可以用于复杂情况下的声音信号特征提取识别。目前基于mfcc对水下目标的识别方法普遍抗噪性低,多应用于信噪比较高的情况,因此对于目前信噪比较低、多种目标共存的复杂水下环境的小目标识别率较低。支持向量机是at&tbell实验室的v.vapnik等人根据统计学习理论提出的一种新的机器学习方法,已经在模式识别、回归分析和特征选择等方面得到了较好的效果。由于其建立在结构风险最小化准则之上,而不是仅仅使经验风险达到最小,从而使得支持向量分类器具有较好的推广能力。分类器采用支持向量机,充分利用了支持向量机的泛化能力,避免了神经网络的一些缺陷,如网络结构确定尚无明确的规则,无法保证收敛到全局最优点。技术实现要素:本发明的目的在于克服目前mfcc方法用于信噪比较低、多种目标共存的复杂水下环境的小目标识别存在的识别率较低的问题,提出了一种基于mfcc和支持向量机的水下机动小目标识别方法,该方法提取目标音频信号的混合mfcc特征量,包括:差分mfcc特征和mfcc特征;然后使用支持向量机对提取的混合mfcc特征量进行识别,实验数据表明本发明提出的识别方法有较高的目标识别率。为了实现上述目的,本发明提出了一种基于mfcc和支持向量机的水下机动小目标识别方法,所述方法包括:对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);提取时域信号x(n)的mfcc特征量,利用mfcc特征量获取差分mfcc特征量,将mfcc特征量、差分mfcc特征量和时域信号x(n)的峰值频率进行结合,形成mfcc混合特征量,将所述mfcc混合特征向量输入到训练好的支持向量机分类器进行识别,输出识别的类型。上述技术方案中,所述方法具体包括:步骤1)对待识别目标的原始声音信号s(n)进行预处理,得到每个语音帧的时域信号x(n);步骤2)计算时域信号x(n)的2k个mfcc系数,并将偶数位置的mfcc系数形成mfcc特征量;步骤3)对2k个mfcc系数进行二次特征提取,计算2k个差分mfcc系数,并将偶数位置的mfcc系数形成差分mfcc特征量;步骤4)计算时域信号x(n)的峰值频率f;步骤5)将mfcc特征量、差分mfcc特征量和峰值频率f进行结合,形成mfcc混合特征量;步骤6)将所述mfcc混合特征向量输入到训练好的支持向量机分类器进行识别,直至识别成功,输出识别的类型。上述技术方案中,所述步骤2)具体包括:步骤201)将时域信号x(n)经过离散傅里叶变换后得到线性频谱x(k):其中,n为表示傅里叶变换的点数;步骤202)计算线性频谱x(k)的能量谱,通过2k个带通滤波器对能量谱进行带通滤波;步骤203)计算每个带通滤波器组输出的对数能量为:步骤204)对输出的对数能量s(m)进行离散余弦变换得到mfcc系数:步骤205)时域信号x(n)的mfcc特征量为:[c(2),c(4),...,c(2k)]。上述技术方案中,所述步骤3)的具体实现过程为:差分mfcc系数的计算方法为:其中,k为常数,k=2;差分mfcc特征量为:[d(2),d(4),...d(2k)]。上述技术方案中,所述步骤5)中的mfcc混合特征量为:[c(2),c(4),...,c(2k),d(2),d(4),...,d(2k),f]其维数为2k+1。上述技术方案中,在所述步骤6)之前还包括:训练支持向量机分类器;具体包括:步骤s1)将训练样本进行分类;步骤s2)对训练样本进行预处理形成时域信号;步骤s3)将每个训练样本时域信号作为x(t),按照步骤1)、步骤2)、步骤3)、步骤4)和步骤5)构建每个训练样本的时域信号的mfcc混合特征向量;步骤s4)将所有训练样本的mfcc混合特征向量作为支持向量机的输入,训练出支持向量机分类器。上述技术方案中,所述支持向量机分类器为基于决策有向无环图的支持向量机;当识别的类型数为m时,所述支持向量机分类器需要构造m(m-1)/2个一对一分类器。本发明的优点在于:1、本发明的方法提取的mfcc混合特征模仿人的听觉特性,将人耳出色的声音信号处理能力有效的应用于水下机动小目标分类;同时利用了信号的帧间特征,减小了环境噪声产生的误差;采用支持向量机对mfcc混合特征进行目标分类时,可以充分利用支持向量机出色的学习能力和容错能力等优点,并在很大程度上克服了“维数灾难”和“过学习”等问题;2、本发明提出的识别方法特为多种机动小目标共存的水下环境设计,由于水下环境的复杂性,但是每种目标有其特有的频率分布,因此频域特征也是目标的一种重要的特征,将频域特征加入mfcc特征向量可以充分利用了信号频域特征。附图说明图1为本发明的基于mfcc和支持向量机的水下小目标识别方法的流程图;;图2为四类问题的dagsvm结构图。具体实施方式下面结合附图和具体实施例对本发明做进一步详细的说明。语音学中为了描述听觉上分辨声音高低的感受从而引入了音调的概念。对频率低的声音,人们听起来感觉它的音调低,对频率高的声音,人们听起来感觉它的音调高。但是音调和音色的频率并不是成正比例的关系。也就是说,人的耳朵对声音的频率进行非线性处理,即对不同频率的语音具有不同的感知能力。为了更好的描述音调,人们利用了mel频率刻度,规定音调的单位是mel。临界带宽为划分mel频率刻度的重要依据。而临界宽带的引入是为了描述窄带噪声对纯音的掩蔽效应。当加大噪声的带宽时,这种窄带噪声对纯音的掩蔽量最初是增大的,但是当超出某一带宽后就不会增大了,这一带宽就被称为临界带宽。实验表明:当中心频率在1khz以下时,临界带宽大致呈线性分布,约为100hz;当中心频率超过1khz时,随着中心频率的增加,临界带宽呈对数增加。因此符合人的听觉系统的频率刻度划分应该在低频部分具有较高的频率分辨率,而在高频部分具有较低的频率分辨率。因此本发明提出了一种基于mfcc的混合特征识别方法。如图1所示,一种基于mfcc混合特征和支持向量机(svm)的水下机动小目标识别方法,所述方法具体包括:步骤1)采集待识别目标的原始声音信号s(n);原始声音信号s(n)经过预加重、分帧和加窗等处理,得到每个语音帧的时域信号x(n);步骤2)计算时域信号x(n)的2k个mfcc系数,并将偶数位置的mfcc系数形成mfcc特征量;具体包括:步骤201)将时域信号x(n)经过离散傅里叶变换(dft)后得到线性频谱x(k):其中,n为表示傅里叶变换的点数。步骤202)计算线性频谱x(k)的能量谱,通过若干个带通滤波器对能量谱进行带通滤波;计算线性频谱x(k)幅度的平方,即能量谱;通过一组mel尺度的三角滤波器组,在频域对能量谱进行带通滤波;其中mel频率滤波器组为在语音的频谱范围内设置的若干个带通滤波器hm(k),其中心频率为f(m),m=1,2,…m,m为带通滤波器的个数,m为偶数;在本实施例中,m=24;每个带通滤波器具有三角形滤波特性,其传递函数为:其中步骤203)计算每个带通滤波器组输出的对数能量为:步骤204)对输出的对数能量s(m)进行离散余弦变换(dct)得到mfcc系数:步骤205)时域信号x(n)的mfcc特征量为:[c(2),c(4),...,c(m)];在步骤202)中,带通滤波器的个数为m,能得到m个mfcc系数,其中选择偶数位数的mfcc系数组成mfcc特征量;奇数位数的mfcc系数用于构造后续的mfcc特征量;步骤3)对2k个mfcc系数进行二次特征提取,计算2k个差分mfcc系数,并将偶数位置的mfcc系数形成差分mfcc特征量;二次特征提取是对原始特征向量序列进行再分析,通过对特征向量运用加权、差分、筛选等方法,进一步剥离出隐藏在声音信号背后的目标特征。对特征向量的一阶差分可以获取特征向量的变化速度,特征向量的变化体现了目标声音信号的变化。差分mfcc系数的计算方法为:其中,k为常数,优选的,k=2;得到的差分mel倒谱系数d(n)是前两帧和后两帧的线性组合。差分mfcc特征量为:[d(2),d(4),...,d(m)]。步骤4)计算峰值频率f;步骤5)将mfcc特征量、mfcc差分特征量和峰值频率进行结合,形成mfcc混合特征量;水下机动小目标的辐射噪声信号有类似于语音信号的特点,因此使用mfcc和(差分mfcc相结合的方法,将辐射噪声的动态特征(瞬变特征)也加以考虑,这样目标信号的动态特征和静态特征信息形成互补,能有效提高系统的性能。由于水下小目标辐射噪声信号又有不同于纯语音信号的特点,每种目标辐射噪声信号又有各自独立的频率分布,因此将目标信号的峰值频率作为特征之一加入特征向量。混合特征量为:[c(2),c(4),...,c(m),d(2),d(4),...,d(m),f],维数为25,其中包络12维的mfcc特征量、12维的差分mfcc量和峰值频率。步骤6)将混合特征向量输入支持向量机分类器,从根节点输入到基于决策有向无环图的支持向量机(ddagsvm)中,根据每个节点的二分类器的输出值,确定下一层的分类节点,最终到第五层得到分类输出值,根据输出值得到分类结果。在所述步骤6)之前还包括:训练支持向量机分类器;具体包括:步骤s1)将训练样本进行分类;步骤s2)对训练样本进行预处理形成时域信号;步骤s3)将每个训练样本时域信号作为x(t),按照步骤1)、步骤2)、步骤3)、步骤4)和步骤5)构建每个训练样本的时域信号的mfcc混合特征向量;步骤s4)将所有训练样本的mfcc混合特征向量作为支持向量机的输入,训练出支持向量机分类器。支持向量机(supportvectormachine)分类器是在研究二分类问题的基础上提出来的,但是在实际应用中,我们常常要进行多分类研究。为了解决这个问题,本发明采用一种适合多分类的基于决策有向无环图(decisiondirectedacyclicgraph,ddag)的支持向量机多值分类算法来构造分类器。该方法本质上仍是1-vs-1分类算法,只是在决策过程中引入了有向无环图的算法。对k个类别的分类问题需要构造k(k-1)/2个ovo(one-versus-one,一对一)分类器。每个节点代表一个ovo分类器,顶层只有一个节点,第i层包含i个节点,第i层第j个节点指向第i+1层第j和第j+1个节点,底层k个节点代表最终分类的k个类别。实例:提取外场实验的水下机动小目标辐射噪声数据,首先提取水下蛙人、发声哺乳动物、水下机器人、水面快艇等目标的混合mfcc特征向量,然后训练支持向量机分类器。下面给出了传统的mfcc特征识别方法和本发明提出的混合mfcc特征识别方法的对比,表1是四类目标的正确识别率对比,表1水下蛙人水下机器人水面快艇发声哺乳动物训练数据100%98%99%100%测试数据92%91%90%93%由表1的数据处理结果可以看出,本发明的方法的识别率较高,对目标的识别率均达到了90%以上。说了基于mfcc的混合特征提取方法是有效的,说明了支持向量机可以作为水下机动目标的分类器。本发明出的方法可以应用于水下机动小目标的分类识别。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1