一种基于IMF能量熵与PCA的水下船舰噪声特征提取方法与流程

文档序号:12864154阅读:2505来源:国知局
一种基于IMF能量熵与PCA的水下船舰噪声特征提取方法与流程

本发明涉及水下目标识别领域,尤其是一种基于imf能量熵与pca的水下船舰噪声特征提取方法。



背景技术:

目前,我国对海洋资源的需求不断增加,开发和利用规模不断加大。水下目标识别技术也迅速发展,并应用到了诸多方面,如鱼类探测、海洋生物研究以及水下潜艇的探测等。水下目标识别对于生物保护以及加强海洋防御安全有重要作用,对于海洋开发利用和可持续发展具有重要意义。而水下船舰噪声信号的识别与分类是水下目标识别分类的重点及难点,主要通过船舰的发动机噪声来判断船舰的类别。在复杂的海洋环境中,船舰等水声目标信号辐射噪声的产生机理十分复杂,成分多样。同时由于水声信道的复杂多变以及水声信号传播的多途效应,使水声信号往往呈现非高斯、非平稳、非线性的“三非”性质。而传统的方法都是基于信号和噪声是平稳和高斯随机过程这一假设的,随着水声目标减振降噪性能的提高,基于fourier变换的传统信号处理方法很难精确的提取水下辐射噪声的特征。且传统方法提取到的特征向量数据量大,容易造成维数灾,在分类器中极易造成过拟合现象,降低分类精度。因此提取完备的特征信息,降低数据维度成为水声信号特征提取及分类的关键。



技术实现要素:

本发明目的在于提供一种精确提取噪声信号特征、减少运算量、提高分类精度的基于imf能量熵与pca的水下船舰噪声特征提取方法。

为实现上述目的,采用了以下技术方案:本发明所述方法包括以下步骤:

步骤1,提取船舰噪声信号均值、方差、峰值、偏度时域特征参数,作为时域特征向量,构成时域特征矩阵;

步骤2,采用emd改进的eemd方法,将原船舰噪声信号分解,得到imf分量,并将imf分量转化为能量特征向量,从而观测自频带能量特征的变化,构成频域特征向量,与步骤1中的时域特征向量共同构成特征矩阵a;

步骤3,利用pca降维方法对特征矩阵a做降维处理,将高维度的特征矩阵映射到低维度作为新的特征,且尽可能的代表原特征,构成特征矩阵b;

步骤4,训练lssvm(最小二乘支持向量机)参数,根据风险最小化原则,调整参数γ和核宽度σ,最后将降维后的特征矩阵b向量输入到分类器中,测验分类结果,并与未降维的特征矩阵分类结果进行对比。

进一步的,步骤2中,所述emd方法为经验模态分解,可以将动态信号的本征模态分量(imf)提取出来;所述eemd方法是在emd方法的基础上给信号加入极小幅度白噪声,利用白噪声频谱均衡分布的特点来均衡信号的中断区域,从而去除模式混淆;所述eemd方法提取的imf分量的能量熵构成频域特征矩阵,并与步骤1中的时域特征向量构成船舰噪声特征矩阵a,提取更加完整、全面的特征。

进一步的,步骤3中,将提取到的时频域特征矩阵a与pca相结合,做降维处理,降低数据维度,避免在分类器中发生过拟合现象。

与现有技术相比,本发明方法具有如下优点:

1、提出时域频域信息相结合的方法,采用均值,方差,峰值,偏度等时域特征以及求得的imf能量熵构成的频域特征共同组成的特征矩阵,使得获得的特征信息更完整,更全面;

2、针对传统方法提取的特征矩阵维数过高,容易产生维数灾,从而在分类器中产生过拟合问题,采用pca降维方法,分析原特征矩阵的主成分以及贡献率,将累计贡献率>95%的主成分代替原来的所有评价指标,达到降维目的。

附图说明

图1是本发明方法的流程图。

图2是本发明方法中imf能量熵的流程图。

图3为样本的采样信号图。

具体实施方式

下面结合附图对本发明做进一步说明:

如图1所示,本发明所述方法包括以下步骤:

步骤1,提取船舰噪声信号均值、方差、峰值、偏度等时域特征参数,作为时域特征向量,构成时域特征矩阵;

步骤2,对原船舰噪声信号进行eemd分解,经验模态分解(emd)是信号处理领域解决非平稳、非线性信号的新方法,它可以将动态信号的本征模态分量(imf)提取出来,但在实际应用中,由于端点效应或间歇性的影响,使得emd分解引起模式混淆现象。而集成经验模式分解(eemd)方法可以克服这种现象,它给信号加入极小幅度白噪声,利用白噪声频谱均衡分布的特点来均衡信号的中断区域,从而去除模式混淆。分解后得到imf分量,考虑到不同信号的不同频率成分,且imf幅度差异,将imf的能量熵作为特征向量构成频域特征并与时域特征参数相结合,形成信息互补,从而进一步提高识别率,与步骤1中的时域特征向量共同构成特征矩阵a;

步骤3,利用pca降维方法对特征矩阵a做降维处理,将高维度的特征矩阵映射到低维度作为新的特征,且尽可能的代表原特征,构成特征矩阵b;一般情况下,选取累计贡献率>90%的主成分代替所有主成分,并将特征值对应的特征向量与原矩阵的乘积作为新的特征矩阵输入到分类器中;

步骤4,训练lssvm(最小二乘支持向量机)参数,根据风险最小化原则,调整参数γ和核宽度σ,最后将降维后的特征矩阵b向量输入到分类器中,测验分类结果,并与未降维的特征矩阵分类结果进行对比。

实施例1:

本发明方法包括以下几个步骤:

(1)提取时域特征信息

提取船舰噪声信号的时域特征参数,作为时域特征向量,其参数分别为:

均值

a=mean(x)

方差

峰值

f=max(x)

偏度

其中,xi是采样数据,为均值,e是期望值,均方根rms的公式为:

t=[a,d,b,f],均值,方差,峰值,偏度信息,从不同角度反映振动信号的时域特征,并且具有一定的互补性,将这四个时域参数组合起来,形成四维向量t=[a,d,b,f],可以作为船舰噪声的时域特征向量。

(2)提取频域信息imf能量熵

运用emd的改进模型eemd与信息熵方法,提取船舰噪声信号的频域特征。如附图2所示,首先,在原始振动信号x(t)中叠加均值为零、标准差是常数的随机高斯白噪声wi(t),得到待分解的信号xi(t)

xi(t)=x(t)+wi(t)

其中,wi(t)是第i次加入高斯白噪声后的信号。

对上式进行emd分解,循环j次后可得到第j个imf分量fij(t),

循环n次后,计算imf的总体平均值:

在此基础上引入能量熵概念,求每个imf分量的能量ei

对每个imf分量的能量进行归一化处理:

pm=em/e

求每个imf的能量熵:

将imf的能量熵值作为频域特征向量来区分不同模式间的分布情况。

(3)pca降维

现取a,b,c,d四类船舰噪声,每类噪声包含训练样本30个,测试样本30个,则目前的特征向量矩阵为120*16,采用pca降维处理,首先对其进行标准化处理,消除量纲和数量级的限制,标准化的计算公式如下:

式中,u代表向量x的均值向量;std(x)表示x的标准向量差;为标准后的结果。

然后解相关系数矩阵r,相关系数矩阵反应了2个变量的线性相关程度的大小。相关系数越大,表明2个变量间的线性关系越密切;相关系数越小,标明2个变量间的线性相关程度越小。

式中,rij(ij=1,2,…,p)为原变量xi与xj相关系数,其计算公式为:

分别为第i个和第j个指标的平均值;n和p分别为样本数和数据维数。

计算特征值与特征向量,令det(r-λi)=0,求出其特征值,并使其按照大小排列,λ1≥λ2≥…≥λp。最后分别求出对应与特征根λi的特征向量ui。

计算贡献率与累计贡献率,第k个主成分yk的方差贡献率为

主成分ym的累计贡献率为

选择累计贡献率达到95%的前i个主成分,此时认为i个主成分的可代替原来的n项指标。获得主成分后,按照特征值的由大到小的顺序提取前i个特征值所对应的特征向量μi(1,2,…,n)构成的投影矩阵。将原始数据与投影矩阵相乘,最终得到主成分的得分,作为特征向量输入到分类器中。

(4)使用最小二乘支持向量机分类

分类器模型采用suyukens等提出的svm改进模型lssvm。假设有m类分类样本,则训练样本设为s1:{(xi,yi)},i=1,2,…n,其中,yi是1和-1组成的m维向量,当样本属于第j时,则yi的第j为1,其他均为-1。现将特征向量阵设为x,分类阵设为y,则它们的第i行分别为xi和yi。

lssvm将svm的不等式约束问题转化为等式约束问题:

式中,w和b为分类超平面,的相关参数,为分类经验风险,表示分离间距的数值大小,γ>0为惩罚因子,用于在训练中平衡学习机器的复杂性和经验风险。

为解决上述优化问题,引入拉格朗日函数:

对于拉格朗日乘子中的变量w,b,e,α求极值,经变换后可得到:

式中,yi为y的第i行,ωjk(t)=yij.yik.k(xj,xk),单位阵i∈rn×n,αt和bi分别为对应yi的lagrange乘子向量和常数项,可建立ls-svm函数:

式中,x为测试数据,xi为训练数据;k(.)为核函数,通常选择rbf型函数:

(xi,xj)=exp(-||xi-xj||2)/σ2

最后,由判别函数cj(x)=sign(y,j(x))(j=1,2,…m)决定x的状态类别。

本发明实施例的识别效果可以通过以下仿真数据进一步说明:

(1)现取a,b,c,d四种样本,分别取训练样本各30个,测试样本各30个,a,b,c,d的噪声信号采样图如附图3所示。

分别将训练样本的时域信息以及imf能量熵等频域信息提取,构成120*16的特征矩阵,如表1所示:

表1样本时域与imf能量熵值

经过pca降维后,选取主成分贡献率>95%的主成分,并将其对应的特征值与原矩阵的乘积作为新的特征矩阵输入到分类器中:如表2

表2pca降维后的特征矩阵(前4*10)

将数据输入到分类器中进行测试,并未降维数据分类进行对比,结果如下:

表3识别率对比

由表3可知,imf信息熵与时域信息结合的识别率经过降维后的识别率比未降维前的识别率提高了5%左右,证明了本发明方法的有效性。

以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1