本发明涉及回波波形的特征提取,尤其涉及一种基于emd和随机森林的海底底质声呐回波特征提取融合方法,属于海底测绘领域。
背景技术:
海底底质声呐回波波形能反映出海底地貌及底质特征的相关信息,是海洋地质调查和海底底质特征提取、分类反演的重要信息源,对于军事领域(距离预报、潜艇沉底隐蔽地址选择等方面)也有着十分重要的意义。目前常用方法是先提取海底回波信号的统计特征量,然后通过比较特征量间的差异从而实现海底底质的分类。存在特征向量维度大,分类器设计困难,分类效果不好及不能获得最具代表性的特征向量。
在海底声呐回波波形的研究中,正入射超声脉冲的海底回波形状与海底表面的粗糙度、沉积物中声波的衰减系数、海底声速结构、密度结构等有关,包含着有关沉积物的结构和物理性质的信息。不同硬度和粗糙度的沉积物的回波形状差别很大,硬底质的回波波形狭窄尖锐且峰值较大,而软底质的回波波形较平坦但拖尾较长。
水下回波信号中包含了大量的目标特征信息,这是由于主动回波是发射信号与目标的冲激响应的卷积,再加上各种干扰及背景噪声等,因而主动回波的特征提取一直是人们关心的问题。为了从回波中提取目标特征以进行目标分类和识别,人们已经提出了很多信号处理方法,如高阶谱、短时傅立叶变换和小波变换。传统上,可以提取回波信号的时域波形特征作为分类特征量,这些特征包括最大峰值、最大峰值所对应的时间、有效值、绝对均值、方差、峰值因子、波形因子、质心、波形宽度、峭度、偏度等。同时,傅立叶变换是信号处理的主要工具,但是,傅立叶分析只能获得信号的整体频谱,而不能获得信号的局部特征。因此,在信号处理领域提出了一些时频分析方法,而这些时频分析方法都有一些局限性。emd理论的出现打破了这些局限性。emd方法在处理非平稳、非线性复杂信号时,有着十分显著的优点。
针对多样本emd特征量多不利于分类器训练这一缺点,本文提出通过随机森林进行特征量融合这一方法进行改进。目前常用的特征融合技术有串行特征融合和并行特征融合两种。并行特征融合实际上是酉空间上的特征融合,它采用复向量的形式λ=α+iβ(i为虚数单位,α、β分别同一样本的两个不同特征量),把两个特征组合一起。很显然,并行特征融合只能融合两个特征,对于多个特征的融合显得无能为力。而串行融合方法则可以组合多个特征量。于是提出结合emd和随机森林的特征提取模型,通过随机森林重要性评估的方法能够进一步估计出特征向量中的权重,进行特征融合,最后便于分类器进行分类。
技术实现要素:
本发明的目的是针对现有的声呐回波波形特征提取方法对分类反演准确性的影响,及多样本emd特征量多不利于分类器训练这一缺点,本发明提出了通过粒子滤波进行特征量融合估计这一方法进行改善,是一种适用于海底底质声呐回波波形特征提取和分类方法
本发明的目的是这样实现的:步骤如下:
步骤一:针对海底底质声呐回波信号x(t),进行经验模态分解,得到imf分量的和;
步骤二:对海底回波信号x(t)通过emd分解结果进行特征量提取;
步骤三:通过随机森林的方法进行特征融合得到声呐回波信号特征量f,用随机森林的方法进行特征量融合得到最终的声呐回波信号特征量。
本发明还包括这样一些结构特征:
1.步骤一具体为:
步骤1.1、运用三次样条插值确定回波待分解信号x(t)的上下包络线,
首先确定回波待分解信号x(t)中所有局部极大值点和局部极小值点,然后运用三次样条函数进行拟合,得到上包络线xmax(t)和下包络线xmin(t);
步骤1.2、计算上包络线和下包络线的均值m(t)=[xmax(t)+xmin(t)]/2;
步骤1.3、将回波信号x(t)通过时间特征尺度分解imf分量ii(t)和的形式:
2.步骤二具体为:
步骤2.1、提取海底声呐回波信号x(t)的时域能量e;
提取的特征量是以上包络线和下包络线的均值曲线m(t)=[xmax(t)+xmin(t)]/2为波形信号,时域能量e为:
步骤2.2、提取海底声呐回波信号x(t)的波形指数fsha,
提取的特征量是回波信号的波动程度由波形指数
步骤2.3、提取海底声呐回波信号x(t)的加权波形指数fshaw;
回波信号x(t),其共有n阶imf分量,各阶imf分量的波形指数分别为fsha1,fsha2,……,fshan,其对应的权系数分别为ω1,ω2,……,ωn,则加权后的波形指数为fshaw:
步骤2.4、提取海底声呐回波信号x(t)的加权能量矩fimfw,
声呐回波信号x(t),其中x(i)表示回波信号的采样值,其能量矩为
3.步骤三具体为:
步骤3.1、构建随机森林的模型,
采用随机森林的方法对由emd方法得到的全体特征量f=(e,fsha,fshaw,fimf,fimfw)进行训练集样本,得到随机森林分类器;
步骤3.2、通过随机森林模型对回波信号进行分类,得到重要性指标;
去掉一维特征向量将剩余数据集平均分为两个部分,称为a和b两个数据集;利用训练好的随机森林模型对a数据集进行分类,得到准确率1;对b数据集的第j维进行加噪处理,并利用训练好的随机森林模型对加噪后的b数据集进行分类,得到准确率2;令准确率1和准确率2的差值作为第j维的重要性估计值;
步骤3.3、通过重要性指标给每维特征量赋予权重,进行特征融合,
确定重要性估计值的范围,对于小于重要性估计值差值ij将其特征量舍弃,对于大于重要性估计值差值ij将其特征量进行权重分配,对于第j维特征量其权重为:
与现有技术相比,本发明的有益效果是:1)、一种基于emd和随机森林的海底底质回波信号特征提取融合方法,采用三次样条插值函数用于原信号的平滑处理,使所得出的均值曲线可以进一步接近原始信号的极值分布,进而降低分解过程中所产生的拟合误差。
2)、一种基于emd和随机森林的海底底质回波信号特征提取融合方法,利用emd加权方法进行特征提取,改善了传统提取方法对不能在时频域较好分析回波信号及提取的特征量不具备代表性的问题。
3)、一种基于emd和随机森林的海底底质回波信号特征提取融合方法,采用的随机森林的方法进行特征量重要性衡量,进行特征融合,改善目前特征融合的局限性,能较好的解决特征量多不便于训练的问题,同时还能减小样本的测试时间和训练时间。
附图说明
图1为本发明一种基于emd和随机森林的海底底质回波信号特征提取融合方法流程图。
图2为本发明随机森林特征融合流程图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述。
本发明的具体步骤如下:
步骤一:针对海底底质声呐回波信号x(t),进行经验模态分解(edm)分解,得到imf分量的和。
具体为:
步骤1.1、运用三次样条插值确定回波待分解信号x(t)的上下包络线。
首先确定回波待分解信号x(t)中所有局部极大值点和局部极小值点。然后运用三次样条函数对它们进行拟合,得到上包络线xmax(t)和下包络线xmin(t)。
步骤1.2、计算上包络线和下包络线的均值m(t)=[xmax(t)+xmin(t)]/2。
步骤1.3、将回波信号x(t)通过时间特征尺度分解imf分量ii(t)和的形式。
x(t)的表达式:
步骤二:对海底回波信号x(t)通过emd分解结果进行特征量提取。
具体为:
步骤2.1、提取海底声呐回波信号x(t)的时域能量e。
提取的特征量是以上包络线和下包络线的均值曲线m(t)=[xmax(t)+xmin(t)]/2为波形信号,其实际为离散信号,对其幅度进行积分,得到时域能量e:
步骤2.2、提取海底声呐回波信号x(t)的波形指数fsha。
提取的特征量是回波信号的波动程度由波形指数
步骤2.3、提取海底声呐回波信号x(t)的加权波形指数fshaw。
回波信号x(t),其共有n阶imf分量,各阶imf分量的波形指数分别为fsha1,fsha2,……,fshan,其对应的权系数分别为ω1,ω2,……,ωn,令其加权后的波形指数为fshaw。
步骤2.4、提取海底声呐回波信号x(t)的加权能量矩fimfw。
声呐回波信号x(t),其中x(i)表示回波信号的采样值,其能量矩为
步骤三:通过随机森林的方法进行特征融合得到声呐回波信号特征量f;
用随机森林的方法进行特征量融合得到最终的声呐回波信号特征量,便于分类器的分类;
具体为:
步骤3.1、构建随机森林的模型。
采用随机森林的方法对由emd方法得到的全体特征量f=(e,fsha,fshaw,fimf,fimfw)进行训练集样本,得到随机森林分类器。
步骤3.2、通过随机森林模型对回波信号进行分类,得到重要性指标。
去掉一维特征向量将剩余数据集平均分为两个部分,称为a和b两个数据集;利用训练好的随机森林模型对a数据集进行分类,得到准确率1;对b数据集的第j维进行加噪处理,并利用训练好的随机森林模型对加噪后的b数据集进行分类,得到准确率2;令准确率1和准确率2的差值作为第j维的重要性估计值。
步骤3.3、通过重要性指标给每维特征量赋予权重,进行特征融合。
确定重要性估计值的范围,对于小于重要性估计值差值ij将其特征量舍弃,对于大于重要性估计值差值ij将其特征量进行权重分配,对于第j维特征量其权重为:
所述的步骤1.1,得到平滑的海底声呐回波信号。
所述的步骤2.4,对加权能量矩进行特征提取。
所述的步骤3.2中,通过随机森林方法对海底声呐回波信号进行特征提取融合。
也即,本发明提出了一种针对海底底质声呐回波特征量融合的特征提取方法,采用emd方法对回波信号进行分解,得到各阶imf分量,进行回波波形特征量提取,利用emd和随机森林方法对底质声纳回波进行特征提取融合,改善了传统融合方法对特征量的要求、同时解决特征量存在冗余的问题。采用emd对声呐回波信号进行特征量提取解决特征量单一在时域或者频域的问题,同时应用随机森林方法进行特征量融合也能较好的解决便于反演和特征冗余的问题,同时还能减小测试时间和训练时间。
如图1所示,具体步骤如下:
步骤一:针对海底底质声呐回波信号x(t),进行经验模态分解(edm)分解,得到imf分量的和。
具体为:
步骤1.1、运用三次样条插值确定回波待分解信号x(t)的上下包络线。
首先确定回波待分解信号x(t)中所有局部极大值点和局部极小值点。
然后运用三次样条函数对它们进行拟合,得到上包络线xmax(t)和下包络线xmin(t)。将三次样条插值函数s(x)的二阶导数视为mj(j=0,1,…,n),而mj代表细梁在xj截面处的弯矩,而mj和相邻两个弯矩有着必要的关系,所以称之为三弯矩方程。s(x)是一条经过形值点的曲线,可以利用对三弯矩方程进行求解的思路来解出s(x)。运用三次样条插值进行曲线拟合提高了分段线性插值函数在节点处的光滑性。对于给定n+1个不同节点x0,x1,…,xn的函数值y0,y1,…,yn,其中在a=x0<x1<…<xn=b范围内所构建的三次样条插值函数s(x)应满足以下条件:s(x)在[a,b]上具有二阶连续导数;s(x)=yk(k=0,1,…,n);在每个子区间s(x)是三次多项式。
步骤1.2、计算上包络线和下包络线的均值。
其表达式为m(t)=[xmax(t)+xmin(t)]/2。
步骤1.3、将回波信号x(t)通过时间特征尺度分解imf分量ii(t)和的形式。
用原始回波信号x(t)减去均值m(t),得到第一个分量h1(t)=x(t)-m(t)。假若h1(t)不满足imf的两个条件,则需要把h1(t)作为原始待分解信号重新按照步骤1.1,1.2和1.3进行计算,直到h1(t)满足imf条件为止,此时的h1(t)就是一个imf分量,且令i1(t)=h1(t)。将剩余量r(t)=x(t)-i1(t)重新作为待分解信号,按照上面步骤依次进行计算,得出第二个分量i2(t),第三个分量i3(t),…,当剩余量r(t)为常值或者单调时分解结束,此时的r(t)被称作残余量,它代表着原待分解信号的趋势。由此可得x(t)的表达式:
步骤二:对海底回波信号x(t)通过emd分解结果进行特征量提取。
具体为:
步骤2.1、提取海底声呐回波信号x(t)的时域能量e。
提取的特征量是以上包络线和下包络线的均值曲线m(t)=[xmax(t)+xmin(t)]/2为波形信号,其实际为离散信号,对其幅度进行积分,得到时域能量e:
步骤2.2、提取海底声呐回波信号x(t)的波形指数fsha。
提取的特征量是回波信号的波动程度由波形指数
步骤2.3、提取海底声呐回波信号x(t)的加权波形指数fshaw。
回波信号x(t),其共有n阶imf分量,各阶imf分量的波形指数分别为fsha1,fsha2,……,fshan,其对应的权系数分别为ω1,ω2,……,ωn,令其加权后的波形指数为fshaw。各阶imf分量对应的相关系数为其波形指数的权系数,取各阶imf分量对应的相关系数为权系数,对回波信号的各阶imf波形指数进行加权求和,得到改进后的波形指数定征参数为加权波形指数:
步骤2.4、提取海底声呐回波信号x(t)的加权能量矩fimfw。
声呐回波信号x(t),其中x(i)表示回波信号的采样值,其能量矩为
步骤三:通过随机森林的方法进行特征融合得到声呐回波信号特征量f;
用随机森林的方法进行特征量融合得到最终的声呐回波信号特征量,便于分类器的分类;
具体为:
步骤3.1、构建随机森林的模型。
采用随机森林的方法对由emd方法得到的全体特征量f=(e,fsha,fshaw,fimf,fimfw)进行训练集样本,得到随机森林分类器。
步骤3.2、通过随机森林模型对回波信号进行分类,得到重要性指标。
去掉一维特征向量将剩余数据集平均分为两个部分,称为a和b两个数据集;利用训练好的随机森林模型对a数据集进行分类,得到准确率1;对b数据集的第j维进行加噪处理,并利用训练好的随机森林模型对加噪后的b数据集进行分类,得到准确率2;令准确率1和准确率2的差值作为第j维的重要性估计值。
步骤3.3、通过重要性指标给每维特征量赋予权重,进行特征融合。
确定重要性估计值的范围,对于小于重要性估计值差值ij将其特征量舍弃,对于大于重要性估计值差值ij将其特征量进行权重分配,对于第j维特征量其权重为:
综上,本发明提出了一种针对海底底质声呐回波特征量融合的特征提取方法,采用emd方法对回波信号进行分解,得到各阶imf分量,进行回波波形特征量提取,利用emd和随机森林方法对底质声纳回波进行特征提取融合,改善了传统融合方法对特征量的要求、同时解决特征量存在冗余的问题。采用emd对声呐回波信号进行特征量提取解决特征量单一在时域或者频域的问题,同时应用随机森林方法进行特征量融合也能较好的解决便于反演和特征冗余的问题,同时还能减小测试时间和训练时间。