一种EMD虚假分量识别的数学模型建模方法与流程

文档序号:12818888阅读:1302来源:国知局
一种EMD虚假分量识别的数学模型建模方法与流程
本发明涉及一种emd虚假分量识别的数学模型建模方法,应用于利用经验模态分解进行信号分析的
技术领域

背景技术
:经验模态分解(empiricalmodedecomposition,emd)法是美籍华人n.e.huang等人于1998年提出的一种基于数据局部时间特征的自适应时频分析方法。它能够将复杂信号分解为有限个本征模态函数分量,简称为imf(intrinsicmodefunction)分量,被广泛的应用于非线性、非平稳时间序列处理过程。一方面,较为理想的emd应用条件为采样频率大于4倍的nyquist频率,而应用emd的最低要求应为采样频率大于2倍的nyquist频率;另一方面,emd过程中每一个imf分量的产生都需要利用信号(或剩余信号)的局部极值点,并利用样条插值法构成包络。低采样率及样条插值方法的不当使得emd过程中,容易分解出与原信号无关的imf分量,即虚假分量(反之,对于emd分解出的与原信号有关的imf分量,本发明中简称为真实分量)。通过提高信号的采样频率及优化样条差值虽然能够在一定程度上抑制虚假分量的产生,但仍然无法完全消除。而在利用emd方法处理信号时,能否有效的识别和剔除虚假分量,是避免新产生的低频噪声污染原始数据,保障了后续处理的精确性和有效性的前提条件。文献“黄迪山.经验模态分解中虚假模态分量解除法[j].振动、测试与诊断,2011,31(3):381-384.”(简称:能量增减法)提出根据emd分解的完备性,能量原理及虚假模态分量的性质,通过判断第一阶imf分量与高阶imf分量相加后能量的增减来判断虚假分量,但该方法仅适用于特定的规则信号;文献“林丽.基于相关系数的emd改进算法[j]计算机与数字工程.2008,36(12):28-29,38”将文献“pengzk,tsepw,chufl.acomparisonstudyofimprovedhilbert-huangtransformandwavelettransform:applicationtofaultdiagnosisforrollingbearing[j].mechanicalsystemsandsignalprocessing,2005(19):974-988.”(简称:相关系数法)中利用imf分量与原信号之间的相关系数进行去噪数进行去噪的思想用于emd虚假分量的判别,并设定阈值为最大相关系数的1/10,小于阈值的情况判断为虚假分量,但对于频率成分较多的机械振动信号而言,有时真实分量与虚假分量所对应的相关系数大小差异并不明显,容易造成误判;文献“韩中合,朱霄珣,李文华.k-l散度的假分量识别方法研究[j].中国电机工程学报.2012,32(11):112-117.”与文献“宋娜,石玉,周克印,遗传算法在emd虚假分量识别中的应用”(两种方法都简称:kl散度法)都提出通过计算imf分量与原信号之间的k-l散度值(相对熵),并将所有imf分量的k-l散度值归一化,当归一化后的散度值大于某一给定阈值时则判为虚假分量,该方法对于阈值的确定,作者仍是根据经验给出,且并不具备普适性。针对上述问题,本发明提出了一种基于k-l散度及svm的emd虚假分量识别的数学模型(简称kl+svm模型)及建模方法。技术实现要素:本发明解决的技术问题是针对信号emd虚假分量识别,提出了一种基于k-l散度及svm的emd虚假分量识别的数学模型(简称kl+svm模型)及建模方法,其特征在于:将一组最普通的双音信号作emd分解,利用频谱比值法对所有的imf分量标定为真实分量或虚假分量,并计算各imf分量与原信号之间的k-l散度值,将其作为描述该imf分量的唯一特征输入svm,训练出能识别emd虚假分量的分类器数学模型。本发明的目的在于:提供一种基于k-l散度及svm的emd虚假分量识别的数学模型及建模方法,所述方法包括如下步骤:1)生成双音信号集;2)将每个双音信号emd分解得到若干个imf分量,获得训练样本集,并利用频谱比值法将所有的imf分量进行标定,从而获得真实分量和虚假分量两类训练样本集;3)计算上述训练样本集中每个样本与其原信号间的k-l散度值;4)设置svm参数;5)将每个训练样本与原信号的k-l散度值作为该样本的唯一特征代入svm中,训练能识别emd虚假分量的二元分类器数学模型;6)对采集到的测试样本集按步骤2)、步骤3)依次进行emd分解、通过频谱比值法对imf样本进行标定、提取用于识别虚假分量的唯一特征k-l散度值,最后将提取的特征送入训练好的svm二元分类器数学模型,根据分类结果识别虚假分量。本发明的有益效果是:参与数学模型训练的样本只是由一些简单的理论双音信号生成,信号简单易得;对训练样本集中的虚假分量样本和真实分量样本的标定采用了频谱比值法,标准比较客观;将每个训练样本与原信号之间的k-l散度值作为该样本的唯一特征输入svm中进行训练,样本的特征维数低,计算简单;训练得到的数学模型简单,而此后再识别某信号的emd虚假分量时,只需要将其imf分量与原信号之间的k-l散度值输入该数学模型即可;数学模型具有普适性,能够解决三音、四音乃至多音信号进行emd分解后虚假分量的识别问题,此外,对于这些信号中出现模态混叠现象时,该数学模型对其emd虚假分量的识别仍然具有较强的鲁棒性。附图说明图1为算法流程图;图2为二元分类器数学模型应用流程图;图3为寻优等高线图;图4为打点振动信号采集装置图;图5为打点机振动信号的时域波形图和频谱图;图6为打点振动信号emd分解结果;图7为实际六音信号的时域波形图和频谱图;图8为实际六音信号emd分解结果。具体实施方式为了使本发明的技术手段、创作特征、工作流程、使用方法达成目的与功效易于明白了解,下面结合附图和具体实施例,进一步阐述本发明具体实施方式,本领域技术人员可以在不违背本发明内涵的情况下做类似的推广,因此本发明不受下面公开的具体实施例的限制。如图1、图2所示,本发明公开了一种基于k-l散度及svm的emd虚假分量识别的数学模型及建模方法,详细步骤如下:1)生成双音信号集;建立双音信号的数学模型如式(1)所示:x(t)=a1cosω1t+a2cosω2t(1)其中:ω1和ω2为双音信号的频率,a1和a2分别为双音信号的幅值,若设emd采样频率为ωs,则ω1,ω2≤0.25ωs,并随机选择ω1、ω2、a1和a2,生成一系列不同的双音信号。2)将每个双音信号通过emd分解为若干imf分量,利用频谱比值法对每个imf分量进行标定;将双音信号通过emd分解为imf分量和残差函数的形式,如式(2)所示:其中ci(t)为频率从高到低的各阶imf分量,rn(t)为残差函数。并对ci(t)做傅里叶变换得ci(ω),各imf分量与原信号的频谱比值如式(3)所示:当ρij<0.1时,则标定ci(t)所表示的imf分量为原信号x(t)的虚假分量;反之,则标定ci(t)为原信号x(t)的真实分量。3)计算所有已标定的imf分量与其原信号间的k-l散度值;通过非参数估计分别计算各imf分量与原信号的概率密度函数,分别用采样后的信号集{x1,x2,...,xn}和{ci1,ci2,...,cin}表示原信号x(t)及其第i个imf分量ci(t),分别用p(x)和qi(x)分别表示原信号x(t)及其第i个imf分量ci(t)的概率密度,如式(4)和式(5)所示:其中k(·)称为核函数,h为窗宽。再计算各imf分量与其原信号间的相对熵值,如对某原信号x(t)及其第i个imf分量ci(t)来说,其相对熵值可由下式表示:4)svm参数的设置。利用台湾大学林智仁教授主导开发的libsvm工具箱训练作为能区分emd真实分量和emd虚假分量的二元分类器数学模型,对于具体参数的设置说明如下:选用的svm类型为c-svc,核函数选用高斯径向基函数,即:核函数的宽度δ选用libsvm工具箱的默认值,与核函数密切相关参数g和c-svc的惩罚函数参数c则通过交叉验证寻得最优获得,寻优等高线如图3所示,当c和g分别为:c=0.25,g=0.0625时,分类精度达99.8%。5)分类器数学模型的训练将2)中已标定的所有imf分量作为训练样本;将3)中通过式(4)、(5)和(6)计算获得的各imf分量ci(t)与原信号x(t)之间的k-l散度值d(x(t),ci(t))作为各训练样本的唯一特征;代入4)中的已完成设置的svm训练能识别emd虚假分量的分类器数学模型。6)对采集到的测试样本集按步骤2)、步骤3)依次进行emd分解、频谱比值法对imf样本进行标定、提取用于识别虚假分量的唯一特征k-l散度值,最后将提取的特征送入训练好的svm二元分类器数学模型,根据分类结果识别虚假分量。7)验证该二元分类器数学模型的有效性及普适性。为验证本发明中所创建的鉴别imf虚假分量数学模型的优势,本发明完成了四个验证性实验,每个实验都会将本发明中训练的分类器数学模型与能量增减法、k-l散度法和相关系数法进行比较。实验一:对双音信号中emd虚假分量的识别利用式(1)随机产生400个双音信号,emd分解得到1870个imf分量,经过频谱比值法标定后,其中真实分量样本667个,另外1204个为虚假分量样本,表1给出了四种方法识别虚假分量的正确率。表1.双音信号中emd虚假分量的识别率比较识别方法能量增减法kl散度法相关系数法本文方法准确率52.44%88.6%96.9%99.8%实验二:打点机振动信号(实际双音信号)中emd虚假分量的识别在某微结构密集阵列超精密加工机床上,利用ai005c加速度传感器测量直线电机方向的振动(如图4所示),获得包含2个主频的200组打点振动信号,两个主频分别约为36.8hz和73.6hz,其时域波形与频谱图如图5所示,emd分解得到1025个imf分量,随机取一组打点振动信号,其emd分解结果如图6所示,经过频谱比值法标定后,其中真实分量样本397个,另外628个为虚假分量样本,表2给出了四种方法识别imf虚假分量的准确率。表2.打点机振动信号(实际双音信号)中emd虚假分量的识别识别方法能量增减法kl散度法相关系数法本文方法准确率55.41%97.17%97.45%98.04%实验三:三音及四音信号(多音信号)中emd虚假分量的识别类比于式(1)建立三音数学模型,随机产生250个三音信号,emd分解得到1408个imf分量,经过频谱比值法标定后,其中真实分量样本748个,另外660个为虚假分量样本;类比于式(1)建立四音数学模型,随机产生120个四音信号,emd分解后分别得到805个imf分量,经过频谱比值法标定后,其中真实分量样本475个,另外330个为虚假分量样本。表3给出了四种方法识别分别识别三音信号和四音信号的emd虚假分量的准确率。表3.三音及四音信号(多音信号)中emd虚假分量的识别识别方法能量增减法kl散度法相关系数法本文方法准确率(三音信号)68.8%70.8%89.7%100%准确率(四音信号)73.3%41.2%86.5%100%实验四:实际六音信号中emd虚假分量的识别选取uci数据集中的spokenarabicdigit信号(网络链接:http://archive.ics.uci.edu/ml/datasets.html)前214组,每组信号均包含6个频率成分,分别约为40hz、79hz、120hz、159hz、199hz和238hz,其时域和频域波形如图7所示,经过emd分解得到1716个imf分量,随机取一组实际六音信号其emd分解结果如图8所示,经过频谱比值法标定后,其中真实分量样本为920个,另外796个为虚假分量样本,表4给出了四种方法识别imf虚假分量的准确率。表4.实际六音信号中emd虚假分量的识别识别方法能量增减法kl散度法相关系数法本文方法准确率44.25%74.19%81.52%93.29%实验一以数学模型随机生成的双音信号为实验对象,实验结果表明:针对于双音信号,kl散度法、相关系数法以及本发明中提出的数学模型对比基于能量的方法具有明显的优势,识别率都比较高,而本发明中提出的数学模型对于imf虚假分量的识别率略高于相关系数法。实验二采用在打点机上利用运动传感器采集到的实际双音信号为实验对象,实际双音信号测试中本文算法与kl散度和相关系数法相比并没有明显的优势;而实验一理论双音信号测试中kl散度法与相关系数法与本文算法存在一定的差距,原因在于实际双音信号所包含的两个主频均存在2倍以上的大小关系,且两个主频的幅值相当,即信号通过emd分解能够完全分离出两个主频,而理论的双音测试样本中包含存在频谱混叠的样本,导致kl散度法及相关系数方法的误判增多。从实验三结果分析,当信号的频率成分增加时,kl散度法和相关系数法的识别率明显下降,原因在于随着信号所包含的频率成分的增加,emd分解过程产生频谱混叠现象的情况增加,导致上述两种方法的误判也增加。实验四选取了开源数据集选取uci数据集中的spokenarabicdigit信号(网络链接:http://archive.ics.uci.edu/ml/datasets.html),从该六音信号所包含的6个主频大小来看,emd过程无法完全分离出6个独立的频率成分,说明信号中存在频谱混叠现象;从表4的统计结果来看,本文算法较相关系数的方法高出接近12个百分点,较kl散度法高出19个百分点;由此可见,对于多频规则信号,尤其是包含频谱混叠的信号,kl散度法和相关系数法误判较多,而本文算法仍然具有较高的识别率。在不脱离本发明精神或必要特性的情况下,可以其它特定形式来体现本发明。应将所述具体实施例各方面仅视为解说性而非限制性。因此,本发明的范畴如随附申请专利范围所示而非如前述说明所示。所有落在申请专利范围的等效意义及范围内的变更应视为落在申请专利范围的范畴内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1