一种联合三维熵特征的雷达辐射源信号识别方法与流程

文档序号:12123877阅读:725来源:国知局
一种联合三维熵特征的雷达辐射源信号识别方法与流程

本发明属于信号识别技术领域,具体地说,涉及一种联合三维熵特征的雷达辐射源信号识别方法。



背景技术:

雷达辐射源信号识别是电子情报侦察系统(ELINT)和电子支援系统(ESM)中的重要组成部分,直接影响着电子侦察设备性能的发挥并关系到后续的作战决策。传统识别方法依赖于常规五参数(RF、PA、PW、DOA和TOA),但是这种方法在一定条件下仅适合于常规雷达信号的识别,对于复杂电磁环境下密集雷达信号的识别效果不佳。因此,当前研究方向趋向于通过对雷达信号脉内数据进行分析,研究脉内有意调制特征和无意调制特征,扩展参数空间,减少多参数空间的交迭概率,以便快速、准确的识别信号。在这个意义上,许多新的脉内特征提取技术相继被提出,例如小波变换法、时频分布法、原子分解法、高阶统计分析方法等。但是,这些方法都存在一定的不足,有的技术采用的小波变换方法提取的特征仅适合少数信号,应用局限性大,同时提取的特征数目较多,造成时间开销较大;用Choi-Williams分布提取出辐射源信号的制特征向量,并用神经网络分类器对取出的特征向量进行分类,可以取得较好分类效果。但是该分布虽然可以抑制模糊域中横轴和纵轴以外的交叉项,但仍然保留了横轴和纵轴上的交叉项,对信号调制识别仍然有影响;利用改进量子遗传算法进行匹配追踪以实现最佳原子的快速匹配,作者思想主要体现在时频原子匹配上,但是特征原子数目较多,30个Gabor原子虽然可充分表示原信号的主要特征信息,但是直接应用这些原子进行识别时其维数相当高,造成的计算量也是巨大的。

而基于熵特征的辐射源信号识别方法在一定程度上弥补了上述方法的不足,有的技术将近似熵和范数熵构成特征向量并利用神经网络分类器进行分类识别,取得了较好的识别效果。

目前,现有技术中还没有一种联合三维熵特征的雷达辐射源信号识别方法。



技术实现要素:

本发明的目的在于基于脉内特征的辐射源信号识别中存在的缺陷,提供一种联合三维熵特征的雷达辐射源信号识别方法,该方法将样本熵,模糊熵和归一化能量熵作为信号的三维特征向量,以样本熵描述辐射源信号的复杂性,利用模糊熵来衡量信号的不确定度,同时利用归一化能量熵度量信号能量的分布情况。文章对六种典型雷达辐射源信号进行特征提取,并利用支持向量机进行分类识别试验,结果表明,提取的特征向量在较大信噪比范围内能够较好地实现对雷达辐射源信号的分类识别,证明该方法是有效的。

其具体技术方案为:

一种联合三维熵特征的雷达辐射源信号识别方法,包括以下步骤:

步骤1、信号预处理

1.1将脉冲数据变换到频域,并截取对称幅频谱的中心点以右部分,记为f(i),i=1,2,…,M,M为脉冲数据长度的1/2;

1.2根据公式(1)将信号f(i)能量归一化:

1.3求出能量归一化后信号f′(i)的中心频率和有效带宽,并对带宽进行归一化处理;

1.4采样频率一定的情况下,不同脉宽的脉冲数据其信号长度是不同的,为了避免这种不同长度信号对后文提取特征的影响,对所有带宽归一化处理后的信号进行重采样,并记重采样后的信号为x(n),n=1,2,…,N,N为重采样后信号长度;

步骤2、特征提取

2.1样本熵特征提取

记重采样后的N点信号序列为x(n)=[x1x2…xN],则SampEn估计算法如下所述:

2.1.1按照式(2)对序列x(n)构造m维矢量:

x(i)=[xi xi+1…xi+m-1],i=1,2,…,N-m+1 (2)

2.1.2按照式(3)计算矢量对之间的距离:

2.1.3计算相似矢量对的数目:

(1)令nm=0,如果dm[x(i),x(j)]≤r,i≠j,则nm=nm+1;

(2)令nm+1=0,如果dm+1[x(i),x(j)]≤r,i≠j,则nm+1=nm+1+1;

2.1.4按照式(4)计算所有相似矢量对相似测度:

2.1.5按照式(5)计算相似矢量对平均相似测度:

2.1.6按照式(6)计算样本熵估计:

其中,本发明采用尺度参数m=2和容限参数作为估算样本熵的参数,σ为x(n)的标准差;

2.2模糊熵特征提取

熵在信息论中表示信源的平均不确定度,在模糊子集论中可以用来度量一个模糊集合所含有的模糊性的大小,因此用模糊熵来表示模糊集的不确定度;模糊集A的模糊熵定义为:

其中,f(t)=-tlnt-(1-t)ln(1-t),k>0是正常数,μA(xi)表示模糊集A的隶属函数;

证明,f(t)是一个关于t=0.5的对称函数,在区间[0,0.5]内严格单调递增,在区间[0.5,1]内严格单调递减,当t=0.5时取得最大值ln2;由(7)式可以看出,如果μA(x)∈{0,1},则Fe(A)=0;如果μA(x)∈{1},则Fe(A)取得最大值Nln2,取k-1=Nln2作为归一化因子;

经多次试验,采用如(8)式的S型函数[9]作为隶属度函数:

其中,b=(a+c)/2;a与c确定了S函数中模糊窗宽的范围,且随所取模糊窗的不同而发生变化,作为函数的一个转接点,可以通过求得模糊集的熵最大值来获得最优的参数a,b,c的值,即所求参数应满足(9)式;

max{Fe(A),a,b,c∈x(n)&a<b<c} (9)

考虑到辐射源信号包含了一定的不确定性,因此可以用模糊熵来衡量信号的不确定性;记重采样后的N点信号序列为x(n)=[x1x2…xN],A为该序列对应的模糊子集,则确定最优参数a,b,c的值后,根据(8)式求出信号序列的隶属度即可由(7)式求出信号序列的模糊熵;

2.3归一化能量熵特征提取

2.3.1令i=1,j=1;

2.3.2以三次样条函数分别连接信号s(t)的局部极大值和极小值序列,形成信号的上下包络;

2.3.3计算上下包络的均值mij(t),同时记hij(t)=s(t)-mij(t);

2.3.4如果hij(t)满足IMF条件,则转到步骤5,否则以hij(t)替代s(t),并令j=j+1,转到步骤2;

2.3.5记ci(t)为EMD分解得到的第i个IMF分量,则ci(t)=hij(t),令ri(t)=s(t)-ci(t),如果ri(t)为一个单调函数,则分解过程终止,此时称ri(t)为趋势余项,否则以ri(t)替代s(t),并令i=i+1,转到步骤2;

由以上步骤可以看出,原信号s(t)经EMD分解为k个IMF分量与趋势余项的和,即:

其中,k为总共分解次数;

得到脉冲数据序列s(t)的IMF分量后,即可通过式(11)求出信号的IMF分量归一化能量熵:

式(11)中,

其中,pi表示归一化IMF能量,N表示信号序列s(t)的长度;显然∑pi=1,i=1,2,…k,分解次数k与信号的复杂程度有关,由分解算法自适应确定;由熵理论可知,如果辐射源信号各IMF分量的能量分布均匀,则归一化能量熵最大;若能量集中在少数IMF分量处,则归一化能量熵较小;

步骤3、辐射源信号识别方法

3.1对辐射源信号进行预处理,得到重采样后的信号x(n),n=1,2,…,N,计算归一化能量熵时,直接由个体脉冲数据重采样得到序列s(t),t=1,2,…,N,N为重采样后的信号长度;

3.2按照SampEn估计算法求得信号序列x(n)的样本熵Se

3.3按照(7)式求得序列x(n)的模糊熵Fe

3.4按照(11)式求得序列s(t)的归一化能量熵Pe

3.5将特征矢量T=[Se,Fe,Pe]输入SVM分类器对信号进行分类识别。

与现有技术相比,本发明的有益效果:

本发明将样本熵,模糊熵和归一化能量熵作为信号的三维特征向量,以样本熵描述辐射源信号的复杂性,利用模糊熵来衡量信号的不确定度,同时利用归一化能量熵度量信号能量的分布情况。文章对六种典型雷达辐射源信号进行特征提取,并利用支持向量机进行分类识别试验,结果表明,提取的特征向量在较大信噪比范围内能够较好地实现对雷达辐射源信号的分类识别,证明该方法是有效的。

附图说明

图1是辐射源信号特征分布图,其中,(a)为样本熵,模糊熵和归一化能量熵特征分布,(b)样本熵和模糊熵特征分布,(c)为样本熵和归一化能量熵特征分布,(d)为模糊熵和归一化能量熵特征分布。

具体实施方式

下面结合附图和具体实施方案对本发明的技术方案作进一步详细地说明。

1基于熵特征的辐射源信号识别

1.1信号预处理

为了避免提取的特征受到辐射源信号载频以及噪声等的影响,需要对分割后的个体脉冲数据进行进一步的预处理,主要包括以下几个步骤[5]

步骤1将脉冲数据变换到频域,并截取对称幅频谱的中心点以右部分,记为f(i),i=1,2,…,M,M为脉冲数据长度的1/2;

步骤2根据公式(1)将信号f(i)能量归一化:

步骤3求出能量归一化后信号f′(i)的中心频率和有效带宽,并对带宽进行归一化处理;

步骤4采样频率一定的情况下,不同脉宽的脉冲数据其信号长度是不同的,为了避免这种不同长度信号对后文提取特征的影响,对所有带宽归一化处理后的信号进行重采样,并记重采样后的信号为x(n),n=1,2,…,N,N为重采样后信号长度。

后文中的样本熵和模糊熵特征提取算法都是针对重采样后的信号x(n)进行的。

1.2特征提取方法

熵在信息论中表示信源的平均不确定度,由于噪声干扰以及不同调制方式的影响,辐射源信号包含了一定的不确定性,这种不确定性主要表现为信号时域波形的差别,频谱形状的不同和能量分布的差异等,这些不确定性或者模糊性都可以用熵来衡量。本发明从辐射源信号中分别提取出样本熵,模糊熵和归一化能量熵三种参数组成特征向量用来进行辐射源信号的分类识别。

1.2.1样本熵特征提取

近似熵是一种衡量时间序列复杂性的统计学参数,它仅需要较短数据就可度量出信号中产生新模式的概率,抗干扰能力较好[6],但是该方法存在信号自匹配而带来的估计偏差问题。文献[7]提出以样本熵(SampEn)作为时间序列的统计参数,该参数具有与近似熵相同的物理意义和优点,解决了估计偏差和对微小的复杂性变化不灵敏的问题。因此,本发明将样本熵作为辐射源信号的一个特征参数,在利用该特征可以有效抑制噪声的同时,也避免了估计偏差问题对辐射源信号分类识别的影响。

记重采样后的N点信号序列为x(n)=[x1x2…xN],则SampEn估计算法如下所述:

步骤1按照式(2)对序列x(n)构造m维矢量:

x(i)=[xi xi+1…xi+m-1],i=1,2,…,N-m+1 (2)

步骤2按照式(3)计算矢量对之间的距离:

步骤3计算相似矢量对的数目:

(1)令nm=0,如果dm[x(i),x(j)]≤r,i≠j,则nm=nm+1;

(2)令nm+1=0,如果dm+1[x(i),x(j)]≤r,i≠j,则nm+1=nm+1+1;

步骤4按照式(4)计算所有相似矢量对相似测度:

步骤5按照式(5)计算相似矢量对平均相似测度:

步骤6按照式(6)计算样本熵估计:

其中,本发明采用尺度参数m=2和容限参数作为估算样本熵的参数,σ为x(n)的标准差。

1.2.2模糊熵特征提取

熵在信息论中表示信源的平均不确定度,在模糊子集论中可以用来度量一个模糊集合所含有的模糊性的大小,因此用模糊熵来表示模糊集的不确定度。模糊集A的模糊熵定义为[8]

其中,f(t)=-tlnt-(1-t)ln(1-t),k>0是正常数,μA(xi)表示模糊集A的隶属函数。

容易证明,f(t)是一个关于t=0.5的对称函数,在区间[0,0.5]内严格单调递增,在区间[0.5,1]内严格单调递减,当t=0.5时取得最大值ln2。由(7)式可以看出,如果μA(x)∈{0,1},则Fe(A)=0;如果μA(x)∈{1},则Fe(A)取得最大值Nln2,因此,本发明取k-1=Nln2作为归一化因子。

经多次试验,本发明采用如(8)式的S型函数[9]作为隶属度函数:

其中,b=(a+c)/2。a与c确定了S函数中模糊窗宽的范围,且随所取模糊窗的不同而发生变化,作为函数的一个转接点,可以通过求得模糊集的熵最大值来获得最优的参数a,b,c的值,即所求参数应满足(9)式。

max{Fe(A),a,b,c∈x(n)&a<b<c} (9)

考虑到辐射源信号包含了一定的不确定性,因此可以用模糊熵来衡量信号的不确定性。记重采样后的N点信号序列为x(n)=[x1x2…xN],A为该序列对应的模糊子集,则确定最优参数a,b,c的值后,根据(8)式求出信号序列的隶属度即可由(7)式求出信号序列的模糊熵。

1.2.3归一化能量熵特征提取

经验模态分解(empirical mode decomposition,EMD)是指逐级分解信号中不同尺度的波动或趋势,产生一系列具有不同特征尺度的数据序列,称其为本征模式分量函数(intrinsic mode function,IMF)[10,11]。EMD方法的本质就是将信号分解为若干不同IMF之和,不同的IMF代表信号不同频段的成分,每个频段所包含的频率成分是不相同的。IMF定义为满足以下两个条件的信号分量:(1)极值点和零交叉点的个数相差不超过1个;(2)由局部极大值和局部极小值点构成包络的均值为0。

对雷达辐射源信号来讲,不同频带内的信号能量分布随调制方式的不同而发生改变,因此通过计算不同辐射源信号的IMF分量归一化能量熵可以判断辐射源信号的类型。设得到的脉冲数据序列直接经信号预处理中的步骤4重采样后为s(t),则利用EMD分解s(t)的过程如下所述:

步骤1令i=1,j=1;

步骤2以三次样条函数分别连接信号s(t)的局部极大值和极小值序列,形成信号的上下包络;

步骤3计算上下包络的均值mij(t),同时记hij(t)=s(t)-mij(t);

步骤4如果hij(t)满足IMF条件,则转到步骤5,否则以hij(t)替代s(t),并令j=j+1,转到步骤2;

步骤5记ci(t)为EMD分解得到的第i个IMF分量,则ci(t)=hij(t),令ri(t)=s(t)-ci(t),如果ri(t)为一个单调函数,则分解过程终止,此时称ri(t)为趋势余项,否则以ri(t)替代s(t),并令i=i+1,转到步骤2;

由以上步骤可以看出,原信号s(t)经EMD分解为k个IMF分量与趋势余项的和,即:

其中,k为总共分解次数。

得到脉冲数据序列s(t)的IMF分量后,即可通过式(11)求出信号的IMF分量归一化能量熵:

式(11)中,

其中,pi表示归一化IMF能量,N表示信号序列s(t)的长度。显然∑pi=1,i=1,2,…k,分解次数k与信号的复杂程度有关,由分解算法自适应确定。由熵理论可知,如果辐射源信号各IMF分量的能量分布均匀,则归一化能量熵最大;若能量集中在少数IMF分量处,则归一化能量熵较小。

1.3辐射源信号识别方法

考虑到辐射源训练数据库一般不是很完备以及实际战场环境的应用问题,需要选择一种适用于较少训练样本,而且训练和分类速度快,不容易陷入局部极小值的分类器,而SVM恰好具有这些优点,因此本发明选用SVM作为分类识别的学习算法。

SVM是方法不仅较好的解决了以往机器学习方法中存在的小样本、非线性、过学习、高维数、局部极小值点等实际问题,而且与基于经验风险最小化原理的神经网络学习算法相比,SVM具有更强的理论基础和更好的泛化能力[12]。SVM通过核函数将输入特征矢量由低维特征空间映射到高维特征空间,将原始输入空间的非线性可分问题转化为高维空间的线性可分问题,从而达到分类识别辐射源信号的目的。

鉴于样本熵和模糊熵可以有效描述辐射源信号的复杂性和不确定性,本发明提出了利用样本熵和模糊熵组成的特征向量来进行辐射源信号的SVM分类识别方法,具体步骤如下:

步骤1对辐射源信号进行预处理,得到重采样后的信号x(n),n=1,2,…,N,计算归一化能量熵时,直接由个体脉冲数据重采样得到序列s(t),t=1,2,…,N,N为重采样后的信号长度;

步骤2按照SampEn估计算法求得信号序列x(n)的样本熵Se

步骤3按照(7)式求得序列x(n)的模糊熵Fe

步骤4按照(11)式求得序列s(t)的归一化能量熵Pe

步骤5将特征矢量T=[Se,Fe,Pe]输入SVM分类器对信号进行分类识别。

2实验结果与分析

本发明选择6种典型雷达辐射源信号进行仿真实验[13],这6种信号分别为:常规雷达信号(CW)、线性调频雷达信号(LFM)、非线性调频雷达信号(NLFM)、二相编码雷达信号(BPSK)、四相编码雷达信号(QPSK)和频率编码雷达信号(FSK)。信号载频为850MHz,采样频率为2.4GHz,脉宽为10.8us,LFM的频偏为45MHz,NLFM采用正弦频率调制,BPSK采用31位伪随机码,QPSK采用Huffman码,FSK采用Barker码。对每一种雷达信号在0~20dB的信噪比范围内每隔5dB产生120个样本,总共为600个样本,其中200个用于分类器训练,其余400个用作信号分类识别的测试集。在训练分类器和测试信号分类识别效果之前,要对所有样本进行样本熵和模糊熵特征的提取。为了直观反映各辐射源信号的特征分布情况,本发明从提取到的特征向量中选取各信号不同信噪比的60组特征样本,总共300组特征样本做如图1所示的特征分布图。

由图1(a)中可以看出,CW,LFM和NLFM三种信号的三维特征类内聚集性较好,而FSK,BPSK和QPSK三种信号的特征较发散;由图1(b)中可以看出,BPSK和QPSK的样本熵和模糊熵特征有部分重叠;在图1(c)中,FSK和NFLM有部分重叠,同时QPSK和LFM重叠较严重,几乎不能分辨;在图1(d)中,NLFM和QPSK有部分重叠。因此仅依靠二维熵特征不能总是得到好的分类识别结果。考虑到上述因素,本发明用SVM对三维特征向量表征的辐射源信号进行分类识别,结果如表1所示。

表1中列出了利用SVM得到的各信号正确识别率随信噪比的变化情况,其中分类识别率是指20次试验结果的平均,平均识别率是指每一信号在0~20dB信噪比范围内分类识别率的平均。

表1辐射源信号正确识别率随信噪比的变化情况

从表1可看出,在一定的SNR范围内,以提取的三种熵为特征向量,并用SVM分类器对辐射源信号进行分类识别时,每种雷达辐射源信号都可以取得较高正确识别率。信号识别率的高低与信号的复杂程度有关,对于较为简单的信号形式,例如CW和LFM调制信号,其平均正确识别率可达到98.74%和96.97%,这种结果与图1(a)中这两种信号较好的特征类内聚集性是一致的;对于较为复杂的信号形式,例如BPSK和FSK调制信号,其平均正确识别率为90.21%和88.21%,该结果与三维特征的聚集程度不佳和特征的部分重叠有关,但是这种结果在工程应用中是可以接受的。另外,6种辐射源信号的平均正确识别率达到了94.02%,识别效果较好。

以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1