本发明涉及雷达信息处理领域,具体涉及一种雷达辐射源信号深度脉内特征自动提取方法。
背景技术:
对雷达信号进行有效分选和识别的关键是提取出能够反映信号本质的特征,而深度学习理论下的自编码器(autoencoder,ae)以在输出层重构出原始输入作为目标,因其不需要额外的监督信息就能够提取数据的分布式特征,且能够避免设计特征时隐含的主观性,而成为近年来备受人们关注的一个热点方向。2006年,hinton对原型自编码器结构进行改进,得到深度自编码器(deepautoencoder,dae),bengio对深度自编码器进行深化,提出了一种稀疏自编码器(sparseautoencoder,sae),它通过对隐层节点加上稀疏约束,发现数据的内在结构;稀疏自编码器的不同稀疏性惩罚、隐藏层节点数目、前置处理等对其性能都会产生影响,利用稀疏编码器不仅可以进行深层特征提取,还可以完成缺陷检测、分类和盲源分离的工作。
现代雷达向多功能、多用途、多种体制方向发展,其波形设计日趋复杂,信号规律性也遭到严重破坏,依靠经验设计特征已不足以胜任当前电磁环境下的雷达信号脉内特征提取任务。因此,若能利用稀疏自编码器完成这一任务,则有望突破常规方法提取脉内特征所固有的桎梏。
技术实现要素:
本发明针对雷达信号脉内特征提取时由于依赖先验知识而客观性不足的问题,提供一种雷达辐射源信号深度脉内特征自动提取方法,辐射源信号的正确识别效果较好。
为达到上述目的,雷达辐射源信号深度脉内特征自动提取方法分选步骤如下:
步骤1,对权值偏置和阈值赋值,对网络进行初始化;
所述网络根据下式进行计算:
令
sae损失函数表达式为:
其中s2是隐层神经元的数目,β用来控制稀疏惩罚项的权重;
然后针对参数w和b来求其函数j(w,b)的最小值,将每一个参数
步骤2,随机选取类标数据样本用算法对神经网络进行训练,计算各层的输出;
所述各层的输出对于gaussian型节点按下式计算:
所述各层的输出对于bernoulli型节点按下式计算:
式中,
步骤3,求出各层的重构误差,并根据误差修正权值和偏置;
所述误差由下式计算:
其中,θ表示网络参数,m表示训练样本个数,x表示网络的原始输入,fenc(x)表示网络的中间层编码输出,fdec(fenc(x))表示中间层编码结果经过解码网络所重构的输入;
步骤4,根据性能指数判定误差是否满足要求,如果未能满足要求则重复步骤2和3,直到整个网络输出满足期望要求;
步骤5,利用编码层参数对原始输入进行映射得到新特征,即:y=f(x;θencode);
步骤5中,x表示原始雷达信号特征输入,θencode表示编码部分的网络参数,y表示基于深度自动编码器提取的中间层特征向量。
雷达辐射源信号包括常规雷达信号cw、线性调频雷达信号lfm、非线性调频雷达信号nlfm、二相编码雷达信号bpsk、四相编码雷达信号qpsk和频率编码雷达信号fsk。
本发明具有的有益效果:
1、利用深度自编码器(dae)自动提取脉内特征,能提取密集雷达信号样本的深度解释性因子,保留原始输入的非零特征,增加表示算法的鲁棒性,增强脉冲信号的线性可分性,使分类边界变得更加清晰,并且能在一定程度上控制变量的规模,改变给定输入数据的结构,丰富原有信息,提高信息表述的全面性和准确率。
2、本发明不依赖先验知识,提取雷达辐射源信号脉内特征更加客观和自动化,正确率高。
附图说明
图1为本发明自编码器架构
图2为本发明原型自编码器
图3为本发明深度脉内特征提取框架
图4为本发明辐射源信号深度特征分布图
具体实施方式
下面结合实施例对本发明技术方案做进一步说明。
首先对自编码器框架进行分析,然后通过施加特定稀疏性约束得到sae,最后后对稀疏自编码器进行优化并确定其训练方案,利用编码层参数自动提取雷达信号深度脉内特征。
优化用于提取脉内特征的深度自编码器时,首先需要给深度自编码器加上稀疏约束,再通过即增加隐含层和神经元的数量,调整隐含层节点的分布并改变权值的分享方式等,优化dae的基本框架;最后根据不同任务的需要选取合适的代价函数及其优化策略隐含层品质因数和系统性参数优化时的性能指数等,确定dae的训练方案。
自编码器是一种包括编码和解码两部分的深度学习架构,编码是指以原始数据作为网络输入,经过隐含层编码得到中间层特征表示;解码是指中间层特征经过隐含层解码,在输出层还原为原始输入。通过编码和解码机制,自编码器使得重建信号的重建误差小,并且它以在输出层重构出原始输入作为目标,不需要额外的监督信息,因而可以直接从原始数据中自动学习数据特征。自编码器架构如图1所示,其中encoder和decoder分别表示编码器和解码器。
自编码器基本理论可以概括如下:假设一个无标签的训练集x={x(1),x(2),x(3),…},其中
自编码器试图学习一个函数hw,b(x)≈x,这里训练集包含m个样本,用梯度下降法训练图2中所示的特殊的神经网络,也就是自编码器时,对于单个训练样本(x,y),定义其损失函数为:
整个网络(训练集)的损失函数表达式如下:
第一项是所有样本的方差的均值,第二项是一个归一化项(也叫权重衰减项),该项是为了减少权连接权重的更新速度,防止过拟合。式中,
如果只是简单的保留雷达脉冲调制信息,并不足以让自编码器学到一种有用的特征表示,也就是一个动编码器,它的输入和输出具有同样维度,那么动编码器只需学习到一个简单的恒等函数就可以实现数据的完美重构,而实际则希望它能够学习到一种更复杂的非线性函数,因此需要给予动编码器一定的约束使其学习到一种更好的特征表示。
稀疏自编码器考虑两种情况,如果输入x节点数目大于隐层节点数目,那么网络必须学习出输入的压缩表示,即给出以隐层节点激活值作为元素的向量,它需要重构出维数较大的输入x。如果隐层节点数目较多,甚至比输入节点数目还多,那这时需要通过对网络施以某种约束,以便发现数据内在结构,这里对隐层节点加上稀疏约束。稀疏性的约束是使得学习到的表达更有意义的一种重要约束,这样得出的自编码器称为深度稀疏自编码器(deepsparseautoencoder,dsae),简称稀疏自编码器(sparseautoencoder,sae)。
稀疏自编码器实现主要包括三个重要环节,即施加特定稀疏性约束、优化稀疏自编码器的结构和确定dae的训练方案。因此,优化用于提取脉内特征的深度自编码器时,首先需要给深度自编码器加上稀疏约束,再通过即增加隐含层和神经元的数量,调整隐含层节点的分布并改变权值的分享方式等,优化dae的基本框架;最后根据不同任务的需要选取合适的代价函数及其优化策略隐含层品质因数和系统性参数优化时的性能指数等,确定dae的训练方案。
令
根据原型自编码器的损失函数以及稀疏性要求,sae损失函数表达式为:
其中s2是隐层神经元的数目,β用来控制稀疏惩罚项的权重。
接下来的问题是针对参数w和b来求其函数j(w,b)的最小值。为了求解神经网络,需要将每一个参数
dae预训练的目的是将所有联结参数w和偏置项限定在一定的参数空间内,防止随机初始化所诱发隐含层品质因数的降低,便于对整个神经网络进行系统性参数优化,预训练的核心是用非监督的方式将自编码器输入层和隐含层全部初始化,然后再用逐层贪心训练算法将每个隐含层训练为自动关联器,实现输入数据的重构。
雷达信号深度脉内特征自动提取作为一种深度学习框架,稀疏自编码器通过逐层的方式,构建出一个包含多层的网络,使得机器能自动地学习到反映隐含在数据内部的关系,从而学习到更具有推广性和表达力的特征。换句话讲,深度自编码器是通过组合低层特征,形成更加抽象的高层表示或特征,以发现数据的分布式特征表示。
深度脉内特征提取框架
对于进入侦察接收系统的雷达信号脉冲序列,由于其近似满足短时平稳性,因而可以考虑将相邻的连续多帧短时样本拼接起来得到长时样本,构成网络的原始输入。考虑到提取的深度脉内特征需要对雷达信号这种复杂数据具备强大的描述能力以及后续分选模型训练需要,中间编码层同样采用gaussian型节点;剩余的隐含层则采用bernoulli型节点。基于优化稀疏自编码器的雷达信号深度脉内特征提取框架如图3所示,对于gaussian型节点,其输出为输入的线性组合,满足:
对于bernoulli型节点,其输出为输入的sigmoid映射,满足:
式中,
深度稀疏自动编码器以最小化重构输入和原始输入之间的误差为目标函数,通过后向误差传播(backpropagation,bp)算法调整网络参数。目标函数记为:
其中,θ表示网络参数,m表示训练样本个数,x表示网络的原始输入,fenc(x)表示网络的中间层编码输出,fdec(fenc(x))表示中间层编码结果经过解码网络所重构的输入。
深度脉内特征自动提取
深度自动编码器训练完成后,需要对网络进行微调,微调是优化dae的必要步骤,这里采用bp算法来完成这一任务,微调的任务是将稀疏自编码器的输入层输出层和所有隐含层视为一个整体,用有监督学习算法进一步调整经过预训练的神经网络,经过多次迭代后,优化所有权值及偏置。通过这一过程,即可完成雷达辐射源信号的分层特征提取,其基本步骤可归纳为:
步骤1.对权值偏置和阈值赋值,对网络进行初始化;
步骤2.随机选取类标数据样本用算法对神经网络进行训练,计算各层的输出;
步骤3.求出各层的重构误差,并根据误差修正权值和偏置;
步骤4.根据性能指数判定误差是否满足要求,如果未能满足要求则重复步骤2和3,直到整个网络输出满足期望要求;
步骤5.利用编码层参数对原始输入进行映射得到新特征,即:y=f(x;θencode)。
步骤5中,x表示原始雷达信号特征输入,θencode表示编码部分的网络参数,y表示基于深度自动编码器提取的中间层特征向量。
利用深度自编码器(dae)自动提取脉内特征,能提取密集雷达信号样本的深度解释性因子,保留原始输入的非零特征,增加表示算法的鲁棒性,增强脉冲信号的线性可分性,使分类边界变得更加清晰,并且能在一定程度上控制变量的规模,改变给定输入数据的结构,丰富原有信息,提高信息表述的全面性和准确率。
本发明实施例
本发明选择6种典型雷达辐射源信号进行仿真实验,这6种信号分别为:常规雷达信号(cw)、线性调频雷达信号(lfm)、非线性调频雷达信号(nlfm)、二相编码雷达信号(bpsk)、四相编码雷达信号(qpsk)和频率编码雷达信号(fsk)。信号载频为850mhz,采样频率为2.4ghz,脉宽为10.8us,lfm的频偏为45mhz,nlfm采用正弦频率调制,bpsk采用31位伪随机码,qpsk采用huffman码,fsk采用barker码。对每一种雷达信号在0~20db的信噪比范围内每隔5db产生120个样本,总共为600个样本,其中200个用于分类器训练,其余400个用作信号分类识别的测试集。在训练分类器和测试信号分类识别效果之前,要对所有样本进行深度脉内特征的提取。为了直观反映各辐射源信号的特征分布情况,本发明从提取到的特征向量中选取各信号典型信噪比下(snr=15db)的60组特征样本,总共300组特征样本做如图4所示的特征分布图。
由图4中可以看出,cw和lfm两种信号的3维深度特征类内聚集性较好,nlfm,bpsk和qpsk三种信号的深度特征也具有较好的聚集性,但是不同信号之间的特征有部分重叠;而fsk特征类内聚集性较差,而且与nlfm信号的特征产生重叠;图1表明,利用基于优化的稀疏自编码器可以提取出具有不同类内聚集性和类间分离性的雷达信号深度特征。为进一步验证所提取深度特征的有效性,本发明用svm(supportvectormachine,支持向量机)对深度特征向量表征的辐射源信号进行分类识别,结果如表1所示。
表1中列出了利用svm得到的各信号正确识别率随信噪比的变化情况,其中分类识别率是指20次试验结果的平均,平均识别率是指每一信号在0~20db信噪比范围内分类识别率的平均。
表1正确识别率随信噪比的变化情况
从表1可看出,在一定的snr(signalnoiseratio,信噪比)范围内,以提取的深度特征为特征向量,并用svm分类器对辐射源信号进行分类识别时,每种雷达辐射源信号都可以取得较高正确识别率。信号识别率的高低与信号的复杂程度有关,对于较为简单的信号形式,例如cw和lfm调制信号,其平均正确识别率可达到98.98%和97.78%;对于较为复杂的信号形式,例如fsk调制信号,其平均正确识别率为88.94%,该结果与其深度特征的聚集程度不佳和特征的部分重叠有关,但是这种结果在工程应用中是可以接受的。另外,6种辐射源信号的平均正确识别率达到了93.69%,识别效果较好。