基于生成式对抗网络的半监督式特定辐射源个体识别方法

文档序号:26141452发布日期:2021-08-03 14:26阅读:128来源:国知局
基于生成式对抗网络的半监督式特定辐射源个体识别方法

本发明涉及射频信号处理技术领域,特别是涉及基于生成式对抗网络的半监督式特定辐射源个体识别方法。



背景技术:

特定辐射源是指根据接收到的射频通信信号的指纹特征,识别其所属的通信辐射源个体的技术。不同辐射源个体的内部硬件存在细微差异,这一差异则体现在其发射的射频信号中并表现出唯一标识的特性,称之为射频指纹特征,基于此可识别不同的辐射源个体。这一技术被广泛应用于民用与军事领域,特别是在军事电子侦察领域,当前各国军队装备了大量生产型号、信号样式一致的电子设备,这使得传统基于信号样式识别的电子侦察在区分不同目标个体等任务面临较大困难。此外,战场环境中天然的非合作通信特性,使得这一困难被进一步加剧。因此,开展基于特定辐射源个体识别技术的通信侦察,对于区分同一生产型号与信号样式、不同个体的辐射源,进而判断作战任务中目标的数目规模,最终获取敌方的兵力部署、战场态势等情报,具有广阔的应用前景与较高的军事价值。

特定辐射源个体识别技术的核心在于射频指纹特征的提取。传统的方法多采用人工预定义的方式,设计射频指纹特征的提取方法。常用的方法包括:高阶信号谱、时频域特征提取、经验模态分解等。但是射频指纹特征是由辐射源内部多种硬件差异的共同作用而产生,具有很高的复杂性。因此传统方法在面对某个特定的辐射源个体识别任务时,通常需要采取“逐个尝试”的方法选择合适有效的指纹特征提取算法。这种效率极低的特征选择思路严重影响了通信辐射源识别系统的开发速度,不利于该技术的推广应用。



技术实现要素:

本发明的目的是提供一种基于生成式对抗网络的半监督式特定辐射源个体识别方法,提高特定辐射源个体识别的效率和准确率。

为实现上述目的,本发明提供了如下方案:

一种基于生成式对抗网络的半监督式特定辐射源个体识别方法,包括:

获取真实样本和生成样本;所述真实样本包括有标签真实样本和无标签真实样本;所述生成样本是对隐含编码和隐含向量进行编码得到;所述隐含编码是对包含辐射源个体类别信息的均匀分布进行采样得到,所述隐含向量是对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到;

获取辅助分类网络;

对所述生成样本和有标签真实样本进行判别;

通过判别得到的有标签真实样本和生成样本对辅助分类网络进行训练;

对所述生成样本和无标签真实样本进行判别;

通过判别得到的生成样本对训练后的辅助分类网络再次进行训练;

通过再次训练后的辅助分类网络对特定辐射源个体进行识别。

进一步地,所述对所述生成样本和有标签真实样本进行判别,具体包括:

获取判别网络;

通过生成样本和有标签真实样本对所述判别网络进行训练;

通过训练后的判别网络对生成样本和有标签真实样本进行判别。

进一步地,所述真实样本和生成样本的获取过程包括:

获取表征向量;所述表征向量是对样本数据进行编码得到;所述样本数据包括有标签样本数据和无标签样本数据;

对包含辐射源个体类别信息的均匀分布进行采样得到隐含编码;

对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到隐含向量;

获取生成网络;

通过所述表征向量、所述隐含编码和所述隐含向量对所述生成网络进行训练,所述生成网络输出为生成样本和真实样本。

进一步地,所述表征向量的获取过程具体包括:

获取样本数据;所述样本数据包括有标签样本数据和无标签样本数据;

获取编码网络;

通过所述样本数据对所述编码网络进行训练;编码网络输出为表征向量。

本发明还提供了一种基于生成式对抗网络的半监督式特定辐射源个体识别系统,包括:

样本获取模块,用于获取真实样本和生成样本;所述真实样本包括有标签真实样本和无标签真实样本;所述生成样本是对隐含编码和隐含向量进行编码得到;所述隐含编码是对包含辐射源个体类别信息的均匀分布进行采样得到,所述隐含向量是对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到;

辅助分类网络获取模块,用于获取辅助分类网络;

第一判别模块,用于对所述生成样本和有标签真实样本进行判别;

辅助分类网络训练模块,用于通过判别得到的有标签真实样本和生成样本对辅助分类网络进行训练;

第二判别模块,用于对所述生成样本和无标签真实样本进行判别;

再次训练模块,用于通过判别得到的生成样本对训练后的辅助分类网络再次进行训练;

识别模块,用于通过再次训练后的辅助分类网络对特定辐射源个体进行识别。

进一步地,所述第一判别模块具体包括:

判别网络获取单元,用于获取判别网络;

判别网络训练单元,用于通过生成样本和有标签真实样本对所述判别网络进行训练;

判别单元,用于通过训练后的判别网络对生成样本和有标签真实样本进行判别。

进一步地,所述样本获取模块包括:

表征向量获取单元,用于获取表征向量;所述表征向量是对样本数据进行编码得到;所述样本数据包括有标签样本数据和无标签样本数据;

第一采样单元,用于对包含辐射源个体类别信息的均匀分布进行采样得到隐含编码;

第二采样单元,用于对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到隐含向量;

生成网络获取单元,用于获取生成网络;

生成网络训练单元,用于通过所述表征向量、所述隐含编码和所述隐含向量对所述生成网络进行训练,所述生成网络输出为生成样本和真实样本。

进一步地,所述表征向量获取单元具体包括:

数据获取子单元,用于获取样本数据;所述样本数据包括有标签样本数据和无标签样本数据;

编码网络获取子单元,用于获取编码网络;

编码网络训练单元,用于通过所述样本数据对所述编码网络进行训练;编码网络输出为表征向量。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

(1)能够在低信噪比条件下实现特定辐射源个体识别任务,且识别率能维持在较高水平。同时对于噪声干扰有很好的鲁棒性;

(2)参与训练的有标签的信号数据的数量与无标签的信号数据的数量的比值在较小范围内,网络模型可实现较高的识别率;

(3)本发明具有更快的收敛速度,可以减少网络训练的时间与难度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例基于生成式对抗网络的半监督式特定辐射源个体识别方法的流程图;

图2为本发明实施例网络模型整体框图;

图3为在不同信噪比下的识别性能测试;

图4为在不同的有标签与无标签数据的数量比值下的识别性能测试;

图5为网络模型的收敛速率的测试。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于生成式对抗网络的半监督式特定辐射源个体识别方法,提高特定辐射源个体识别的效率和准确率。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示,本发明公开的一种基于生成式对抗网络的半监督式特定辐射源个体识别方法包括以下步骤:

步骤101:获取真实样本和生成样本;所述真实样本包括有标签真实样本和无标签真实样本;所述生成样本是对隐含编码和隐含向量进行编码得到;所述隐含编码是对包含辐射源个体类别信息的均匀分布进行采样得到,所述隐含向量是对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到。

步骤102:获取辅助分类网络。

步骤103:对所述生成样本和有标签真实样本进行判别。

步骤104:通过判别得到的有标签真实样本和生成样本对辅助分类网络进行训练。

步骤105:对所述生成样本和无标签真实样本进行判别。

步骤106:通过判别得到的生成样本对训练后的辅助分类网络再次进行训练。

步骤101:通过再次训练后的辅助分类网络对特定辐射源个体进行识别。

其中,所述对所述生成样本和有标签真实样本进行判别,具体包括:获取判别网络;通过生成样本和有标签真实样本对所述判别网络进行训练;通过训练后的判别网络对生成样本和有标签真实样本进行判别。

对所述生成样本和无标签真实样本进行判别的过程与对所述生成样本和有标签真实样本进行判别的过程一致。

其中,所述真实样本和生成样本的获取过程包括:获取表征向量;所述表征向量是对样本数据进行编码得到;所述样本数据包括有标签样本数据和无标签样本数据;对包含辐射源个体类别信息的均匀分布进行采样得到隐含编码;对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到隐含向量;获取生成网络;通过所述表征向量、所述隐含编码和所述隐含向量对所述生成网络进行训练,所述生成网络输出为生成样本和真实样本。

其中,所述表征向量的获取过程具体包括:获取样本数据;所述样本数据包括有标签样本数据和无标签样本数据;获取编码网络;通过所述样本数据对所述编码网络进行训练;编码网络输出为表征向量。

下面对上述生成网络g(generatornetworks)、判别网络d(discriminatornetworks)、编码网络e(encoder)和辅助分类网络q(auxiliaryclassifiernetworks)的训练过程进行详细介绍:

一般来说,射频指纹特征是由辐射源内部多个不同硬件部分在不同工作过程共同作用产生,但是功率放大器(poweramplifier,pa)在其中产生的影响最为显著。功率放大器的非线性元件以及记忆存储元件都会对通信信号产生严重的非线性失真,而此失真则可作为射频信号的指纹特征。功率放大器的频率响应可由泰勒多项式的形式来表示。假设输入信号其中s0(t)表示基带信号,fc表示载频频率。则功率放大器的输出信号为:

其中λi表示泰勒多项式的系数,包含了射频指纹特征。

图2是本发明所述的网络结构框图。整体网络模型包含4个子网络:生成网络g(generatornetworks)、判别网络d(discriminatornetworks)、编码网络e(encoder)和辅助分类网络q(auxiliaryclassifiernetworks)。

网络的输入包括初始的信号数据(x,y)、隐含向量z(latentvector)和隐含编码c(latentcode)。初始的信号数据中,x={xl,xul}表示信号样本,包括m个有标签的信号样本xl={xl1,xl2,…,xlm}与n个无标签的信号样本xul={xu1,xu2,…,xun}。yl={yl1,yl2,…,ylm}表示有标签的信号样本所对应的标签信息。隐含向量z通过对随机噪声采样得到,隐含编码c则是对包含辐射源个体类别信息的均匀分布(k,p=1/k)采样得到,其中k表示辐射源的个数。对于一般情况下的生成式对抗网络模型,隐含向量z服从均匀分布或者标准正态分布。但在这里,接收到的通信信号在传输过程中都会受到多径衰落的影响,因此可以构造一个多重模态概率分布,并对其采样得到隐含向量z。这样通过生成网络得到的生成样本可以更好地将信号类别与信号分布匹配,从而提升网络的分类性能。具体来说,这里的多重模态概率分布选择nakagami-m分布,则隐含向量z的概率分布可表示为:

其中,{ci}(i=1,2,…k)表示隐含编码c,用于确定隐含向量z应从哪一个子nakagami-m分布中采样。pi(z)代表nakagami-m分布基,可表示如下:

其中m表示nakagami-m分布的衰落参数,取值范围并且特定于每一个子nakagami-m分布。γ(·)表示伽马函数。pri表示第i类信号的平均能量。

训练样本(x,y)首先送入编码网络e,编码网络对其进行原始数据进行维度压缩处理得到均值向量μ与标准差向量σ,以此构造样本向量空间z=μ+ε⊙σ,其中ε~n(0,i),目的是为了避免μ和σ是随机值而造成梯度无法反向传播的问题,定义一个服从正态分布的随机向量ε,从而将样本的随机性转移至ε,而真正需要被训练的μ和σ在训练的具体时刻是固定的,从而反向传播可以正常进行,编码网络e可以正常训练。通过对样本向量空间z采样得到低维的表征向量z′,表征向量z′包含有原始数据的概率分布特性,对其解码即可得到真实样本。实际过程中由生成网络g对z′进行解码得到真实样本r′。另外,生成网络还对隐含向量z和隐含编码c进行解码得到生成样本r=g(z,c)。在编码与解码的过程中,编码网络e与生成网络g组合成为变分自编码器(variationalauto-encoder,vae),这一组合可有效地避免由于辐射源信号的复杂性而导致网络模型出现模式崩塌的问题。根据均值向量μ与标准差向量σ,编码网络的损失函数可以表示为:

对于判别网络d,其输入包括真实样本r′与虚假样本r,作用是判别输入样本为真实样本或是虚假样本,具体工作过程如同一个二分类器,对于真实样本分配标签“1”,虚假样本分配标签“0”。判别网络的优化目标为:

判别网络的损失函数可以表示为:

辅助分类网络q的作用是用于使得生成样本r=g(z,c)与隐含编码c之间的互信息值i[g(z,c);c]达到最大。当两者的互信息值越大,说明隐含编码c与生成样本r的关系越大。在实际计算的过程中,互信息存在难以计算的边缘概率,因此采用变分推断的方法来解决这一个问题。首先,隐含编码c与生成样本r的互信息可以表示如下形式:

i[g(z,c);c]=h(c)-h(c|g(z,c))(7)

接着对-h(c|g(z,c))进一步推导,获得其下界:

从而可以得到互信息的下界:

至此,本发明定义了li(g,q)去逼近互信息i[g(z,c);c],当两者差距足够小时,就可以使用li(g,q)函数直接代替隐含编码c与生成网络生成数据之间的互信息。li(g,q)中仍存在边缘概率,可以使用蒙特卡罗(montecarlo)模拟方法来近似地表示。

实际训练过程中,当隐含编码c通过对包含辐射源个体类别信息的均匀分布(k,p=1/k)采样得到时,辅助分类网络可视为有标签的生成样本g(z,c)的分类器,分类结果与对应的隐含编码c进行比较,并计算两者的交叉熵函数作为网络的损失函数:

此外,当初始的信号数据带有标签时,由生成网络生成的真实样本r′=g(z′,yl)与对应的标签信息yl也参与到辅助分类网络的训练中,产生的损失函数以正则化的形式加入到原损失函数中,此时网络的损失函数为:

其中λq表示正则化加权系数。

生成网络g的作用是对隐含向量z和隐含编码c进行解码得到生成样本r=g(z,c),同时对低维表征向量z′进行解码得到真实样本r′=g(z′,yl),其训练目标是使生成样本的概率分布pg(z,c)尽可能真是样本的概率分布pg(z′)接近,训练过程中生成网络的损失函数由判别网络与辅助分类网络的损失函数共同决定,具体为:

lg=λg1ld+λg2lq(12)

其中λg1、λg2表示正则化加权系数。

训练过程中,首先采用有标签的信号数据对网络进行指导性的有监督训练,然后采用无标签的信号数据对网络进行优化性的无监督训练。当训练结束整个网络收敛时,辅助分类网络可用于对接收的射频通信信号进行分类,进而完成辐射源个体识别任务。

网络模型的训练与识别过程如下:

(1)接收初始信号数据,并根据标签信息的有无将其划分为两组数据集,先利用有标签的信号数据通过有监督学习的方式对网络模型进行指导性训练,然后利用无标签的信号数据通过无监督学习的方式对网络模型进行优化;

(2)先利用有标签的信号数据进行训练。首先将其送入编码网络进行编码以得到低维的表征向量zl′=e(xl,yl),然后将表征向量zl′送入生成网络进行解码得到真实样本rl′=g(zl′,yl)。另一方面,分别从包含辐射源个体类别信息的均匀分布(k,p=1/k)和包含无线信道先验信息的多重模态nakagami-m分布进行采样,分别得到隐含编码c和隐含向量z,然后将其送入生成网络进行解码得到生成样本r=g(z,c);

(3)固定编码网络与生成网络的网络参数,将生成样本r与真实样本rl′送入判别网络以判别其真伪,并根据式(6)计算判别网络的损失函数,以此对其网络参数进行优化。同时,将生成样本r与真实样本rl′送入辅助分类网络进行预测分类,将分类结果与对应的标签信息:隐含编码c与信号标签yl进行比较,并按照式(11)计算其交叉熵函数作为辅助分类网络的损失函数,以此对其网络参数进行优化;

(4)固定判别网络与辅助分类网络的网络参数,训练编码网络与生成网络,按照式(4)与式(12)分别计算其损失函数,以此对其网络参数进行优化;

(5)再利用无标签的信号数据进行训练。类似地,按照步骤2得到真实样本ru′=g(zu′)与生成样本r=g(z,c),然后按照步骤3训练各个子网络,计算各自的损失函数并以此优化参数。不同的是,训练辅助分类网络时,仅将生成样本r送入辅助分类网络进行预测分类,将分类结果与对应的隐含编码c进行比较,并按照式(10)计算其交叉熵函数作为辅助分类网络的损失函数,以此对其网络参数进行优化;

(6)重复步骤2~步骤5进行多次迭代,当整个网络完成训练后,利用辅助分类网络对接收到的射频通信信号进行分类,从而最终完成辐射源个体识别任务。

本发明通过采用生成式对抗网络(generativeadversarialnetworks,gan)的变种网络模型infogan(informationmaximizinggenerativeadversarialnetworks)为基础,嵌入变分自编码器(variationalautoencoder,vae),然后综合利用有标签与无标签的训练信号样本开展半监督学习。当整体网络模型收敛时,利用辅助分类网络(auxiliaryclassifiernetworks)对接收的射频通信信号进行分类,从而完成特定辐射源个体识别任务。

在具体实施例中:利用matlab软件生成基于功率放大器泰勒多项式的仿真信号数据,取泰勒级数为5,从而生成5类辐射源射频信号,相应的泰勒多项式的系数为:α1=[10.50.30.050.2],α2=[10.60.040.050.4],α3=[10.080.60.40.8],α4=[10.10.80.040.06],α5=[10.10.010.030.15]。设置信号载频频率2ghz,调制样式为16-qam,信号采样频率10ghz,每一个信号样本的采样点数为1000。各类辐射源射频信号在不同信噪比下分别产生,信噪比取值设置为0db、2db、……、22db、24db。每一类辐射源射频信号在不同信噪比下分别产生20000个样本,随机选取2000个为有标签训练样本,8000个为无标签训练样本,1000个为测试样本。

图3为辐射源类别分别为3、4、5时,本发明所提出的基于生成式对抗网络的半监督式特定辐射源个体识别方法在不同信噪比下的识别率。实施例结果表明,尽管辐射源类别不同时识别率存在一定差异,但整体均能保持较高识别率,在10db信噪比下识别率均能达到90%以上。另外,在低信噪比下仍能够实现特定辐射源个体识别任务,且识别率能维持在较高水平。

图4中,设置辐射源类别为3,分别在4db、12db、20db信噪比下,每一类辐射源分别产生20000个射频信号样本,随机选取8000个为无标签训练样本,1000个为测试样本。然后分别随机选取200、400、……1800个样本为有标签训练样本,即有标签与无标签训练样本数的比值分别为2.5%、5%、……、22.5%。在不同比值下的识别率如图4所示。实施例结果表明,在有标签与无标签训练样本数的比值达到7.5%时,识别率即可达到平稳,这说明本方法可以很好适应小样本条件下的特定辐射源个体识别任务。

图5为本发明提出的网络模型vae-infogan与普通的infogan网络模型在收敛性能方面的对比图。设置最大训练次数为100,测试不同训练次数下两种网络模型的损失函数值。实施例结果表明,vae-infogan相比infogan具有更快的收敛速度,这说明本方法可以降低网络的训练难度,减少训练时间,更快地使网络达到收敛状态。

本发明还提供了一种基于生成式对抗网络的半监督式特定辐射源个体识别系统,包括:

样本获取模块,用于获取真实样本和生成样本;所述真实样本包括有标签真实样本和无标签真实样本;所述生成样本是对隐含编码和隐含向量进行编码得到;所述隐含编码是对包含辐射源个体类别信息的均匀分布进行采样得到,所述隐含向量是对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到;

辅助分类网络获取模块,用于获取辅助分类网络;

第一判别模块,用于对所述生成样本和有标签真实样本进行判别;

辅助分类网络训练模块,用于通过判别得到的有标签真实样本和生成样本对辅助分类网络进行训练;

第二判别模块,用于对所述生成样本和无标签真实样本进行判别;

再次训练模块,用于通过判别得到的生成样本对训练后的辅助分类网络再次进行训练;

识别模块,用于通过再次训练后的辅助分类网络对特定辐射源个体进行识别。

其中,所述第一判别模块具体包括:

判别网络获取单元,用于获取判别网络;

判别网络训练单元,用于通过生成样本和有标签真实样本对所述判别网络进行训练;

判别单元,用于通过训练后的判别网络对生成样本和有标签真实样本进行判别。

其中,所述样本获取模块包括:

表征向量获取单元,用于获取表征向量;所述表征向量是对样本数据进行编码得到;所述样本数据包括有标签样本数据和无标签样本数据;

第一采样单元,用于对包含辐射源个体类别信息的均匀分布进行采样得到隐含编码;

第二采样单元,用于对包含无线信道先验信息的多重模态nakagami-m分布进行采样得到隐含向量;

生成网络获取单元,用于获取生成网络;

生成网络训练单元,用于通过所述表征向量、所述隐含编码和所述隐含向量对所述生成网络进行训练,所述生成网络输出为生成样本和真实样本。

其中,所述表征向量获取单元具体包括:

数据获取子单元,用于获取样本数据;所述样本数据包括有标签样本数据和无标签样本数据;

编码网络获取子单元,用于获取编码网络;

编码网络训练单元,用于通过所述样本数据对所述编码网络进行训练;编码网络输出为表征向量。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1