一种基于双谱和EMD融合特征的手机个体识别方法与流程

文档序号:12670470阅读:314来源:国知局
一种基于双谱和EMD融合特征的手机个体识别方法与流程

本发明属于通信技术领域,更为具体地讲,涉及一种基于双谱和EMD融合特征的手机个体识别方法。



背景技术:

通信辐射源个体识别通过对接收信号特征测量,确定产生信号的辐射源个体,其定义为“将辐射源惟一电磁特征与辐射源个体关联能力”。辐射源个体特征一般是由于其内部元器件之间也存在着微小差异(如器件的非线性、频率源的不稳定性以及杂散输出等),这种特征也称为通信信号的“指纹”,是指通信信号中用于标识发送该信号的通信设备身份的特征,对每个个体来说,这种特征是唯一的。目前,通信辐射源个体识别技术已经成为通信信号处理领域里的一个研究热点。通信辐射源个体识别的目标是通过利用通信号信号中的能够标识辐射源个体的细微特征集(一般称为信号细微特征)与数据库中的细微特征集进行匹配,从而达到辐射源个体识别的目的。

随着通信技术的发展,无线网络纷繁复杂,为保证无线网络的安全性,需要对网络的用户进行身份验证,原有的身份验证方式主要是密钥验证,但是非法用户若窃取到了密钥,仍然可以入侵无线网络。若同时采取密钥身份验证和硬件个体身份验证两种方式,无线网络的安全性就可大大提高。如在认知无线电领域,移动通信设备如手机,通过感知所在无线网络内的频谱环境,找到注册手机的空闲时段进行通信,在频谱越来越紧张的今天,认知无线电技术大大提高了频谱利用率。然而,这种技术的缺陷在于,目前采用的通过软件认证的方式很容易模仿,这个漏洞也容易被恶意攻击方利用,发动PUE(Primary User Emulation)攻击,从而造成信息泄露或频谱被长期非法占用,给网络管理带来了极大的麻烦。通过本发明手机辐射源个体的识别技术,从物理层进行认证,这种认证方式是个体唯一、极难被模仿的,通过设备被动认证,不需要设备间的协作,实施方便,可以有效的阻止PUE攻击,增强认知无线电网络的安全性。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种基于双谱和EMD融合特征的手机个体识别方法,利用手机设备个体特征的唯一性、不可模仿性,极大地增强无线电网络的安全性。

为实现上述发明目的,本发明一种基于双谱和EMD融合特征的手机个体识别方法,其特征在于,包括以下步骤:

(1)、对待识别的手机个体采样

在手机通话阶段,使用AD9361软件无线电平台对待识别的手机个体采样,采样频段为a~bMHz,采样频率为fsMHz,其中,设待识别的手机个体共C个,每个手机个体采样M组采样数据,则待识别的手机个体共计采样出C×M组采样数据;

(2)、采样数据预处理

将C×M组采样数据依次通过PCIE实时传输到PC机上,再通过对采样数据进行解帧和重组,得到I、Q两路数据信号;

(3)、获取数据样本集

计算I、Q两路数据信号的模值,将采样数据的长度等于L且模值大于预设阈值的采样数据保存在数据样本集S{n}中,n表示数据样本集中采样数据的个数,n≤C×M;

(4)、求取样本特征集X

计算每个数据样本的双谱,再求取其矩形围线积分作为双谱特征,最后利用多分类Fisher判别双谱特征,将双谱特征分离度最大的k个特征作为样本特征集X;

(5)、求取样本特征集Y

计算每个数据样本的经验模态分解,再去除主分量和噪声后计算出杂散成分的功率谱,最后利用主成分分析法对杂散成分的功率谱进行降维,将降维后最大的前p个主成分分量作为样本特征集Y;

(6)、利用典型相关分析法对样本特征集X和样本特征集Y进行特征融合,得到融合后的特征集Z,对Z按m%:n%的比例做水平切分,其中,m%作为训练集ZTrain,剩下的为测试集ZTest

(7)、构建随机森林分类器,用训练集ZTrain训练该分类器,并利用训练好的分类器对测试集ZTest进行分类决策,最终输出手机个体识别结果。

其中,所述步骤(4)中,求取双谱的矩形围线积分作为双谱特征的具体方法为:

(2.1)、将每一个长度为L的样本数据分成K段,保持相邻数据段重叠部分为T%,每段数据长度为表示下取整,并对每段数据去均值;

(2.2)、第i段数据的DFT系数Y(i)(λ):

其中,是去均值后的第i段数据,λ是DFT变换后的频点;

(2.3)、计算DFT系数的三阶相关:

其中,L1的取值满足是在双谱区域沿水平和垂直方向上所要求的两频率采样点之间的间隔,λ12是频域的相关变量;

(2.4)、计算数据样本的双谱

其中,

(2.5)、对双谱求模得到B(ω12),再求取B(ω12)的矩形围线积分,得到积分后的双谱特征B(l):

其中,Rl表示以零点为中心,在第一、四象限的一组矩形的积分路径,l=1,2,…,Pl,Pl是积分路径的条数;

(2.6)、重复上述步骤(2.1)~(2.5),计算得到特征集S{n}中每一个样本的矩形围线积分双谱特征。

进一步的,所述步骤(5)中,计算杂散成分的功率谱的具体方法为:

(3.1)、计算每个样本x(n)的EMD:

其中,J表示EMD分解层数,x(n)表示数据样本集S{n}中的数据样本,cj(n)表示第j个成分分量,r(n)表示信号分解后的残差;

(3.2)、去除信号的主要成分和噪声成分c1(n)、cJ(n),将余下的分量求和,得到杂散信号成分

(3.3)、对杂散成分xo(n)进行FFT变换,得到功率谱Xo(ω);

(3.4)、重复上述步骤(3.1)~(3.3),计算得到样本集S{n}中的每一个样本杂散成分的功率谱系数。

所述步骤(6)中,利用典型相关分析法对样本特征集X和样本特征集Y进行特征融合的具体方法为:

(4.1)、令Sxx∈Rp×p,Syy∈Rq×q分别表示特征集X和Y的方差,Sxy∈Rp×q表示特征集X和Y的协方差,Syx是Sxy的对称矩阵,其中p,q分别是特征集X和特征集Y中的样本个数;

(4.2)、构造协方差矩阵S:

(4.3)、构造一组线性变换Wx,Wy,使其满足使得在两个特征集X和Y之间的特征对之间的相关性最大,即:

其中

(4.4)、令cov(X*)=cov(Y*)=1,使用拉格朗日乘子法求解上式的目标函数max{cov(X*,Y*)},即求解关于两个方程的广义特征值问题,可以得到Wx,Wy

其中,R2是特征根对角矩阵,其中非零特征值的个数为d=rank(Sxy)≤min(n,p,q),并且按降序排列λ1≥λ2≥…λd,Wx,Wy分别是和非零特征值对应的特征向量空间;

(4.5)、由上式得到Wx,Wy的对X和Y两个特征集做特征融合,得到融合后的特征集合:

更进一步的,所述步骤(7)中,利用随机森林分类器对特征集Z进行分类决策的方法为:

基于随机森林分类(RFC)的决策模型,由多个决策树{ht(z,θt)},z∈ZTrain组成的分类器;θt是相互独立且同分布的随机向量,表示每棵决策树的决策参量;z是输入的训练特征向量;首先用ZTrain训练随机森林分类器,然后对ZTest做分类预测,最终由所有决策树综合决定输入特征向量的最终类别标签,决策树的棵数为NT,采用多数投票法决策:

其中,H(z)表示组合分类模型,O表示输出的手机个体类别。

本发明的发明目的是这样实现的:

本发明一种基于双谱和EMD融合特征的手机个体识别方法,通过分别对所有样本通过计算双谱,再利用PCA降维,得到特征集X;同时计算样本经验模态分解,得到信号杂散成分的功率谱,再通过Fisher判别分析得到特征集Y;对特征集X和Y做CCA特征融合得到融合特征集Z;对Z按m%:n%的比例做水平切分得到训练集ZTrain和测试集ZTest,用训练集ZTrain训练随机森林分类器,并利用训练好的分类器对测试集ZTest进行分类决策,最终输出手机个体识别结果。

同时,本发明一种基于双谱和EMD融合特征的手机个体识别方法还具有以下有益效果:

(1)、提取的手机个体特征稳定度较好,融合后的特征具有较强的区分性,从而提高了手机个体的识别率,并且该发明所使用的方法适用且很容易推广到3G、4G频段的手机个体识别,可以增强混合认知无线电网络的安全性。

(2)、平台可以采用分布式部署,从特征提取、融合、分类器的训练、个体识别很容易部署在分布式平台上,采用并行计算,极大地提高了运算能力,实现计算资源的灵活配置。

(3)、本发明为辐射源识别个体识别提供了一种新的思路,本发明中采用的特征提取和特征融合的方法对其他辐射源个体识别,如电台、雷达、WiFi、路由等也具有很好借鉴意义。

附图说明

图1是本发明一种基于双谱和EMD融合特征的手机个体识别方法流程图;

图2是GSM手机信号采样接收设备连接实物及示意图;

图3是I路信号部分截图和暂态、稳态部分展示;

图4是SIB积分路径示意图;

图5是6部手机的双谱等高线图;

图6是手机双谱信号的SIB特征图;

图7是EMD分解后的时频分布图;

图8是手机杂散分量的功率谱分布图;

图9是CCA特征融合后的二维特征分布图;

图10是6部手机个体的分类是识别结果。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。

实施例

为了方便描述,先对具体实施方式中出现的相关专业术语进行说明:

AGC(Automatic Gain Control):自动增益控制;

SIB(Square Integrated Bispectra):矩形围线积分双谱;

PCA(Principal Component Analysis):主成分分析;

FDA(Fisher Discriminant Analysis):Fisher判别分析;

EMD:(Empirical Mode Decomposition)经验模态分解;

IMFs:(Intrinsic Mode Functions)本征模态函数;

DFT:(Discrete Fourier Transform)离散傅里叶变换;

FFT:(Fast Fourier Transformation)快速傅里叶变换;

RFC:(Random Forest Classifier)随机森林分类器;

图1是本发明一种基于双谱和EMD融合特征的手机个体识别方法流程图。

在本实施例中,如图1所示,本发明一种基于双谱和EMD融合特征的手机个体识别方法,包括以下步骤:

(1)、对待识别的手机个体采样

在手机通话阶段,使用AD9361软件无线电平台对待识别的手机个体采样,采样频段设为888~908MHz,采样频率设置为56MHz;其中,设待识别的手机个体共6个,分别对每个手机进行采样;

在本实施例中,如图2所示,AD9361平台对上行GSM频段手机个体进行采样,采样对象为两个手机品牌,Nokia手机3部,型号为1682C,福中福手机3部,型号为F688D,GSM天线作为采样平台的信号接收端,采样数据保存成二进制文件,每次采样2G数据,每部手机分时采样5次,最终得到60G的原始样本数据,再从60G的原始样本数据中抽取6000组采样数据,其中每部手机抽取1000组采样数据;

(2)、采样数据预处理

将6000组采样数据依次通过PCIE实时传输到PC机上,再通过对采样数据进行解帧和重组,得到I、Q两路数据信号;

(3)、获取数据样本集

计算I、Q两路数据信号的模值,将采样数据的长度等于L=5000且模值大于预设阈值1000的采样数据保存在数据样本集S{n}中,n表示数据样本集中采样数据的个数,n≤C×M;

在本实施例中,由步骤(2)得到I、Q两路数据信号,如图3所示为I路信号部分截图,信号可以分为噪声部分、暂态信号部分,稳态信号部分,本实施例的目的是提取信号的稳态部分,其中阈值1000的取值是根据AD9361采样设备的AGC设置得到,具体实施应该根据采样设备的增益大小做适当的调整。

(4)、求取样本特征集X

计算每个数据样本的双谱,再求取其矩形围线积分作为双谱特征,最后利用多分类Fisher判别双谱特征,将双谱特征分离度最大的k个特征作为样本特征集X;

在本实施例中,求取双谱的矩形围线积分作为双谱特征的具体方法为:

(4.1)、将每一个长度为5000的样本数据分成98段,保持相邻数据段重叠部分为8%,每段数据长度为64,长度不足64的后面补零,并对每段数据去均值;

(4.2)、第i段数据的DFT系数Y(i)(λ):

其中,是去均值后的第i段数据,λ是DFT变换后的频点;

(4.3)、计算DFT系数的三阶相关:

其中,L1的取值满足L1=128,是在双谱区域沿水平和垂直方向上所要求的两频率采样点之间的间隔,λ12是频域的相关变量;

(4.4)、计算数据样本的双谱

其中,

在本实施例中,手机个体1~6的双谱如图4所示,图中所示为等高线图,从图中可以看出经过双谱变换后的手机信号在不同个体之间差异不是特别明显,特别在相同型号之间,特征分离度判别不够明显;

(4.5)、对双谱求模得到B(ω12),再求取B(ω12)的SIB,得到积分后的双谱特征B(l):

其中,Rl表示以零点为中心,在第一、四象限的一组矩形的积分路径,l=1,2,…,64;

在本实施例中,如图5,图中每个黑点代表一个双谱值,按照SIB得到个体的特征向量,手机1到手机6的SIB个体特征如图6所示。

(4.6)、重复上述步骤(4.1)~(4.5),计算得到特征集S{n}中每一个样本的矩形围线积分双谱特征。

在本实施例中,为了提取分离度最大的k个特征,需要采用Fisher线性判别分析。对多类别(C>2)的情形,选择使得分离度最大的k个向量,k的取值由交叉验证得到。这就需要推广投影方程、类间散布矩阵SB和类内散步矩阵SW。对C个手机信号(C=6),需要将SIB积分后的64维双谱特征空间向k维空间投影。

设y=[y1,y2,…,yk]T,W=[ω12,…,ωk],k个方程可以表示成:y=WTx,这里的表示第个类别的样本集,y为第类别的样本的投影向量集。

类间散度矩阵SB和类内散度矩阵SW可以由总体散度矩阵ST和总体均值向量得到,其中n=n1+n1+…nC,表示第个类别的手机个体样本数。

分别计算类间散度矩阵SB和类内散度矩阵SW

其中,分别表示样本总均值和第i个类别的均值。

对矩阵束{SB,SW}进行特征值分解,并对特征值降序排列λ1≥λ2≥…≥λC-1,然后取前k个值对应的归一化特征向量对W=[ω12,…,ωk]为得到的k维投影子空间。

由此求出的投影矩阵W,利用y=WTx,分别求出使每个手机个体分离度最大的k个特征,由此作为样本特征集X。

(5)、求取样本特征集Y

计算每个数据样本的经验模态分解,再去除主分量和噪声后计算出杂散成分的功率谱,最后利用主成分分析法对杂散成分的功率谱进行降维,将降维后最大的前p个主成分分量作为样本特征集Y;

在本实施例中,计算杂散成分的功率谱的具体方法为:

(5.1)、计算每个样本x(n)的EMD:

其中,J表示EMD分解层数,x(n)表示数据样本集S{n}中的数据样本,cj(n)表示第j个成分分量,r(n)表示信号分解后的残差;

(5.2)、去除信号的主要成分和噪声成分c1(n)、cJ(n),将余下的分量求和,得到杂散信号成分如图7所示,手机个体1~6的EMD分解后,得到归一化频谱,本步骤的目的即是去除图中高频和低频成分,保留的则是手机个体的杂散信号,可以作为后续谱特征提取;

(5.3)、对杂散成分xo(n)进行FFT变换,得到功率谱Xo(ω);如图8所示,为6个手机个体的杂散特征,经过谱分析去除主分量和噪声分量后的信号,使得不同手机个体的区分性明显增强;

(5.4)、重复上述步骤(5.1)~(5.3),计算得到样本集S{n}中的每一个样本杂散成分的功率谱系数;

在本实施例中,基于主成分分析法PCA降维,是利用PCA对基于EMD分解的频谱构成的特征矢量进行降维,得到

Y=UT[r1,r2,…rN]T

式中,是一个长为的全1行矢量,U为前p个主成分分量对应的特征向量组成的矩阵,矩阵Y的规模是变换后的矢量即为矩阵Xo(ω)的主成分,并作为样本特征集Y。

(6)、利用典型相关分析法对样本特征集X和样本特征集Y进行特征融合,得到融合后的特征集Z;

其中,利用典型相关分析法对样本特征集X和样本特征集Y进行特征融合的具体方法为:

(6.1)、令Sxx∈Rp×p,Syy∈Rq×q分别表示特征集X和Y的方差,Sxy∈Rp×q表示特征集X和Y的协方差,Syx是Sxy的对称矩阵,其中p,q分别是特征集X和特征集Y中的样本个数;

(6.2)、构造协方差矩阵S:

(6.3)、构造一组线性变换Wx,Wy,使其满足使得在两个特征集X和Y之间的特征对之间的相关性最大,即:

其中

(6.4)、令cov(X*)=cov(Y*)=1,使用拉格朗日乘子法求解上式的目标函数max{cov(X*,Y*)},即求解关于两个方程的广义特征值问题,可以得到Wx,Wy

其中,R2是特征根对角矩阵,其中非零特征值的个数为d=rank(Sxy)≤min(n,p,q),并且按降序排列λ1≥λ2≥…λd,Wx,Wy分别是和非零特征值对应的特征向量空间;

(6.5)、由上式得到Wx,Wy的对X和Y两个特征集做特征融合,得到融合后的特征集合:

如图9所示,经过特征融合后6个手机个体的二维特征和三维特征分布,由图中可以看出,不同手机个体特征明显呈现类簇分布,相同个体特征分布较为紧密,不同个体特征的类间距较远,为下一步准确分类奠定了良好的条件。

在本实施例中,对融合后的特征集Z按照3:2的比例切分训练集和测试集,即特征集Z的3/5作为训练集ZTrain,剩下的为测试集ZTest,步骤(1)中抽取了6000组采样数据,那么特征集Z中也共有6000组采样数据,通过3:2的比例切分后,ZTrain有3600组采样数据,ZTest有2400组采样数据

(7)、构建随机森林分类器,并利用该分类器对特征集Z进行分类决策,最终输出手机个体识别结果。

在本实施例中,利用随机森林分类器对特征集ZTest进行分类决策的方法为:

基于随机森林分类(RFC)的决策模型,由多个决策树{ht(z,θt)},z∈ZTrain组成的分类器;θt是相互独立且同分布的随机向量,表示每棵决策树的决策参量;z是输入的训练特征向量;首先用ZTrain训练随机森林分类器,然后对ZTest做分类预测,最终由所有决策树综合决定输入特征向量的最终类别标签,决策树的棵数为NT,采用多数投票法决策:

其中,H(z)表示组合分类模型,O表示输出的手机个体类别。

具体实现步骤如下:

(7.1)、应用bootstrap法从ZTrain中有放回的抽取200个新的自助样本集,并由此构建200棵分类树,每次未被抽到的样本组成了200个袋外数据,用来估计当前模型性能。

(7.2)、对每个样本的64个属性,在决策树的每个节点需要分裂时,随机从这64个属性中不放回抽取m*个属性,在整个随机森林构造过程中m*是一个常数,本发明中取m*=8;

(7.3)、从这8个属性中采用Gini系数来选择一个1个属性作为该节点的分裂属性,每棵树按最大限度地生长,且不做任何的剪枝;

(7.4)、将生成的多颗分类树组成随机森林,用随机森林分类器对新的预测数据进行判别和分析,分类结果按树分类器的投票结果的众数决定。

图10是6个手机个体的分类识别结果,结果表明,经过多次试验,平均识别率达到95%左右,验证了本发明提出识别方案的正确性和有效性,这也为增强认知无线电网络安全性从物理层认证提供了实用方案。

本发明中,手机个体信号采集过程是一个非常重要的环节。由于提取的个体细微的杂散特征,为保证较高的个体识别准确率,需要注意三点,一是采样设备本身最好不要引入太多噪声,因此较高精度的采样设备是必须的;二是采样率要保证是信号带宽的3~5倍;三是保证提取的是信号的杂散特征,而非信号本身,因此去除信号的信息承载部分和背景噪声也是必须的,这可以通过EMD分解剔除无关分量来实现。

尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1