一种基于支持向量聚类和灰关联度的雷达信号分选方法与流程

文档序号:17392042发布日期:2019-04-13 00:33阅读:305来源:国知局
一种基于支持向量聚类和灰关联度的雷达信号分选方法与流程

本发明涉及雷达信息处理领域,具体涉及一种基于支持向量聚类和灰关联度的雷达信号分选方法。



背景技术:

支持向量聚类(supportvectorclustering,svc)是ben-hur等在基于高斯核的svdd(supportvectordomaindescription)算法基础上进一步发展起来的无监督非参数型的聚类算法。是指利用高斯核,将数据空间中的数据点映射到一个高维特征空间中,并在特征空间中寻找一个能包围所有数据点像的最小半径超球面,将这个超球面反映射回数据空间,最终得到包含所有数据点的等值线集的聚类方法。

一个高维空间的超球面在原空间中可以是任意的形状,因此可以处理任意形状的聚类,有效处理噪声。特征空间超球体的球面映射到原始样本空间为等值曲线,超球体内部的点映射为等值曲线内部的点。每一条闭合曲线包含的样本点属于同一个簇。通经过非线性映射,svc增加了数据点线性可分的概率,使数据点的聚类特征更为明显,因而可以较好地分辨、提取并放大有用特征。在融入松弛量后,能有效排除异常值,实现更为准确的聚类。

灰关联分析是通过灰色关联度来分析和确定系统诸因素的影响,或因素对系统主行为的贡献的一种测度方法,其基本思路是:通过确定参考数据列和若干比较数据列的几何形状相似程度来判断其联系是否紧密,反映了曲线间的关联程度,从而分析系统中多因素间的关联程度。序列曲线几何形状越接近,之间的关联度越大。灰关联分析在预测、决策、控制和模式识别等诸多方面获得了成功应用。

事实上,对于可分类别来讲,困扰聚类分选的最大问题在于用于聚类的特征没有很好的类间分离能力,这影响了聚类方法的实际使用效果,svc面临同样问题,没有一种指标总优于其它指标同样地,没有一种指标可以处理任何类型的数据集。



技术实现要素:

本发明针对交织严重但又具有短时周期重复特点的雷达信号聚类分选问题,提供一种基于支持向量聚类和灰关联度的雷达信号分选方法,设计一种灰关联度指标用于确定簇类划分,并据此实现了复杂环境下的雷达信号分选。

为达到上述目的,基于支持向量聚类和灰关联度的雷达信号分选方法分选步骤如下:

步骤一:构造描述雷达脉冲的特征向量g集和雷达信号样本数据集i=1,2,...,n,此处n为总样本数,d为特征维数,将数据空间中的样本映射到特征空间,得到一个中心为a,半径为r的闭凸超球体:

minr2+c∑iξi

s.t.||φ(gi)-a||2≤r2+ξi,ξi≥0(1)

c表示惩罚因子,φ(g)表示数据点g在特征空间中映像,||g||为euclidean范数,ξi表示松弛量;

上述约束问题的lagrangian算式为:

l=r2-∑i(r2+ξi-||φ(gi)-a||2)βi

-∑iξiμi+c∑iξi(2)

其中,βi为拉格朗日乘子;对l关于r、a和ξ求导并令导数等于0,得:

则由wolfe对偶形式推导出式(1)的等价问题为:

引入高斯核函数k(gi,gj)=φt(gi)φ(gj)=exp(-q||gi-gj||2),q为高斯核宽度,由式(1)约束条件可知,在特征空间中映射点到球心距离表示为:

r2(g)=||φ(g)-a||2

=1-2∑jβjk(gj,g)

+∑i,jβiβjk(gi,gj)(5)

由公式(4)和(5)推导出最优βi值和最优超球面半径r,确定同一类样本数据的聚类边界;

步骤二:采用改进的锥面聚类标识ccl算法进行聚类标识;

步骤三:选取数据集中的一个样本作为参考序列:x0={x0(k)|k=1,2…,k},数据集中其余的样本数据xi={xi(k)|k=1,2…,k}作为比较序列,k是样本序列的维数,n为数据集合中样本总数;设在第k个时刻x0(k)和xi(k)的绝对差为δ0i(k)=|x0(k)-xi(k)|。

则参考序列x0(k)与比较序列xi(k)的关联系数定义为:

ξ∈(0,1]为分辩系数,其值越小,分辩力就越大,这里取ξ=0.5,m0称为两级最小差,m0称为两级最大差;计算灰关联度:

步骤四:灰关联度指标gcd定义为:

其中,gsep(c)表示簇间灰关联度,gcomp(c)表示簇内灰关联度,其求解公式如下:

式中:

其中|ck|表示簇类ck包含的数据对象数目;

步骤五:令惩罚因子c=1,通过计算聚类过程中gcd的值不断调节参数q,使得gcd的值达到最大。

雷达脉冲的特征向量g集和雷达信号样本数据集i=1,2,...,n包含脉冲描述字pdw中的脉冲重复间隔pri、脉冲载频rf、脉冲到达方向doa,脉冲到达时间toa,脉宽pw和幅度pa的集合。

雷达脉冲的特征向量g集和雷达信号样本数据集i=1,2,...,n类型包括常规雷达信号cw、线性调频雷达信号lfm、非线性调频雷达信号nlfm、二相编码雷达信号bpsk、四相编码雷达信号qpsk和频率编码雷达信号fsk。

本发明具有的有益效果:

1、本发明将基于灰关联度指标的msvc聚类算法应用于复杂体制雷达信号分选之中。

2、本发明在具有重叠、相互交织的雷达参数集上得到较好的聚类结果,提高了雷达信号分选正确率,在一定程度上满足雷达电子对抗的实效性、准确性的要求,具有一定的实际参考性和可行性。

附图说明

图1为本发明基于gcd指标聚类算法流程

图2为不同聚类数目情况下gcd指标

图3为rf和pw特征分布图

图4为典型k-means和fcm聚类结果

图5为本发明在不同参数条件下聚类效果图

具体实施方式

下面结合实施例对本发明技术方案做进一步说明。

本发明提供了一种基于支持向量聚类和灰关联度的雷达信号分选方法,首先确定雷达信号svc分选模型;然后设计了灰关联度指标以验证聚类的有效性,并根据有效性指标调整聚类参数,以达到最佳的聚类效果,在具有重叠、相互交织的雷达参数集上可以得到较好的聚类结果,提高了雷达信号分选正确率,在一定程度上满足雷达电子对抗的实效性、准确性的要求。

步骤一:确定同一类样本数据的聚类边界。构造描述雷达脉冲的特征向量集g和雷达信号样本数据集i=1,2,...,n,此处n为总样本数,d为特征维数。结合svc的优良特性,将数据空间中的样本映射到特征空间,得到一个中心为a,半径为r的闭凸超球体,建立支持向量聚类信号分选模型为:

minr2+c∑iξi

s.t.||φ(gi)-a||2≤r2+ξi,ξi≥0(1)

c表示惩罚因子,φ(g)表示数据点g在特征空间中映像,||g||为euclidean范数,ξi表示松弛量,作用是分离交叉的超球面。

上述约束问题的lagrangian算式为:

l=r2-∑i(r2+ξi-||φ(gi)-a||2)βi

-∑iξiμi+c∑iξi(2)

其中,βi为拉格朗日乘子。

对l关于r、a和ξ求导并令导数等于0,得:

则由wolfe对偶形式推导出式(1)的等价问题为:

引入高斯核函数k(gi,gj)=φt(gi)φ(gj)=exp(-q||gi-gj||2),q为高斯核宽度,由式(1)约束条件可知,在特征空间中映射点到球心距离表示为:

r2(g)=||φ(g)-a||2

=1-2∑jβjk(gj,g)

+∑i,jβiβjk(gi,gj)(5)

由公式(4)和(5)即可推导出最优βi值和最优超球面半径r,形成数据空间中的等值线,等值线由点{g:r(g)=r}定义。它确定了属于同一类雷达辐射源参数的聚类边界。根据ktt条件,当点φ(gi)满足0<βi<c时,这些位于最优超球面上的点称之为支持向量(supportvectors,svs)。对于任何支持向量vi,有r(vi)=r,这些点即为聚类边界,而边界形状取决于核函数。这样数据空间中同一边界等值线上的点确定了同一类样本数据的聚类边界。

步骤二:采用改进的锥面聚类标识(coneclusterlabeling,ccl)算法(mcll)进行聚类标识。该方法将剩余数据点分为正常值和异常值分别进行处理,正常值采用ccl算法标记,异常值则是通过计算比较同聚类质心距离,合并到距离最近的类中,从而降低计算复杂度的同时(近似复杂度为o(nnsv)),解决应用路径采样方法计算邻接矩阵时可能产生的错误聚类问题。

步骤三:灰关联分析。选取数据集中的一个样本作为参考序列:x0={x0(k)|k=1,2…,k},数据集中其余的样本数据xi={xi(k)|k=1,2…,k}作为比较序列,k是样本序列的维数,n为数据集合中样本总数。

设在第k个时刻x0(k)和xi(k)的绝对差为δ0i(k)=|x0(k)-xi(k)|。

则参考序列x0(k)与比较序列xi(k)的关联系数定义为:

ξ∈(0,1]为分辩系数,其值越小,分辩力就越大,这里取ξ=0.5,m0称为两级最小差,m0称为两级最大差。

将每一比较序列各个时刻的关联系数体现在一个值上以便于比较,这个值就是灰关联度,一般用平均值法计算灰关联度,即:

步骤四:定义灰关联度指标。考虑到同一辐射源信号具有周期重复性,自相似性较强,而不同辐射源信号相似性较弱。因此,可以使用平均灰关联度衡量簇内各对象的分布紧凑度以及簇间分离度,并保持两者的平衡。由此,本文设计了灰关联度(greycorrelationdegree,gcd)作为雷达信号分选有效性验证指标。假设某一数据集聚为c类,则gcd指标定义为:

其中,gsep(c)表示簇间灰关联度,gcomp(c)表示簇内灰关联度,其求解公式如下:

式中:

其中|ck|表示簇类ck包含的数据对象数目。定义以上两式的原理如下:若类间关联性越强,其灰关联度glk,l≠k值越大,簇间灰关联度gsep(c)越大,其聚类结果的簇间分离度也就越差,这里选择某一类与剩余类灰关联度的最大值来衡量该类同其它簇间的灰关联度,然后取平均值gsep(c)表示聚类的簇间灰关联度。与之对应,用簇内灰关联度gkk的最小值gcomp(c)表示簇内灰关联度,即簇内紧凑度。

聚类期望簇内关联性尽可能大,即簇内灰关联度gcomp(c)尽可能大;簇间分离性尽可能好,即簇间灰关联度gsep(c)尽可能小,所以求使gcd最大化的聚类划分即认为是较好的分选效果,因此可以依据gcd指标来调整聚类算法参数以达到最优聚类效果。

步骤五:基于灰关联度指标的聚类参数调整

在svc算法中,核参数q对聚类结果会产生很大的影响,随着参数q的增加,聚类边界随之紧凑,聚类数目随之增多。因此,先取较小的q初始值来运行程序,此时不需要处理边界支持向量(boundedsupportvectors,bsvs),可令惩罚因子c=1;然后启发式增大q值,在此过程中,如果svs数目急剧增多或者聚类结果中包含单样本向量形成的聚类,则说明存在bsvs,bsvs对聚类结果的正确性有很大的影响,可以通过逐渐减小c值以平滑聚类边界,剔除单样本形成的簇类。若c值不足以平滑聚类边界,适当的减小q值或其变化步长。通过计算聚类过程中gcd的值不断调节参数q,使得gcd的值达到最大,最终达到正确聚类分选雷达信号的目的。

应用gcd调整聚类参数的调整(gcd-msvc)流程如图1所示。

雷达脉冲的特征向量g集和雷达信号样本数据集i=1,2,...,n包含脉冲描述字pdw中的脉冲重复间隔pri、脉冲载频rf、脉冲到达方向doa,脉冲到达时间toa,脉宽pw和幅度pa的集合。

雷达脉冲的特征向量g集和雷达信号样本数据集i=1,2,...,n类型包括常规雷达信号cw、线性调频雷达信号lfm、非线性调频雷达信号nlfm、二相编码雷达信号bpsk、四相编码雷达信号qpsk和频率编码雷达信号fsk。

本发明实施例1:聚类有效性指标验证。

为检验聚类验证指标的有效性,仿真产生的一系列脉冲数据集,实验数据集如表1所示。然后从中分别随机选择500个样本数据组成data1,data2和data3数据子集进行有效性验证实验。利用载频rf、脉宽pw和到达角doa三个参数组成特征向量。其中data1,data2和data3为雷达脉冲数据子集,数据子集的类别数目分别为2,4和4。

表1雷达脉冲信号参数表

对三种数据子集分别应用支持向量聚类进行聚类实验,gcd值随聚类数目的变化曲线如图2所示,图中结果表明gcd指标在数据集正确类别数目上表现出了尖锐的峰值,正确表现出数据集最佳的分类数目,因而适用于密集复杂的雷达信号脉冲流的聚类分选,同时也印证了理论分析的结果。

本发明实施例2:复杂体制雷达多参数分选.

随着雷达体制和电磁环境日益复杂化,脉间参数的交叠情况变得更加严重,聚类边界普遍交叉,从而造成参数之间极低的可分性。为考察svc聚类算法在该情景下的聚类效果,调整辐射源参数进行仿真实验,考虑到测向精度和测向分辨率的限制,以及传播路径对doa的干扰,导致doa参数的可靠性降低。这里假定所要分选的是同一方向的几部雷达信号脉冲流,其具体参数如表2所示

表2辐射源信号参数

设接收机中频为30mhz,带宽为20mhz,adc采样频率为200mhz,典型信噪比15db,用0到总截获时间tint内的均匀分布的随机数仿真辐射源的起始脉冲的toa,则当总截获时间为tint=50ms时,一次典型试验共生成表2中的6部雷达脉冲共450个,其丢失脉冲和剩余脉冲的详情见表3。仿真产生数据的脉冲丢失率为10.44%。

表3仿真产生脉冲的丢失情况

试验取[rf,pw]为特征参数,对特征归一化处理后其rf和pw参数特征的分布情况如图3所示。可以看出,除rd3外,其它辐射源信号的rf-pw特征均有不同程度的交叠,尤其是rd1和rd2、rd5和rd6特征交叠严重。

为更为直观的验证支持向量的聚类效果,下面利用k-means和fcm算法进行对比实验。试验时首先对特征向量进行归一化,并设定不存在漏选脉冲。1次典型k-means聚类和fcm聚类算法生成的聚类效果如图4所示。符号“×”表示聚类中心,c1表示由生成的第1个聚类,c2等含义以此类推。

由图4可以看出,即使指定聚类数目,kmeans聚类方法和fcm聚类方法仍将rd5和rd6聚为一类,与此对应,将rd4分裂为两类。同时还可以看出,除rd3效果较好外,其它类簇均有不同程度的错误聚类。

对于gcd-msvc方法来讲,其聚类参数c,q和有效性验证指标gcd对聚类结果的有效性起着至关重要的作用。首先令c=1,并根据公式(14)得到得q=0.607,以公式(14)确定的初始q意味着所有数据点对形成的核函数值较大,从而使得所有数据仅形成一个簇类,而c=1确保此时不会形成边界支持向量,即异常值。

当q增大到支持向量数目急剧增多时,根据p=1/(nc),需要启发式减小c值,p表示允许边界支持向量所占比例。然后根据参数q运行mcmsvc算法,得到一个中间聚类结果。根据图1算法不断调整参数以使得灰关联指标值取得最大,图中光滑曲线表示等值线,符号“○”表示支持向量。下图显示了算法在不同阶段和参数下数据的聚类结果。实验结果表明可见随着q的增大,包含绝大多数样本的簇类分裂为多个具有意义的簇类(图5(b、c、d)),而参数c起着平滑聚类边界的作用。图5(c)中显示了在参数p=0.201,q=35时的聚类结果(尚未处理异常值),可见随着q的增大,包含绝大多数样本的簇类分裂为多个具有意义的簇类(图5(d))。根据mccl算法对异常值进行处理,得到最终聚类分布由图5(e)和5(f)给出。

辐射源的rf-pw特征交叠严重,可分性较差,因此很难将两者很好的分离开来。svc将特征空间映射到高维数据空间,增加了交叠特征线性可分的概率。即使rd5的rf-pw部分特征位于rd6特征内部,依然可以有效地将二者区分开来,图5(f)显示了这一聚类结果。也说明支持向量聚类能较好地分辨、提取并放大有用特征,有利于处理复杂交织特征。

利用k-means、fcm、期望最大化(em)、快速近似k均值(farthestfirst)算法与gcd-msvc分选方法进行实验对比,实验结果选用20次分选实验的统计平均值。记分选正确率=1-误选脉冲/脉冲总数,误选脉冲是指属于当前辐射源的脉冲数据被分到其它辐射源的脉冲。五种算法的平均分选正确率分别为75.43%、68.45%、87.34%、88.59%和92.87%,基于密度的聚类方法(obscan)在实验中将13.65%的样本数据判断为噪声,这里未作为参考。

实验表明gcd-msvc取得了更好的聚类效果,利用k-means和fcm算法得到的分选效果不理想,且有的辐射源所产生的脉冲几乎全部错选,会造成极大的漏警。究其原因,主要是随机初始化的聚类中心造成的。相对而言,gcd-msvc能产生任意形状的簇类边界,有效区分交叠的样本数据,取得了一定的分选效果,验证了该方法在复杂体制雷达信号分选问题上的有效性。同时也应看出,对于rd5,依然存在多数脉冲误选的情况(图5(e))。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1