基于线性流形聚类的雷达信号分选方法

文档序号:10570411阅读:524来源:国知局
基于线性流形聚类的雷达信号分选方法
【专利摘要】本发明公开了一种基于线性流形聚类的雷达信号分选方法,主要解决现有方法在存在干扰点、离群点分选精度低,算法不稳定的问题。其实现步骤是:首先将时域中的样本点通过重排频谱转换到时频域,计算时频域中每个样本点的局部密度和特征属性,并由局部密度和特征属性判断出为交叠点的样本点;然后计算每一个样本点与交叠点的向量,并用每个样本点平行度最高的两个向量的平均值作为该样本点的样本向量;最后求得两两样本点的样本向量的角度值,构造角度相似性矩阵,对该相似性矩阵进行谱聚类得到分选结果。本发明分选聚类精度高,有效克服了干扰点和离群点对聚类效果产生的影响,可应用于雷达目标信号识别。
【专利说明】
基于线性流形聚类的雷达信号分选方法
技术领域
[0001 ]本发明属于雷达信号处理技术领域,更进一步涉及一种雷达信号分选方法,可应 用于雷达目标信号识别。
【背景技术】
[0002] 随着雷达技术在民用方面的应用越来越广泛,尤其是气象领域,对雷达信号处理 与识别技术的研究也越来越有意义。雷达探测系统接收的信号往往是混叠信号,不能直接 对单分量信号做研究分析,所以信号分选技术成为了雷达探测技术中至关重要的环节。雷 达信号分选技术主要分为两大类:参数估计法和时频分析法。时频分析的核心思想是将多 分量的雷达信号从时域转换到时频域进行分析,根据组成分量信号的频率特性对多分量信 号进行区分。聚类方法是时频分析中一个重要的分选手段。聚类问题一直是机器学习、模式 识别和计算机视觉领域中的一个热门研究问题,属于无监督学习方法。当只利用一组具有 线性结构的流形,即线性或者仿射子空间来表示聚类子集时,相应的问题就转换成线性流 形聚类问题。线性流形聚类是聚类分析中的一个分支研究方向,传统的聚类算法,如K均值 聚类和高斯混合模型,假设样本的分布是一个球形,一般利用样本点之间的欧式距离作为 相似性度量,忽略了样本点之间的潜在几何结构。线性流形聚类则需要利用流形数据的潜 在几何结构,计算样本点之间的相似性。实际上一些真实数据符合线性流形分布,如人脸图 像和运动分割序列等,因此,线性流形聚类是一个热门研究方向。
[0003] Necmiye Ozay等人在文章 "GPCA with Denoising:A Monents-Based Convex Approach"(inComputer Vision and Pattern Recognition(CVPR),2010IEEE Conference on. IEEE,2010:3209-3216)应用了一种分割子空间的方法,它使用代数几何方法将数据集 分割成相应的子空间。K个线性子空间的联合分布可以通过一组次数为K的多项式来拟合, 同时这些多项式在某点处的导数为该点子空间的一个法向量。展开多项式求解奇异值,然 后因式分解得到各个子空间的基,最后通过聚类将每个样本点划分到离其最近的线性子空 间上。该方法的不足之处是:在存在噪声和离群点的情况下,因为多项式的系数是通过最小 二乘法拟合来求解的,广义主成分分析法GPCA解不一定是最优解,且对噪声和离群点敏感, 聚类效果不理想。
[0004] L. Zappella 等人在文章 "Enhanced Local Subspace Affinity for feature-based motion segmentation"(in Pattern Recognition,2011,44(2) :454-470)米用了基 于局部子空间相似(Local Subspace Affinity,LSA)的谱聚类算法,该算法通过选择离样 本点最近的K个点拟合构成局部仿射子空间,并计算局部仿射子空间之间的主角度作为样 本点之间的相似度,然后通过谱聚类得到聚类结果。该方法的不足之处是:样本点的K个邻 近点可能来自不同的潜在流形,尤其是那些靠近线性流形交叠点处的样本点,由于样本点 之间离的很近,样本点之间的主角度计算会出现一定的偏差,导致聚类效果不理想。
[0005] Zhang T等人在"Randomized Hybrid Linear Modeling by Local Best-fit Flats"(in Computer Vision and Pattern Recognition(CVPR),2010IEEE Conference on IEEE,2010:1927-1934)介绍了K-flats算法,该算法是一种基于迭代优化的线性流形聚 类算法,即数据分布所环绕的聚类中心由0维流形的原型点变为任意维数的超平面或仿射 子空间。其基本思想为:利用经典K均值聚类方法先给定一个初始的聚类结果,由聚类结果 对每一类数据拟合一个子空间,得到其基向量和偏移向量,然后把每一个样本点划分到离 其最近的子空间中,通过迭代上述过程直到收敛,就得到了聚类结果的一个增强估计。该方 法的不足之处是:因为其优化目标函数向量是2范数形式,因此容易对离群点敏感。

【发明内容】

[0006] 本发明的目的在于针对上述现有技术的不足,提出一种基于无监督的线性流形聚 类的雷达信号分选方法,以避免噪声点和离群点,提高分选精度和稳定性。
[0007] 本发明技术思路是:通过重排频谱的方法将时域的雷达样本点转换到时频域,在 时频域中计算每个样本点的局部密度和特征属性,并由样本点的局部密度和特征属性判断 该样本点是否为交叠点;计算样本点与每个交叠点的向量,取平行度最高的两个向量的平 均值作为该样本点的样本向量;求得两两样本点间的样本向量的角度值,构造角度相似性 矩阵,对该相似性矩阵进行谱聚类得到分选结果。本发明提高聚类精度和保证稳定性,其实 现步骤包括如下:
[0008] (1)输入样本集义={&£1^4=1,2,...川,私为样本集中第1个样本,(1为样本空间1的 维数,N为样本容量,样本属性包括雷达信号的初始频率、调频率等,构造信号时域图;
[0009] (2)对时域图中的样本集X进行频谱重排,即将时域中的一维信号映射到二维的时 频域表示,得到其频谱图,频谱图用来提供信号的频谱内容随时间的变化信息;
[0010] (3)按每一个时间点提取频谱图中能量峰值最高的点构成此次实验的样本点集;
[0011] (4)在频谱图中寻找雷达信号样本点所构成的线性分量之间的交叠点:
[0012] (4a)计算每个信号样本点的局部密度大小与该信号样本点与其他样本点 的欧氏距离大小有关;
[0013] (4b)计算每个样本点与比它自身密度高的样本点的距离,取其最小值作为该样本 点的特征属性Si;
[0014] (4c)根据所有样本点的局部密度Pi和特征属性Si,画出二维决策图,横轴为P,纵轴 为I根据已知的交叠点个数s,取图右上角的s个样本点作为多分量雷达信号的交叠点;
[0015] (5)计算每个样本点与交叠点的向量,取平行度最高的两个向量的平均值作为该 样本点的样本向量;
[0016] (6)利用相似度公式构造样本向量间的角度相似度矩阵W;
[0017] (7)应用谱聚类对相似度矩阵进行聚类得到聚类结果,聚类的个数即为雷达信号 分量分选的个数,样本点所在的聚类簇即为该样本点所属的雷达信号分量。
[0018]本发明与现有技术相比具有以下优点:
[0019]第一,本发明将机器学习中的线性流形聚类首次应用到雷达信号分选中,为雷达 信号分选方法开拓了一种新思路。本发明通过计算样本点的局部密度P和特征属性S来寻找 雷达信号分量的交叠点,进而计算样本点的样本向量和样本向量间的角度进行谱聚类。本 发明充分利用了线性流形相交处的样本点的几何特征,在交叠点较多的情况下,依然有着 很好的聚类效果。
[0020] 第二,本发明利用交叠点进行聚类,干扰点和离群点并不会影响交叠点的寻找,交 叠点是确定的,干扰点和离群点也会被聚类到离其最近的线性子空间中。
[0021] 第三,本发明在计算样本点的样本向量时,考虑到样本点在重排频谱时所产生的 频率误差,引入了平均值这一概念:在求得样本点与所有交叠点的向量后,取平行度最高的 两个向量的平均值作为该样本点的样本向量,保证该点的样本向量足够精确和聚类结果的 精确度。
【附图说明】
[0022]图1为本发明的流程图。
[0023]图2为本发明实验一的重排频谱时频分布图。
[0024]图3为本发明实验一的主样本点集。
[0025]图4为本发明实验一的聚类结果。
[0026]图5为实验二无干扰点的样本点集。
[0027]图6为本发明算法、GPCA、K-f 1 a t s、LSA在无干扰点下聚类结果。
[0028]图7为实验二有干扰点的样本点集。
[0029]图8为实验二本发明算法、6?0六、1?1&以、1^4在有干扰点下聚类结果。
【具体实施方式】
[0030]参照图1,本发明实施步骤如下:
[0031] 步骤1,输入样本集X={Xi eEf/,i=l,2,,.,,N},xi为样本集中第i个样本,d为样本空间 K的维数,N为样本容量,样本属性包括雷达信号的初始频率、调频率等,根据样本集构造信 号时域图;
[0032] 步骤2,对样本集进行重排频谱,得到其频谱图,横轴为时间,纵轴为其随着时间变 化的信号频率,频率越大,能量越高;
[0033] 步骤3,在每一个时间点上,对频谱图中的样本点提取能量峰值最高的m个点作为 主样本点,m指雷达信号分量的个数;
[0034] 步骤4,在频谱图中寻找雷达信号样本点所构成的线性分量之间的交叠点:
[0035] (4a)计算每个信号样本点的局部密度Pl,局部密度计算公式如下:
[0037]其中,屯表示样本点xA样本点&之间的欧式距离,dc表示截断距离,其计算方式 与所有样本点间的欧氏距离有关,该局部密度计算方法采用了软判定的方法。
[0038] (4b)计算每个样本点与所有比它自身局部密度高的样本点的欧氏距离,取其中最 小的距离作为该样本点的特征属性,该特征属性计算公式如下:
[0039] 4= min (^)
[0040] 心即为样本点^与所有比^局部密度高的样本点之间的最小距离。对于密度最高 的点,民丨丨x(di.i)。
[0041 ] (4c)在所有的样本点中,只有交叠点的Pi和Si都比较大,而交叠点附近的样本点局 部密度Pi较大,但其特征属性81则等于其与最近交叠点的距离。
[0042] 两点之间距离很近A较小;两点之间的距离很远,心较大。由此便可通过求各个样 本点的pi和Si,画出二维决策图,横轴为P,纵轴为5。图中Pi和Si都比较大的作为交叠点,从 而求得雷达信号分量的交叠点。
[0043]步骤5,计算样本点的样本向量。
[0044] (5a)计算样本点与每个交叠点的向量:
[0045] Xipk= (Xi_pk)/| | Xi_pk | |,
[0046] 其中Xipk是样本点Xi和交叠点pk所构成的向量,e!Rf/,:.d为样本空间维数;
[0047] (5b)取平行度最高的两个向量的平均值作为样本点Xl的样本向量:
[0049]其中I表示第i个样本的样本向量,P1、ph表示交叠点集中两个不同交叠点, Xlp。和 xlP,分别表示样本点Xl平行程度最高的两个向量,用*强调这两个向量的平行程度最高,如 果分子XiP^+XiP,的值是零向量,贝lj将分子替换成XiP^-Xipi'属于一个线性子空间的样本 点的样本向量之间是互相平行的。
[0050] 步骤6,构造样本点间的角度相似度矩阵W。
[0051] (6a)计算两个样本向量的相应向量夹角:
[0053]其中coMci)^)表示第i个样本向量I和第j个样本向量%之间角度余弦值;
[0054] (6b)计算两个样本点之间的相似度:
[0055] Wij = abs(cos( ij))
[0056] 其中WljGW是相似度矩阵W的第i行第j列的元素,代表第i个样本向量I和第j个样 本向量Vj之间余弦值的绝对值,对于处于同一个线性子空间的两个样本点,其样本向量是 接近平行的,即样本点的角度相似度abMcoMci)^))~1,而不处于同一个线性子空间的两 个样本点,其样本向量之间的角度较大,当样本向量之间的角度垂直时,abs(cos( 0〇
[0057] (6c)用所有样本向量间的相似度构成相似度矩阵W,该W是一个对称矩阵。
[0058] 步骤7,对相似性矩阵W进行谱聚类,得到雷达信号分量分选的个数和样本点所在 的聚类簇。
[0059] 计算相似度矩阵W的前k个特征值与特征向量,得到特征向量空间;利用K均值聚类 算法对特征向量空间中的特征向量进行聚类。聚类的个数即为雷达信号分量分选的个数, 样本点所在的聚类簇即为该样本点所属的雷达信号分量。
[0060] 本发明的效果可以通过以下仿真实验得到验证:
[0061] U方真条件
[0062] 为了验证本发明的正确性、高效性,在Wind〇ws7系统中的Matlab2013开发环境下, 用1&^1313语言编程实现。在0?1]为1拉61(1〇乂6〇11(1〇0?1]£3-1225¥2@3.206抱、内存46的台式 机上用两组实验数据进行了仿真实验。
[0063]本发明所使用的实验数据为雷达信号分选中常用的线性调频信号。
[0064] 2 ?仿真内容
[0065]实验一,用本发明方法对线性混叠信号进行分选。
[0066]用表1所示的三路信号表示线性调频混叠信号:
[0067] s(t) = exp[j231(0.05t+0.4t2) ]+exp[j231(0.45t_0.4t2) ]+exp[j2Ji(0.32t)],
[0068]表1多分量信号参数
[0070] 对实验中的混叠信号进行频谱重排,结果如图2所示,从图2中可以看出,各个单分 量信号的时间_频率分布样本点都是符合线性流形分布的,且各个单分量信号之间存在交 叠处,所以该混叠信号很适合使用本发明算法来进行聚类,得到各个单分量信号的时间-频 率分布点集。
[0071] 由于对信号的采样频率过大,时频分布的样本点过多,会导致聚类算法计算过慢, 因此,对于图2中每一个时间点,只提取信号能量峰值最高的m个点作为样本点,m为信号的 分量个数,再对提取的主样本点进行聚类,最后进行信号分选,得到主样本点如图3所示,其 中,在不影响实验结果的前提下,为了实验方便,对主样本点的能量值取相同大小的值。
[0072] 计算图3中的样本点对应的样本向量,由样本向量构造相似性矩阵,对相似性矩阵 进行谱聚类,得到最后的雷达信号分选实验结果如表2和图4所示。
[0073]表2多分量雷达信号参数估计
[0075] 由表2中各个雷达信号分量的载频和调频率的真实值和估计值的比较可以看出, 各个分量信号的参数估计误差小,在合理误差范围内。
[0076] 由图4可知,由于多分量信号的时频分布在交叠点处的处理一直都没有得到很好 的解决,使得其交叠点处的样本点聚类发生一些偏差,但不影响整个样本集的聚类,混叠信 号分选的结果比较理想。
[0077] 实验二,本发明与其他算法进行对比。
[0078] matlab仿真生成4类符合线性流形分布的数据,每类数据有150个样本点,4路仿真 信号共有600个样本点,且4组数据之间互相有交叠,共有6个交叠点。该600个样本点及其之 间的几何结构构成了一组数据集。该数据集如图5所示。为了测试干扰点对算法的影响,在 图5的基础上增加干扰点后的数据集,如图7所示。
[0079]本发明是在公平的实验设置和实验环境下,与背景介绍里的 法对上述图5和图7数据集分别进行实验,最后利用聚类结果准确率对算法进行比较,结果 如表3,图6和图8所示。
[0080]表3各类算法准确率比较
[0082]^由表3可以看出,在没有干扰点的情况下,GPCA算法准确率最高,本发明的准确率 也比较理想;在有干扰点的情况下,本发明的准确率远远高出了其他算法的准确率,体现了 本发明算法的优越性。
[0083] 图6为不存在干扰点的情况下四种算法分选结果比较图,其中图6a)是本发明的聚 类结果,图6b)是GPCA算法的聚类结果,图6c)是K-flats算法的聚类结果,图6d)是LSA算法 的聚类结果。
[0084] 从图6可见,信号在不存在干扰点的情况下,GPCA算法、K-flats算法和本发明聚类 效果都比较理想,而图6d)中,信号交叠处的点被聚为一类,有两类数据也被误聚为一类,所 以LSA算法的聚类效果较差。这是因为LSA的相似度计算中,两个近邻样本点可能来自于不 同的潜在流形但会被划分到同一子空间中,尤其是那些靠近流形相交处的样本点,因此会 导致在交叠点较多的情况下,对流形交叠处的数据点处理不够得当,进而会影响到其他数 据点的聚类,导致聚类效果较差。而本发明充分利用了流形相交处的数据点的几何特征,根 据样本点局部密度明确区分了交叠点和其他远离交叠点的样本点,根据样本点的特征属性 明确区分了交叠点和交叠点附近的样本点。反而在交叠点较多的情况下有着很好的聚类效 果,聚类准确率也达到了 96.33 %。
[0085] 图8为存在干扰点的情况下四种算法分选结果比较图,其中图8a)是本发明的聚类 结果,图8b)是GPCA算法的聚类结果,图8c)是K-flats算法的聚类结果,图8d)是LSA算法的 聚类结果。
[0086] 从图8可见,信号在存在干扰点的情况下,干扰点会影响一些线性流形信号聚类算 法的聚类性能,因为很多线性流形聚类算法成立的前提就是建立在没有干扰点影响的情况 下。6?04、1^4、1(41 &^以及本发明算法的聚类结果如图8所示,对比可以看出,虽然存在干 扰点和离群点,本发明依然有着良好的聚类效果。首先干扰点不会影响到本发明步骤4中对 混叠信号交叠点集的寻找。因干扰点的特征属性心较大,而局部密度 Pl很小,所以在聚类的 过程中,根据干扰点和交叠点集的几何关系,干扰点会被聚类到离其最近的线性子空间中, 因此不会影响到最终的聚类结果。而其他算法受到干扰点和离群点的影响,导致聚类结果 较差。
[0087] 综上,本发明不仅不受干扰点和离群点的影响,而且算法稳定,在交叠点多的情况 下依然有良好的分类效果。
【主权项】
1. 一种基于线性流形聚类的雷达信号分选方法,包括如下步骤: (1) 输入样本集又=匕'1^户1,2,..#}^为样本集中第1个样本,(1为样本空间》的维 ? 数,N为样本容量,样本属性包括雷达信号的初始频率、调频率等,构造信号时域图; (2) 对时域图中的样本集X进行频谱重排,即将时域中的一维信号映射到二维的时频域 表示,得到其频谱图; (3) 按每一个时间点提取频谱图中能量峰值最高的点构成此次实验的样本点集; (4) 在频谱图中寻找雷达信号样本点所构成的线性分量之间的交叠点: (4a)计算每个信号样本点的局部密度pi; (4b)计算每个样本点与比它自身密度高的样本点的距离,取其最小值作为该样本点的 特征属性Si; (4c)根据所有样本点的局部密度P1和特征属性S1,画出二维决策图,根据已知的交叠点 个数s,取图右上角的s个样本点作为交叠点,得到多分量雷达信号的交叠点; (5) 计算每个样本点与交叠点的向量,取平行度最高的两个向量的平均值作为该样本 点的样本向量; (6) 利用相似度公式构造样本向量间的角度相似度矩阵W; (7) 应用谱聚类对相似度矩阵进行聚类得到聚类结果,聚类的个数即为雷达信号分量 分选的个数,样本点所在的聚类簇即为该样本点所属的雷达信号分量。2. 根据权利要求1所述的基于线性流形聚类的雷达信号分选方法,其特征在于:步骤 (4a)所述的计算每个信号样本点的局部密度Pi,根据如下公式计算:其中,du表示样本点X1与样本点&之间的欧式距离,dc表示截断距离。3. 根据权利要求1所述的基于线性流形聚类的雷达信号分选方法,其特征在于:步骤 (4b)所述的计算每个样本点与比它自身密度高的样本点的距离,取其最小值作为该样本点 的特征属性S 1根据如下公式计算:其中S1为样本点^与所有比^局部密度高的点之间的最小距离,对于密度最高的点,4. 根据权利要求1所述的基于线性流形聚类的雷达信号分选方法,其特征在于:所述步 骤(5)按如下步骤进行: (5a)计算样本点与每个交叠点的向量: XiPk一 (Xi-Pk)/ I I Xi-Pk I I, 其中XiPk是样本点Xi和交叠点Pk所构成的向量,Xi,pk e Rd,d为样本空间维数; (5b)取平行度最高的两个向量的平均值作为样本点X1的样本向量:其中Vi表示第i个样本的样本向量,pi、ph表示交叠点集中两个不同交叠点,XiPt^和XiP^ 表示样本点X1平行程度最高的两个向量,用*强调这两个向量的平行程度最高,如果分子 XiPh*+Xipi*的值是零向量,贝丨J将XiPh*+Xipi*替换成XiPh*-Xipi'5.根据权利要求1所述的基于线性流形聚类的雷达信号分选方法,其特征在于:所述步 骤(6)按如下步骤进行: (6a)计算两个样本向量的相应向量夹角:其中cos( Φυ)表示样本向量Vi和样本向量Vj之间角度余弦值; (6b)两个样本点之间的相似度e W计算公式为: Wij = abs(cos( Φ ij)) 其中Wij e W是相似度矩阵W的一个元素,代表第i个样本向量Vi和第j个样本向量Vj之间 余弦值的绝对值,最后,所有样本向量间的相似度w构成了相似度矩阵W,W是一个对称矩阵。
【文档编号】G06K9/62GK105930859SQ201610224973
【公开日】2016年9月7日
【申请日】2016年4月12日
【发明人】方敏, 王肖, 郭祥, 袁铭, 田玉敏, 郑家瑜
【申请人】西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1