一种针对多类辐射源的电抗特征组合的选择方法

文档序号:6425623阅读:136来源:国知局
专利名称:一种针对多类辐射源的电抗特征组合的选择方法
技术领域
本发明涉及一种多类辐射源的分析领域,特别是一种针对多类辐射源识别的电抗特征组合的选择方法。
背景技术
目前学术界已经提出了多种衡量特征的类别区分能力的方法,如信息增量 (information gain)、信息熵(entropy)、卡方检验和t检验等等。然而,对于多类别识别任务(类别数目大于幻,仅靠这些方法就存在一个严重的缺陷——选取的特征只能区分一部分类别,通常是样本数目占多数的类别,而不能区分其他的类别,特别是样本数目占少数的类别,从而造成有的类别识别准确率高而其他类别识别准确率较低。为了解决该问题,研究人员提出了一些解决方法,然而这些方法仍然有不足之处。例如,“随机特征集合”(randomized feature set)方法选取的特征组合是不能够重构的,即每次运行选择的特征组合是不相同的。而“rand robin”方法依赖于类别重要性分布的有关先验知识。再如,由于局限于“单类v. s.其他类”的二元划分,“round robin”和“rand robin”方法有可能错过一些重要的特征。由于上述原因,以上特征选取与组合方法都不能很好地解决多类别识别准确率不均衡的问题——有的类别识别准确率高,而有的类别识别准确率低。尽管 wrapper方法理论上可以得到避免上述缺陷的最佳特征组合,然而该方法的探索空间庞大, 计算成本非常高,因此不能直接应用到实时性要求较高的多类辐射源识别上。

发明内容
发明目的本发明所要解决的技术问题是针对现有技术的不足,提供一种针对多类辐射源的电抗特征组合的选择方法。为了解决上述技术问题,本发明公开了一种针对多类辐射源的电抗特征组合的选择方法,预先设定门限值11_作为能够区分所有类别对的互不重叠的前电抗特征组合的个数;如果不存在nt。p个满足条件的电抗特征组合,则实际输出的电抗特征组合个数少于 nt。p。该方法包括以下具体步骤步骤一,类别对集合构建和电抗特征综合排序假设获得的一组η类辐射源数据中,每条辐射源数据由相同几个连续型(参见《统计学》,贾俊平,清华大学出版社,应用统计学系列教材,2006。)电抗特征和该辐射源所属的类别组成,且该组辐射源数据来自η个类别。其中,电抗特征可以包括载频、重频、脉宽、脉间、脉冲高度等等。把η类辐射源(η> 2)两两配对成C 2个类别对。对每个电抗特征和每个类别对,采用t检验(参见《21世纪高等学校计算机规划教材CPSSie实用教程》,宋志刚,谢蕾蕾,何旭洪,人民邮电出版社,2008。)来判断该电抗特征能否区分该类别对。假设t检验得到的P值小于或者等于0. 05,判断该电抗特征可以区分该类别对,否则,判断该电抗特征不可以区分该类别对。对每个电抗特征,构建该特征所能区分的类别对集合,并且计算该电抗特征在所有类别对上t检验的P值的总和,记为SumP0将所有电抗特征首先按照所能区分的类别对的对数从大到小排序,其次按照SumP值从小到大排序,该电抗特征排序结果记为ORD。ORD顺序反映了电抗特征区分所有类别的能力强弱电抗特征越靠前其区分能力越强,越靠后其区分能力越弱。由于在实际工程环境下,各电抗特征的SumP值两两不同,ORD顺序是唯一的。步骤二,电抗特征组合初始化用剩余类别对集合表示当前电抗特征组合尚未能够区分的类别对的集合,记为A。待选电抗特征集合表示尚未被选取来构建电抗特征组合的电抗特征集合,记为U。初始化电抗特征组合为Γ = 0,初始化剩余类别对集合为 A = {C 2个类别对},若待选电抗特征集合U尚未初始化则初始化集合U = {所有电抗特征}。步骤三。待选电抗特征排序,将待选电抗特征集合U中的电抗特征首先按照所能区分的剩余类别对集合A中的类别对对数,从大到小进行排序,对于区分剩余类别对对数相同的电抗特征,其次按照ORD顺序排序。首次循环时,待选电抗特征的排序结果等同于对应的ORD顺序。步骤四,电抗特征组合更新选取能区分剩余类别对集合A中最多类别对的电抗特征t,若区分最多类别对的电抗特征不止一个,选其中ORD顺序最前的特征t,将其加入当前电抗特征组合T,即T = T U {t},并将电抗特征t从待选电抗特征集合U中去除,即U = U-{t}。假设选取的电抗特征t所能区分的剩余类别对集合A中的类别对集合为S,选取电抗特征t以后将集合S从剩余类别对集合A中去除,即A = A-S。步骤五,剩余类别对集合判断判断剩余类别对集合A是否为空,如果为空,当前电抗特征组合构建完成,进行步骤六,否则,进行步骤七。步骤六,已有电特征组合数判断如果已有电特征组合数目达到预先设定的门限 nt。p,输出所有构建完成的电抗特征组合,结束流程,否则,返回步骤二。步骤七,待选电抗特征集合判断如果待选电抗特征集合U为空,输出所有构建完成的电抗特征组合,结束流程,否则返回步骤三。本发明步骤一中,判别一个电抗特征能否区分某类别对采用的统计方法是t检验,实际应用中还可以根据实际数据采取其他方法。其他常用的统计方法有u检验,ANOVA 检验(又名方差检验,F检验)等等。本发明步骤一中,还可以根据每个电抗特征在所有类别上进行的ANOVA检验获得的P值,对电抗特征进行综合排序。本发明步骤四中,选取能区分剩余类别对集合A中最多类别对的电抗特征t以后, 将电抗特征t从待选电抗特征集合U中去除,即U = U-{t},在实际应用中,也可以不将电抗特征t从待选电抗特征集合U中去除,按照ORD顺序枚举出有重叠电抗特征的前nt。p个电抗特征组合。本发明中门限值nt。p用于控制选择的电抗特征组合的个数,该门限值还可以替换为其他的约束条件,如电抗特征组合大小要小于等于某一门限q,相应输出结果为所有特征个数小于等于q的区分所有类别对的电抗特征组合。本发明步骤一中,可以用一个(n-l)X(n-l)的上三角矩阵Mi来概括每个电抗特征i能够识别的类别对。上三角矩阵的每行和每列分别代表对应类别对中的一个类别。P 值门限值设定为0. 05,在实际应用时可以结合工程需求适当调整。步骤五中,判断是否完成一次电抗特征组合的构建。当所有η(n-1)/2个类别对都可以被区分了,一个电抗特征组合的构建就完成了。有益效果本发明的显著优点为(1)可以提高区分多类别识别准确率的均衡性一每个电抗特征组合覆盖所有C 2个类别对,从而可以更好地区分所有类别,避免了重复选取区分相同类别的电抗特征,而忽略区分其他类别的电抗特征;( 系统性一即本发明的输出结果在相同参数设置条件下是固定的、可重复实现的;(3)实现方法工程化——本发明不依赖类别分布的先验知识,不需要探索庞大的特征组合可能空间,计算成本较低,有助于减小时空复杂性,便于工程计算,具有良好的工程应用前景。较易工程实现。


下面结合附图和具体实施方式
对本发明做更进一步的具体说明,本发明的上述和 /或其他方面的优点将会变得更加清楚。图1为本发明工作流程图。图2a、图2b、图2c、图2d为本发明仿真实验中四个电抗特征的类别分布图示。
具体实施例方式本发明公开了一种针对多类辐射源的电抗特征组合的选择方法。首先把多类辐射源两两配对成类别对,以能够区分的类别对对数和相应t检验得到的P值的总和为指标来衡量单个电抗特征的类别区分能力,并以此对电抗特征进行排序。在此基础上选择能够区分所有类别对的互不重叠的前nt。p个电抗特征组合,以提高多类别识别准确率的均衡性。如图1所示,本发明包括以下步骤开始、类别对集合构建和电抗特征综合排序、 电抗特征组合初始化、待选电抗特征排序、电抗特征组合更新、剩余类别对集合判断,已有电抗特征组合数判断和待选电抗特征集合判断,最后结束。本发明包括以下具体步骤。步骤1,类别对集合构建和电抗特征综合排序假设获得的一组η类辐射源数据中,每条辐射源数据由相同几个连续型电抗特征和该辐射源所属的类别组成,且该组辐射源数据来自η个类别。其中,电抗特征可以包括载频、重频、脉宽、脉间、脉冲高度等等。把η 类辐射源(η > 2)两两配对成C 2个类别对。对每个电抗特征和每个类别对,采用t检验来判断该电抗特征能否区分该类别对。假设t检验得到的ρ值小于或者等于0. 05,判断该电抗特征可以区分给类别对,否则,判断该电抗特征不可以区分该类别对。对每个电抗特征, 构建该特征所能区分的类别对集合,并且计算该电抗特征在所有类别对上t检验的ρ值的总和,记为SumP。将所有电抗特征首先按照所能区分的类别对的对数从大到小排序,其次按照SumP值从小到大排序,该电抗特征排序结果记为ORD。ORD顺序反映了电抗特征区分所有类别的能力强弱电抗特征越靠前其区分能力越强,越靠后其区分能力越弱。由于在实际工程环境下,每个电抗特征的SumP值两两不同,ORD顺序是唯一的。步骤2,电抗特征组合初始化用剩余类别对集合表示当前电抗特征组合尚未能够区分的类别对的集合,记为A。待选电抗特征集合表示尚未被选取来构建电抗特征组合的电抗特征集合,记为U。初始化电抗特征组合为Γ = 0,初始化剩余类别对集合为 A = {C 2个类别对},若待选电抗特征集合U尚未初始化则初始化集合U = {所有电抗特征}。步骤3,待选电抗特征排序,将待选电抗特征集合U中的电抗特征首先按照所能区分的剩余类别对集合A中的类别对对数,从大到小进行排序,对于区分剩余类别对对数相同的电抗特征,其次按照ORD顺序排序。首次循环时,待选电抗特征的排序结果等同于对应的ORD顺序。步骤4,电抗特征组合更新选取能区分剩余类别对集合A中最多类别对的电抗特征t,若区分最多类别对的电抗特征不止一个,选其中ORD顺序最前的特征t,将其加入当前电抗特征组合T,即T = T U {t},并将电抗特征t从待选电抗特征集合U中去除,即U = U-{t}。假设选取的电抗特征t所能区分的剩余类别对集合A中的类别对集合为S,选取电抗特征t以后将集合S从剩余类别对集合A中去除,即A = A-S。步骤5,剩余类别对集合判断判断剩余类别对集合A是否为空,如果为空,当前电抗特征组合构建完成,继续步骤6,否则,继续步骤7。 步骤6,已有电特征组合数判断如果已有电特征组合数目达到预先设定的门限 nt。p,输出所有构建完成的电抗特征组合,结束流程,否则,返回步骤2。步骤7,待选电抗特征集合判断如果待选电抗特征集合U为空,输出所有构建完成的电抗特征组合,结束流程,否则返回步骤3。步骤1中可以用一个(n-1) X (n_l)的上三角矩阵Mi来概括每个电抗特征i能够识别的类别对。上三角矩阵的每行和每列分别代表对应类别对中的一个类别。P值门限 0. 05是根据统计经验设定,在实际应用时可以结合工程需求适当调整。步骤2中的集合T表示当前选取的电抗特征组合,集合A表示尚未被识别的类别对集合。步骤4选取的第一个电抗特征是识别最多类别对中ORD顺序最前的电抗特征,自第二个电抗特征开始,选取的电抗特征是能够识别集合A中最多剩余类别对中ORD顺序最前的。电抗特征组合T中每加入一个新的电抗特征都要更新剩余电抗特征集合U和剩余类别对集合A,以保证电抗特征组合里已有的电抗特征将不会在以后构建的电抗特征组合中出现。步骤5判断是否完成一次电抗特征组合的构建。当所有η (n-1)/2个类别对都可以被区分了,一个电抗特征组合的构建就完成了。下面通过两个实例来说明本发明的针对多类辐射源的电抗特征组合的选择方法。实施例1 本实施例是关于t检验的实例,假设检测到2类辐射源的载频信号,单位为兆赫兹(MHz),类1包括5个辐射源的载频信号,其数值分别为1001、1000、999、950和 1050,类2包括6个辐射源的载频信号,其数值分别为1500、1观0、1525、1四0、1010、2000,在载频特征上针对类别对“类1”- “类2”作t检验,判断载频特征能否区分该类别对建议。t检验可用多种方法和工具实现,如Microsoft Excel的TTEST函数。t检验得到的双尾P值为0. 024073。由于该ρ值小于0. 05,因此得出结论载频特征可以区分类别对 “类 I” - “类 2”。实施例2 假设采集的辐射源数据来自五类不同的机载雷达类1、类2、类3、类4 和类5。每个辐射源采集到四个不同的电抗特征数据载频、重频、脉宽和脉间,分别用“a”、 “b”、“c”和“d”表示,这四个电抗特征在五类辐射源上的分布分别如图h、b、c和d所示的标准化后的数值,其中每一个类别都用一个特定的标识表示。假设nt。p参数的值为2,即需要构建2个电抗特征组合,且已经根据步骤1,得到每个电抗特征的类比对集合以及对应t检验的P值,P值标识在括号里,如表1、2、3和4所示。电抗特征——载频(“a”),可以区分所有十个类别对,其对应构建的类别对集合如表1所示。表1 载频(“a” )的类别对集合矩阵Ma
权利要求
1.一种针对多类辐射源的电抗特征组合的选择方法,在一组η类的辐射源数据中,每条辐射源数据由相同的一组电抗特征以及该辐射源所属的类别组成,辐射源数据来自η个类别,η为大于2的自然数;其特征在于,对辐射源数据进行一下步骤处理步骤一,类别对集合构建和电抗特征综合排序将η类辐射源两两配对成C 2个类别对; 对每个电抗特征和每个类别对,采用t检验判断每个电抗特征能否区分该类别对;对每个电抗特征,构建该特征所能区分的所有类别对集合,并且计算该电抗特征在所有类别对上t 检验的P值的总和,记为SumP值;将所有电抗特征首先按照所能区分的类别对的数量从多到少排序;其次按照SumP值从小到大排序,该电抗特征排序结果记为ORD ;设定门限值nt。p 作为能够区分所有类别对的互不重叠的前电抗特征组合的个数;步骤二,电抗特征组合初始化用剩余类别对集合表示当前电抗特征组合尚未能够区分的类别对的集合,记为A ;待选电抗特征集合表示尚未被选取来构建电抗特征组合的电抗特征集合,记为U;初始化电抗特征组合为Γ = 0,初始化剩余类别对集合为 J = {C 2个类别对},若待选电抗特征集合U尚未初始化则初始化集合U= {所有电抗特征}; 步骤三,待选电抗特征排序,将待选电抗特征集合U中的电抗特征按照所能区分的剩余类别对集合A中的类别对对数,从大到小进行排序,对于区分剩余类别对对数相同的电抗特征,按照ORD顺序排序;步骤四,电抗特征组合更新选取能区分剩余类别对集合A中最多类别对的电抗特征 t,若区分最多类别对的电抗特征为两个以上,选其中ORD顺序最前的电抗特征,将其加入当前电抗特征组合T,即T = T U {t},并将电抗特征t从待选电抗特征集合U中去除,即U =U-{t};如果选取的电抗特征t所能区分的剩余类别对集合A中的类别对集合为S,则选取电抗特征t以后将集合S从剩余类别对集合A中去除,即A = A-S ;步骤五,剩余类别对集合判断判断剩余类别对集合A是否为空,如果为空,则当前电抗特征组合构建完成,进行步骤六,否则,继续进行步骤七;步骤六,已有电特征组合数判断如果已有电特征组合数目达到门限值nt。p,输出所有构建完成的电抗特征组合,结束流程,否则,返回步骤二。步骤七,待选电抗特征集合判断如果待选电抗特征集合U为空,输出所有构建完成的电抗特征组合,结束流程,否则返回步骤三。
2.根据权利要求1所述的一种针对多类辐射源的电抗特征组合的选择方法,其特征在于,步骤一中,t检验得到的ρ值小于或者等于0. 05,则判断该电抗特征能区分该类别对,否则,判断该电抗特征不可以区分该类别对。
3.根据权利要求1所述的一种针对多类辐射源的电抗特征组合的选择方法,其特征在于,步骤一中,电抗特征为连续型,包括载频、重频、脉宽、脉间、脉冲高度。
4.根据权利要求1所述的一种针对多类辐射源的电抗特征组合的选择方法,其特征在于,步骤一中,用一个(n-1) X (n-1)的上三角矩阵Mi来概括每个电抗特征i能够识别的类别对。
5.根据权利要求4所述的一种针对多类辐射源的电抗特征组合的选择方法,其特征在于,步骤五中,当所有η (n-1)/2个类别对都被区分,则一个电抗特征组合的构建完成。
全文摘要
本发明公开了针对多类辐射源的电抗特征组合的选择方法,把多类辐射源两两配对成类别对,以能够区分的类别对对数和相应t检验得到的p值的总和为指标来衡量单个电抗特征的类别区分能力,并以此对电抗特征进行排序;在此基础上选择能够区分所有类别对的互不重叠的前ntop个电抗特征组合。本发明优点在于(1)避免了多类别识别任务中选择的特征类别区分能力不均衡的问题——选择的特征只能区分某一部分类别,(2)不依赖任何先验知识,相应计算成本低,实现方法工程化。基于本发明可以选择区分多类辐射源的电抗特征组合,更好地完成多类辐射源识别任务。
文档编号G06F19/00GK102306232SQ20111015056
公开日2012年1月4日 申请日期2011年6月7日 优先权日2011年6月7日
发明者张桂林, 徐欣, 王菁, 贺成龙 申请人:中国电子科技集团公司第二十八研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1