雷达对抗效能优化检测方法与流程

文档序号:12612355阅读:298来源:国知局
雷达对抗效能优化检测方法与流程

本发明涉及的是一种无线通信领域的技术,具体是一种雷达对抗效能优化检测方法。



背景技术:

效能评估是对系统在特定的条件下完成某项任务程度的度量,系统效能评估的过程实际上是一种决策制定的过程,在此过程中,输入的数据是试验中采集的系统各指标性能参数,输出的是综合效能结果。在评估的过程中,首先要建立评估指标体系,然后通过不同的试验条件获取各指标参数。然而在试验过程中经常会出现部分指标参数缺失的情况。例如,传感器故障、超量程测量、隐私保护、以及文件丢失等突发事件都有可能导致原始数据库的不完整,我们称之为不完备信息系统。本发明基于此应用背景,提出一种基于多属性加权广义信息熵的不完备信息填充方法。

现有的很多方法并不能很好的应用到评估系统缺失数据的处理中。例如,最近邻填充算法,其基本原理是:两个具有最近距离的数据的关系最紧密,如果一个数据有缺失,都可以计算它与所有完全数据的距离,然后找到它的k个最近邻数据,缺失数据的值就用这k个数据对应属性上的平均值来代替,最近邻算法需要计算数据间的距离,在距离度量上,最流行的是欧氏距离计算方法。另外,在计算两个数据距离时,采用不同的方法替换最近邻方法中的欧氏距离产生了其他多种方法。这类算法都是基于概率分布等假设,利用整个数据集对缺失数据进行填充,未充分考虑数据对象的类别特征,使得填充值容易受到不同类别对象的干扰,严重降低填充结果的准确性。

从评估系统的角度讲,由于各指标数据之间具有相关性,在对效能评估系统缺失的信息填充时,应考虑评估指标间的相关性,区分哪些数据对缺失数据的填充支持度更高。一种基于大样本聚类的不完备信息填充方法已经被提出,但是这种方法在处理小样本数据时存在聚类精度不高的问题,无法解决小样本数据。效能评估中,由于受试验成本的限制,往往不可能有大量的数据样本,因此需要从效能评估系统本身出发,通过指标相关性的研究,确定对缺失数据支持度高的样本子集,有利于提高填充的精度。

在试验过程中,被评估系统测试过程中采集到的数据可能存在抽样误差,决策表中的单值数据并不能准确的反应各次试验的真实状态,准确的说是一种真实情况的估计,为更好的反应真实的情况,很多时候采用区间值代替单值,因此在研究效能评估中缺失数据填充方法时,要考虑区间值信息系统,提高算法的实用性。

效能评估系统是决策系统的一种,而信息熵能够很好的描述决策系统的特征,很好的描述系统状态的不确定性。信息熵具有对称性、确定性、非负性、可加性及极值性等性质。因此,本发明将信息熵理论扩展到区间值系统中,通过研究单个数据区间长度的变化对系统信息熵的影响,确定数据大小与系统信息熵之间的关系,从而确定缺失数据的大小,很好的解决了评估系统中数据缺失的问题。



技术实现要素:

本发明针对现有技术存在的上述不足,提出一种雷达对抗效能优化检测方法,通过利用加权广义信息熵具有一般信息熵的性质,在解决实际问题中可以确保方法的可靠性。本发明对指标相关性的计算方法并不依赖大样本集,因此提高了算法的适用范围。

本发明是通过以下技术方案实现的:

本发明针对试验数据存在抽样误差等问题,将不能通过单值准确描述的数据转化为区间值。将区间相似度引入到信息熵中,建立一种广义的信息熵。根据缺失数据的所述评估指标,确定与其相关性较强的指标,相关性的大小表示对填充缺失数据填充支持度的大小,因此将相关性大小归一化处理,进一步构成加权信息熵,通过研究缺失数据前后评估系统指标子集信息熵的变化,确定缺失数据的填充结果。

本发明通过确定包含缺失数据指标的子集K,计算加权广义信息熵的权重系数λl(k),然后计算初始的子系统K的加权广义信息熵即原始信息熵;再确定搜索的起点,设置搜索步长,以添加微小的区间数据替换缺失数据,确定缺失数据的区间下限记为A点,计算HλN(K)|A;按照步长增加区间长度,分别得到全局最小值位置B时的加权广义信息熵为HλN(K)|B以及新的信息熵第一次与原始信息熵相等时的位置记为D,其对应的加权广义信息熵为当则填充区间为|A~D|;当填充区间为|A~B|,从而获得缺失数据。

本发明具体包括如下步骤:

步骤0:采集雷达对抗效能评估试验中的评估指标数据。

步骤A1:区间值信息系统构建:

在区间值信息系统S=(U,A),对象集为U,属性集A=C∪D,C为条件属性集,D为决策属性。若x∈U,a∈A,f为对象到属性值的映射,则数据区间定义为:f(x,a)=[f(x,a)L,f(x,a)U];

可以认为,在相同试验条件下,每个评估指标中具有相同性能等级的试验数据是符合一定统计规律的。换句话说,每个条件属性中,具有相同决策值的数据是可以用统计学方法来描述的。一般来说,用正态分布的样本平均值和样本标准差,即μ±2σ覆盖95%以上的实值数据是可以接受的。这样一个实值信息系统就可以被转化为区间值信息系统了。

步骤A2:单区间值信息系统的分类:

上述步骤A1给出的区间值信息系统中的数据是无法用任何传统的二元关系进行分类的。下面我们给区间相似度的定义:

设x,y是区间系统中的两个对象,则区间相似度为:其中:L|表示区间的绝对长度。

可以证明,这种区间相似度的定义满足对称性、自反性和局部单调性,有利于区间相似关系的定义。

设S=(U,A)为区间值信息系统,x,y∈U,a∈A,区间相似关系为:其中:α为相似度阈值。

步骤A2:多区间值系统分类方法:

设S=(U,A)为区间值信息系统,U是对象集,A=C∪D是属性集,B是条件属性C的一个子集,且B={b1,b2,…bn}共包含N个条件属性,且1≤n≤|C|。当x,y∈U,f是U到A的映射,对象x,y间关于子集B的类区间相似度定义为:

同样我们可以得到类区间相似关系:其中:α为相似度阈值。

步骤B1,单区间值信息系统信息熵的建立:

设S=(U,A)是一个信息系统,对象集为U,属性集为A,是属性集的一个子集,在其限定下存在分类U/R={X1,X2,…,Xm},1≤m≤|U|。根据Shannon熵的定义,此时信息系统的H信息熵为:

将步骤A2中给出的区间相似度添加到传统的信息熵定义中,构建一种全新的广义信息熵,用于描述区间值信息系统中属性子集的分类能力和系统自身的不确定性。

在区间值信息系统S=(U,A)中,对象集为U,属性集为A。在属性子集限定下,根据区间相似关系获得分类K(B)=(SB(u1),SB(u2),...,SB(u|U|))。表示两个对象ui和uj间最小的区间相似度:

定义一种广义信息熵——H'信息熵为:其中:

与传统的信息系统信息熵一样,本发明中定义的广义信息熵H'具有非负性、单调性和极值性。

步骤B2,类区间信息系统信息熵的建立:

在区间值信息系统S=(U,A)中,U是对象集,A=C∪D是属性集,B是条件属性集C的一个子集,其中:BN={b1,b2,…bn},1≤n≤|C|.,B中共有N个条件属性。在的限制下,存在分类K'(BN)=(S1,S2,...,Sn)1≤K≤|U|,根据类区间相似度的定义,定义类区间广义信息熵HN(B)为:其中:对象ui,uj中的最小类区间相似度,即:

步骤C,计算指标相关性,具体步骤为:

假设决策表中的m组数据,每组数据包含n个条件属性,则条件属性ci和cj的依赖度γij的定义为:其中:k=1,2,…,m,i=1,2,…,n,[c]R表示在等价关系下,包含元素c的等价类。

在给出条件属性依赖性的基础上,定义条件属性ci和属性cj间的直接相关性γ(ci,cj):

步骤D,加权广义信息熵的建立:

上面已经讨论了基于类区间相似度的广义信息熵,同时也讨论了指标间相关性大小的计算方法。很显然,与含有缺失数据指标相关性较大的指标对缺失数据的填充支持度较高,因此,本发明进一步将指标(属性)相关性与类属性区间相识度的概念结合起来,构成一种基于类属性的加权广义信息熵,简称加权广义信息熵,具体如下:

在评估系统中,当第k个指标含有缺失数据时,λl(k)表示第l个指标与第k个指标之间的相关性,且共有n个指标与第k个指标存在相关性,将这n个指标与第k个指标构成的属性子集成为K,则,定义子系统K的加权广义信息熵为:其中:

特别规定:指标自身的相关性为1,即λk(k)=1,假设该指标不存在相关性的指标,即是独立指标可以通过计算单个属性的广义信息熵进行填充。

步骤E,不完备信息的填充:

通过区间值信息系统的一种加权广义信息熵——信息熵的定义,我们发现每个区间的长度都与系统的不确定性紧密相连;

再次假设第k个指标含有缺失数据,且共有n个指标与第k个指标存在相关性,将这n个指标与第k个指标构成的属性子集成为K,且子系统的信息熵记为

为了研究区间长度的变化对信息熵大小的影响,在计算类区间相似度时,我们将子集K中的第k个指标缺失的数据看做区间长度为零的数据,进而计算此时的信息熵,显然该信息熵是数据缺失情况下的信息熵,称之为原始信息熵;

用一个微小区间的数据替换区间长度为零的缺失数据,此时信息熵将会显著增大;

随着新加入数据的区间长度的增加,在一定范围内信息熵逐渐减小;

随着新加入数据的区间长度的增加,至少存在一个信息熵的最小值;

当新加入数据的区间上/下限达到该属性值域的最大/最小值以后,如果该数据的区间长度继续增长,那么信息熵将随之单调递增。;

当新加入数据的区间上/下限达到该属性值域的最大/最小值以后,即便该数据的区间长度继续增长,那么信息熵都将保持不变。

以上是关于加权广义信息熵的一些性质。由于各种信息熵代表的含义相同,只是不同的信息熵应用的对象不同,计算方法不同,因此关于加权广义信息熵的性质可以一般信息系统信息熵推导出来。我们可以根据以上结论提出一种基于加权广义信息熵的不完备信息填充方法。信息基于加权广义信息熵的不完备信息填充过程是将缺失数据看做区间长度为零的数据,然后用一个具有微小区间的数据替换缺失数据。逐渐增大区间长度,信息熵会逐步减小,最终保持不变或再次变大。在这个过程中,我们希望信息熵在新加入对象的区间上/下限达到该条件属性值域内的最大/最小值前,尽量接近于该子系统原始的信息熵,也就是尽量用最短的填充区间保持该属性对系统的分类能力不改变。这种信息填充技术同时适用于区间值信息系统和单值信息系统。以填充第k个指标中的缺失数据为例,具体的填充步骤如下:

步骤E1:计算其余指标与第k个指标的相关性,确定子系统K;

步骤E2:计算权重系数λl(k);

步骤E3:计算初始的子系统K的信息熵

步骤E4:根据理论知识,实际经验,或者实际观察等辅助信息确定缺失数据的区间下限,将区间下限记为A,此时子系统K的信息熵记为

用微小区间数据替换缺失数据,并以设定的步长逐渐增加区间长度,记录每一步的信息熵的变化:将第一次达到全局最小值时的位置记为B,此时子系统K的信息熵记为将区间上限达到该缺失数据所在属性的上限时的位置记为C,此时子系统K的信息熵记为将新的信息熵第一次与原始信息熵相等时的位置记为D,此时子系统K的信息熵记为

当那么填充区间为|A~D|;当填充区间为|A~B|。这样,我们可以得到|A~D|≤|A~C|以及|A~B|≤|A~C|。显然,填充区间较之以往的方法减小了。

技术效果

与现有技术相比,本发明能够处理雷达对抗效能评估中的模糊数据,通过将模糊数据转化为区间值进行处理;通过对相关性较强的数据进行聚类,进而剔除无用的干扰信息,提高方法的精度;可以处理小样本数据缺失的问题。并且本发明针对效能评估中指标相关性、小样本及区间数据的特点,更好的解决数据缺失的问题,在数据缺失率为10%以内,本发明提出的算法填充效果可较好的满足效能评估需求。

附图说明

图1为本发明中填充方法流程图。

图2为本发明填充过程信息熵变化曲线图。

图3为实施例数据填充过程中信息熵的变化曲线图。

具体实施方式

如图1所示,本实施例包括以下步骤:

步骤0:采集雷达对抗效能评估试验中的评估指标数据。

步骤1,单值数据转化为区间值:

本实施例中是以雷达对抗效能评估为例,雷达采集到的单值数据如表1所示。用“*”表示缺失数据,其中:c1~c6表示试验中采集到的评估指标参数,效能等级是指:被评估对象(雷达对抗系统)在某种情况下的作战效能等级。

以下填充过程中以填充第一组中c4的数据为例。

表1,雷达对抗效能评估单值数据

转化后的区间值如表2所示,其中每个单元格中的数据是指效能评估试验中得到的某个指标的参数。

表2,雷达对抗效能评估单值数据

步骤2:计算与指标c4相关的指标及加权广义信息熵的权重系数;

经过计算与指标c4相关的指标分别是c1和c3。归一化后的相关性分别为0.56和044。设c4,c1,c3,构成子集K。计算加权广义信息熵的权重,c1,c3的权重为0.56、0.44。假设该指标不存在相关性的指标,即是独立指标可以通过计算单个属性的广义信息熵进行填充。

步骤3,计算加权广义信息熵:

步骤3.1:将指标c4中的第一个缺失值看做区间长度为零的数据,计算原始信息熵;

步骤3.2:根据判断,以52作为区间值的下限,区间长度为极小值的数据替换缺失数,计算此时的信息熵,经过计算此时的信息熵为2.456;

步骤3.3:逐渐增大区间长度并计算每步新的信息熵;

步骤3.4:当信息熵与原始信息熵相等时,记录此时的区间上限值,经过计算,当区间上限达到58.8时,此时的信息熵与未加入数据前的信息熵相同(如图3所示);

步骤3.5:如果不存在新的信息熵与原系统信息熵相等的点,则找到第一个全局最小点,将此点标记为B,则区间上限选择该点。

步骤4,重复步骤1~3,完成所有的缺失数据,结果如表3所示:

表3

本实施例中,共设计缺失数据18个,缺失的数据涉及各个指标,经过计算,采用本发明的方法,填充准确16个,准确率为89%。

上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1