一种适用于自主空战领域的反事实解释生成方法及系统

文档序号:32043370发布日期:2022-11-03 06:06阅读:78来源:国知局
1.本发明涉及自主空战领域的反事实解释领域,特别是涉及一种适用于自主空战领域的反事实解释生成方法及系统。
背景技术
::2.自主空战(aac)是指飞机依靠机载等相关设备,自主进行战场感知、决策及控制,以执飞空战的技术。基于强化学习的自主空战已经取得超过人类飞行员的格斗性能,但是其黑盒特性成为了人机交互及落地应用的瓶颈。借鉴经济学与心理学领域的反事实研究方法,反事实解释成为揭示黑盒模型内部机制,生成高阶语义解释的重要途径。所谓反事实,即给定原始样本x0与待解释的黑盒模型f,生成一个尽量接近x0而预测标签与其不同的反事实样本xcf,对比x0与xcf的不同即可知决定黑盒模型局部决策规则的关键特征。目前,基于反事实样本的局部事后解释方法已经成为揭示黑盒决策模型内部机理的重要途径,但是现有生成反事实样本与反事实解释的方法存在如下缺点:(1)不统一,模型架构与对反事实生成的建模方法各异,难有共识,例如部分方法直接在原始数据特征空间中进行扰动,而另一些方法强调需要先学习数据的流形表示以提高生成样本的因果可行性与可解释性,再例如对反事实生成问题的建模多样,可以视为寻找最短路径问题、多目标优化问题或马尔可夫决策过程等;(2)对最优反事实性质建模不全面,现有方法大多数仅仅涉及到部分最优反事实样本性质;(3)用户需要的是高阶语义的自然语言解释,反事实样本只是一个中间结果,但现有方法大多忽略了如何去跨越反事实样本与文本解释之间的语义鸿沟。对此,本发明提出一种适用于自主空战领域的反事实解释生成方法及系统。技术实现要素:3.本发明的目的是提供一种适用于自主空战领域的反事实解释生成方法及系统,对空战数据进行低维流形表示后,考虑了更全面的最优反事实样本性质构建多目标优化函数,提高最优反事实样本生成的准确性,并且基于得到的反事实样本生成反事实解释文本。4.为实现上述目的,本发明提供了如下方案:5.一种适用于自主空战领域的反事实解释生成方法,包括:6.获取模拟空战数据集并对所述模拟空战数据集进行低维流形表示,得到低维空战数据;所述低维空战数据包括若干个低维事实样本和每一所述低维事实样本对应的决策标签;7.根据最优反事实性质构建最优反事实样本的多目标优化函数;8.构建待解释的黑盒模型;所述待解释的黑盒模型为机器学习模型或深度学习模型;9.利用所述低维事实样本及对应的所述决策标签训练所述待解释的黑盒模型,得到训练后的待解释黑盒模型;10.根据所述低维事实样本、训练后的待解释黑盒模型、所述最优反事实样本的多目标优化函数应用第三代非支配排序遗传算法,得到最优反事实样本;11.根据所述最优反事实样本与所述低维事实样本的特征值和预设的解释文本集解释所述最优反事实样本,得到最优反事实样本解释文本;12.基于所述最优反事实样本解释文本得到所述待解释的黑盒模型中的自主空战的决策策略。13.本发明还提供一种适用于自主空战领域的反事实解释生成系统,包括:14.低维空战数据获取模块,用于获取模拟空战数据集并对所述模拟空战数据集进行低维流形表示,得到低维空战数据;所述低维空战数据包括若干个低维事实样本和每一所述低维事实样本对应的决策标签;15.优化目标确定模块,用于根据最优反事实性质构建最优反事实样本的多目标优化函数;16.模型构建模块,用于构建待解释的黑盒模型;所述待解释的黑盒模型为机器学习模型或深度学习模型;17.训练模块,用于利用所述低维事实样本及对应的所述决策标签训练所述待解释的黑盒模型,得到训练后的待解释黑盒模型;18.最优反事实样本获取模块,用于根据所述低维事实样本、训练后的待解释黑盒模型、所述最优反事实样本的多目标优化函数应用第三代非支配排序遗传算法,得到最优反事实样本;19.解释文本生成模块,用于根据所述最优反事实样本与所述低维事实样本的特征值和预设的解释文本集解释所述最优反事实样本,得到最优反事实样本解释文本;20.决策策略获取模块,用于基于所述最优反事实样本解释文本得到所述待解释的黑盒模型中的自主空战的决策策略。21.根据本发明提供的具体实施例,本发明公开了以下技术效果:22.本发明涉及一种适用于自主空战领域的反事实解释生成方法及系统,包括:获取模拟空战数据集并进行低维流形表示,根据最优反事实性质构建最优反事实样本的多目标优化函数;构建待解释的黑盒模型;利用低维事实样本及对应的决策标签训练待解释的黑盒模型;根据低维事实样本、训练后的待解释黑盒模型、多目标优化函数应用第三代非支配排序遗传算法,得到最优反事实样本进而得到最优反事实样本解释文本;基于最优反事实样本解释文本得到待解释的黑盒模型中的自主空战的决策策略。基于低维事实样本和更全面的多目标优化函数更准确的生成最优反事实样本,并且进一步得出最优反事实解释文本。附图说明23.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。24.图1为本发明实施例1提供的一种适用于自主空战领域的反事实解释生成方法流程图;25.图2为本发明实施例1提供的一种适用于自主空战领域的反事实解释生成方法框架图;26.图3为本发明实施例1提供的在dcs-atoa数据集上,不同嵌入维度下aace的表现;27.图4为本发明实施例1提供的在dcs-atog数据集上,不同嵌入维度下aace的表现;28.图5为本发明实施例2提供的一种适用于自主空战领域的反事实解释生成及系统框图。具体实施方式29.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。30.本发明的目的是提供一种适用于自主空战领域的反事实解释生成方法及系统,对空战数据进行低维流形表示后,考虑了更全面的最优反事实样本性质构建多目标优化函数,提高最优反事实样本生成的准确性,并且基于得到的反事实样本生成反事实解释文本。31.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。32.实施例133.如图1和2所示,本实施例提供一种适用于自主空战领域的反事实解释生成方法,包括:34.s1:获取模拟空战数据集并对所述模拟空战数据集进行低维流形表示,得到低维空战数据;所述低维空战数据包括若干个低维事实样本和每一所述低维事实样本对应的决策标签。35.使用两个空战数据集dcs-atoa和dcs-atog对本文提出的方法进行验证与研究。dcs-atoa为一模拟空对空狗斗场景的数据,决策标签为二分类(0-不开火,1-开火),dcs-atog为一模拟空对地攻击场景的数据,决策标签为五分类(0-无动,1-搜索,2-瞄准,3-攻击,4-脱离)。两个数据集均为表格数据,基于steam平台发售的dcs-world空战模拟器采集得到。36.使用dfencoder学习数据的低维流形表示。dfencoder为一适用于表格数据的自编码器,其核心思想是将连续特征、多类别特征和二值特征分别训练成三个潜在变量,去掉构造误差较大的数据点,以减轻异常偏差:[0037][0038]其中l为编码器,l-1为解码器,xcon,xcat,xbin分别为连续特征,多类别特征,二值特征。argmindist()代表的是进行低维流形表示,代表最小化重构误差,为训练自编码器的损失函数;步骤s1可以学习到原始模拟空战数据的低维数据流形表示。[0039]s2:根据最优反事实性质构建最优反事实样本的多目标优化函数。[0040]最优反事实需要具有合法性、接近性、稀疏性、多样性、因果可行性、流形接近性六个性质。首先步骤s2在步骤s1学习得到的低维流形表示中执行优化生成反事实样本,这样做是因为接近性要求反事实优化过程中对事实样本对应流形点的改变尽量小,而小量改变在经过解码器生成反事实样本时会被忽略,从而使得反事实样本与事实样本尽可能相似,保证了流形接近性,不出现异常点。这也是步骤s1自编码器的价值所在。随后给定标签为y0的原始样本x0,待解释决策策略πθ,生成的反事实样本xcf与期望的反事实标签ycf,除了流形接近性以外的反事实性质可建模为优化目标如下。具体的,步骤s2包括:[0041]s21:根据所述反事实样本的决策标签与所述低维事实样本的决策标签不同确定第一优化子目标。[0042]合法性:合法性确保生成的反事实样本标签与原始样本标签不同,以满足反事实性质。由于y0为离散变量,而模型预测出的决策标签通常为一概率,比较该概率与特定阈值大小后才转化为离散的火控标签,因此,使用交叉熵损失建模合法性损失。具体,所述第一优化子目标的表达式为:[0043]lossvalidity=-ycflog(f(xcf))+(1-ycf)log(1-f(xcf))[0044]其中,lossvalidity表示第一优化子目标;xcf表示反事实样本;ycf表示反事实样本的决策标签;f(xcf)表示待解释黑盒模型对反事实样本的预测标签。[0045]s22:根据所述反事实样本的特征与所述低维事实样本的特征之间的相似性确定第二优化子目标。[0046]接近性:接近性在满足合法性的基础上要求生成的反事实样本与事实样本尽可能接近,以满足“相反的最接近”这一要求。[0047]对于连续性特征,由于不同特征的尺度不同,因此使用平均绝对偏差进行归一化。[0048][0049]其中,conlossproximity表示连续型特征的第二优化子目标;m表示反事实样本中连续特征的数量,表示反事实样本的第i个连续特征;xi表示事实样本的第i个连续特征;madi表示事实样本第i个连续特征的平均绝对偏差。[0050]对于离散型特征,接近性只需比较特征值是否相同。[0051][0052]catlosspriximity表示离散型特征的第二优化子目标;若则i(·|·)=0,否则i(·|·)=1;n为离散型特征的个数;[0053]接近性优化目标可以整体建模为:[0054]lossproximity=conlossproximity+catlossproximity[0055]其中,lossproximity表示第二优化子目标。[0056]s23:根据所述反事实样本中特征被改变的数量确定第三优化子目标。[0057]稀疏性:稀疏性意味着生成的反事实样本中改变的特征更少,从而保证了解释的可读性。实验表明在生成反事实样本的过程中连续型特征一定会被改变,因此本发明仅衡量离散型特征被改变的数量,作为稀疏性的优化目标。[0058]所述第三优化子目标的表达式为:[0059][0060]其中,losssparsity表示第三优化子目标;若则i(·|·)=0,否则i(·|·)=1。[0061]s24:根据一个所述低维事实样本生成的多个所述反事实样本之间的差异性确定第四优化子目标;[0062]多样性:多样性为一个事实样本生成的多个反事实样本之间的差异度量。更高的多样性意味着为用户提供更多可行的选择和更多的信息解释。计算多样性损失的直接方法是将每个反事实对的距离加起来,但为了同时保持较低的稀疏性,本发明使用确定性点过程(determinantpointprocesses,dpp)实现多样性约束,计算距离矩阵的行列式。[0063]所述第四优化子目标的表达式为:[0064][0065]其中,lossdiversity表示第四优化子目标;dist(xcfa,xcfb)计算两个反事实样本之间的距离。[0066]s25:根据所述反事实样本的特征之间的因果约束确定第五优化子目标。[0067]因果可行性:因果可行性保留了特征之间的因果约束。例如,教育程度不会随着年龄的增长而下降。这种因果关系用结构因果模型(scm)来描述。结构化因果模型是一个有向无环图,它的节点表示特征,边表示从原因到结果的因果关系。scm中的一个节点e可以由它的父节点确定:e=g(pa(e),∈)。其中pa(e)代表e的父母,g是表示因果强度的函数,∈为高斯噪声。本方法首先计算具有因果可行性的反事实样本:[0068][0069]其中,表示反事实样本的第l个外生变量;所述外生变量是与所述反事实样本中连续特征和离散型特征不同的特征;g(·)指结构因果模型,在给定结构化因果模型g(·)与外生特征变量之后,以广度优先遍历的方式计算所有内生特征变量,从而得到具有因果可行性的反事实样本。[0070]因果可行性定义为与xcf之间的距离:[0071]即所述第五优化子目标的表达式为:[0072][0073]其中,losscausality表示第五优化子目标;;||||2表示二范数。[0074]s26:以所述低维事实样本中具有指定的反事实标签的所述反事实样本为第六优化子目标;所述反事实标签指反事实样本对应的决策标签。[0075]原型损失:为了加速反事实生成,我们在最优反事实性质之外还加入了原型损失这一优化目标。所谓原型就是事实样本中具有指定反事实标签的样本的表示。原型proto可以通过下式计算:[0076][0077]其中,为一定义在距离度量d上的指数核函数,z是低维事实样本的隐空间表示;是低维事实样本的第p个拥有反事实标签的k近邻样本的隐空间表示;k表示k近邻样本的数量;角标knn表示k近邻算法。[0078]原型损失即所述第六优化子目标的表达式为:[0079]lossproto=||proto-zcf||2[0080]其中,lossproto表示第六优化子目标;zcf表示低维反事实样本的隐空间表示。[0081]s27:根据所述第一优化子目标、所述第二优化子目标、所述第三优化子目标、所述第四优化子目标、所述第五优化子目标和所述第六优化子目标构建所述多目标优化函数。[0082]反事实优化的最终目标为如下的多目标优化任务:[0083][0084]s3:构建待解释的黑盒模型;所述待解释的黑盒模型为机器学习模型或深度学习模型。[0085]s4:利用所述低维事实样本及对应的所述决策标签训练所述待解释的黑盒模型,得到训练后的待解释黑盒模型。[0086]使用lightgbm拟合空战数据集,lightgbm拟合的是原始特征空间,采用5折交叉验证方法,确保模型评估指标auc达到0.95以上。[0087]s5:根据所述低维事实样本、训练后的待解释黑盒模型、所述最优反事实样本的多目标优化函数应用第三代非支配排序遗传算法nsga-iii,得到最优反事实样本。[0088]其中,步骤s5具体包括:[0089]s51:基于若干个所述低维事实样本随机生成服从高斯分布的初始种群。[0090]s52:对所述初始种群中的个体进行交叉与变异产生中间种群。[0091]s53:获取所述初始种群和所述中间种群的集合,得到集合种群。[0092]s54:将所述集合种群中的每一所述个体输入到所述训练后的待解释黑盒模型,得到每一所述个体对应的决策标签并结合所述多目标优化函数计算多个优化目标值。[0093]步骤s54中,将集合种群中的个体(反事实样本)输入到训练后的待解释黑盒模型中得出该反事实样本对应的决策标签,从而参与多目标优化的计算。[0094]s55:根据多个所述优化目标值对所述集合种群进行非支配排序,得到分层的帕累托前沿。[0095]s56:从所述分层的帕累托前沿中获取与所述初始种群的个体数量相同的个体,得到下一代种群。[0096]考虑到帕累托前沿的各分层的个体不一定刚好构成下一代种群所需的个体数量,即初始种群的个体数量,所以需要尝试的去判断前h层的帕累托前沿中的个体数量是否等于所述初始种群的个体数量。[0097]具体的,步骤s56具体包括:[0098]判断前h层的帕累托前沿中的个体数量是否等于所述初始种群的个体数量;[0099]若等于,则取前h层的帕累托前沿中的个体作为所述下一代种群中的个体;[0100]若小于,则令h=h+1,返回步骤“判断前h层的帕累托前沿中的个体数量是否等于所述初始种群的个体数量”;[0101]若大于,则取前h-1层的帕累托前沿中的个体作为所述下一代种群中的部分个体,并计算剩余个体数量;[0102]对所述集合种群中的所有所述个体对应的所有所述优化目标值进行标量化处理并根据标量化结果利用单纯形法生成多个参考点;[0103]计算小生境中所述参考点出现的次数;[0104]选择出现次数小于预设次数的所述参考点为目标参考点;[0105]从第h层的帕累托前沿中,根据所述个体与所述目标参考点的相似性选择所述剩余个体数量的个体加入到所述下一代种群中,得到完整的下一代种群。[0106]s57:判断当前迭代次数是否等于最大迭代次数。[0107]若是,则所述下一代种群即为最优的反事实样本集;[0108]若否,则令所述下一代种群为所述初始种群,并返回步骤s52,直至到达最大迭代次数。[0109]s6:根据所述最优反事实样本与所述低维事实样本的特征值和预设的解释文本集解释所述最优反事实样本,得到最优反事实样本解释文本。[0110]其中,预设的解释文本集是根据领域知识人为制定的,比如描述近距离狗斗场景中经典态势的文本。触发条件是事实样本与反事实样本的一个或几个特征值满足一定条件,在一定范围内,事实样本和反事实样本中的特定特征变化可能会触发生成相应的解释文本。[0111]步骤s6中还可以基于高维空间的最优反事实样本与高维空间的事实样本的特征值解释高维空间最优反事实样本。[0112]s7:基于所述最优反事实样本解释文本得到所述待解释的黑盒模型中的自主空战的决策策略。[0113]当得到最优反事实样本后,则能够发现黑盒模型中的内部规则,那么也就能够得知黑盒模型学习的自主空战的决策策略。[0114]本实施例中,生成的反事实样本质量在六个指标中均获得了较好的表现,称该方法为aace。在基于dcs-world模拟产生的dcs-atoa和dcs-atog上进行实验,采用以下指标衡量反事实样本的质量:[0115](1)合法率(valratio):即合法的反事实样本占总反事实样本的比率。[0116](2)接近度(meanprox):即生成的反事实样本与事实样本的距离的均值,定义与接近度优化目标相同。[0117](3)多样性(diversity):即针对一个事实样本生成的一组反事实样本,其两两之间距离的均值。[0118](4)因果可行性比率(causalratio):即生成的反事实样本中满足因果约束的样本占总反事实样本的比率[0119](5)im1:衡量反事实样本的流形接近程度,定义如下:[0120][0121]其中,aecf为在反事实类别(不是反事实样本)上训练的自编码器(降维),aeori为在事实类别上训练的自编码器,∈为非零小量。[0122](6)im2:衡量反事实样本的可解释性,定义如下:[0123][0124]其中,(5)和(6)是interpretablemetric的缩写,即两个可解释性指标,用于衡量反事实样本的流形接近性。前述性质缺少流形接近性,已加入。公式应用在评估反事实样本的过程,见表1表2。[0125]其中aecf为在反事实类别(不是反事实样本)上训练的自编码器,aefull为在全部类别(即整个数据集)上训练的自编码器,∈为非零小量。[0126]在六个指标中,合法率、多样性、因果可行性越大越好;接近度,im1、im2越小越好。[0127]选取近三年的部分反事实生成方法作为baseline,与aace对比在dcs-atoa与dcs-atog上的效果,结果如下表:[0128]表1在dcs-atoa数据集上反事实样本生成的表现[0129][0130]表2在dcs-atog数据集上反事实样本生成的表现[0131][0132]分析上表可以得到:[0133](1)所有方法都可以生成100%合法的反事实样本。aace在接近性、因果可行性、im1和im2指标上超过了所有其他基线,在多样性方面达到了第二高的表现。[0134](2)通过对不可行的反事实进行更重的惩罚,aace的因果可行性优于proce和mace,并且后两者也添加了因果约束。表明了在一个结构化的因果模型中考虑误差传播的合理性。[0135]为了探究aace中对低im1与im2的贡献因素,进一步对本实施例的方法进行消融实验,分别去掉自编码器与原型损失,结果如下表3和表4:[0136]表3aace在dcs-atoa上的消融实验[0137][0138]表4aace在dcs-atoa上的消融实验[0139][0140]研究发现,在没有原型指导下,两个数据集上的im1和im2均略有增加。然而,是否在密集数据流形表示上进行优化对两个指标的影响更大。基于上述比较,强烈建议添加一个自编码器或其变体作为反事实生成的优化设备。[0141]为了验证自编码器的鲁棒性,探究不同嵌入维度下aace的表现,见图3与图4。[0142]当嵌入大小从4到7时,dcs-atoa上除了im2的其他指标是稳定的。对于atog数据集,在不同的嵌入规模下,所有指标都是稳定的。以上实验表明了aace所使用自编码器的总体稳定性。[0143]最后,以空对空任务dcs-atoa的不开火标签为例生成解释文本。根据专家知识,空对空狗斗最容易发生在500-1000米的距离内,这是大多数航空炮的有效攻击范围。此外,如果飞行员能进入敌机尾部的范围,可以为其存档更好的攻击姿态,此时的我机偏离角一般在30度以内。据此,开发解释集合与触发器为(aoa与dist均为dcs-atoa中的特征,分别表示我机偏离角和敌我距离):[0144][0145][0146]对于下面的例子,反事实的解释是:如果距离在1000米以内,飞机就会开火。[0147]表5dcs-atoa任务中一个用于生成解释的事实-反事实样本对[0148][0149]通过多个实验循序渐进、一步步地去充分验证反事实生成的质量与文本解释生成的有效性。由以上实验结果可见,本发明所提出的解决方法是新颖、可靠、有效的。[0150]实施例2[0151]如图5所示,本实施例提供一种适用于自主空战领域的反事实解释生成系统,包括:[0152]低维空战数据获取模块t1,用于获取模拟空战数据集并对所述模拟空战数据集进行低维流形表示,得到低维空战数据;所述低维空战数据包括若干个低维事实样本和每一所述低维事实样本对应的决策标签;[0153]优化目标确定模块t2,用于根据最优反事实性质构建最优反事实样本的多目标优化函数;[0154]所述优化目标确定模块t2具体包括:[0155]第一优化目标确定子模块t21,用于根据所述反事实样本的决策标签与所述低维事实样本的决策标签不同确定第一优化子目标;[0156]第二优化目标确定子模块t22,用于根据所述反事实样本的特征与所述低维事实样本的特征之间的相似性确定第二优化子目标;[0157]第三优化目标确定子模块t23,用于根据所述反事实样本中特征被改变的数量确定第三优化子目标;[0158]第四优化目标确定子模块t24,用于根据一个所述低维事实样本生成的多个所述反事实样本之间的差异性确定第四优化子目标;[0159]第五优化目标确定子模块t25,用于根据所述反事实样本的特征之间的因果约束确定第五优化子目标;[0160]第一优化目标确定子模块t26,用于以所述低维事实样本中具有指定的反事实标签的所述反事实样本为第六优化子目标;所述反事实标签指反事实样本对应的决策标签;[0161]优化目标确定子模块t27,用于根据所述第一优化子目标、所述第二优化子目标、所述第三优化子目标、所述第四优化子目标、所述第五优化子目标和所述第六优化子目标构建所述多目标优化函数。[0162]模型构建模块t3,用于构建待解释的黑盒模型;所述待解释的黑盒模型为机器学习模型或深度学习模型;[0163]训练模块t4,用于利用所述低维事实样本及对应的所述决策标签训练所述待解释的黑盒模型,得到训练后的待解释黑盒模型;[0164]最优反事实样本获取模块t5,用于根据所述低维事实样本、训练后的待解释黑盒模型、所述最优反事实样本的多目标优化函数应用第三代非支配排序遗传算法,得到最优反事实样本;[0165]其中,所述最优反事实样本获取模块t5具体包括:[0166]初始种群构建子模块t51,用于基于若干个所述低维事实样本随机生成服从高斯分布的初始种群;[0167]交叉变异子模块t52,用于对所述初始种群中的个体进行交叉与变异产生中间种群;[0168]种群合并子模块t53,用于获取所述初始种群和所述中间种群的集合,得到集合种群;[0169]优化目标值计算子模块t54,用于将所述集合种群中的每一所述个体输入到所述训练后的待解释黑盒模型,得到每一所述个体对应的决策标签并结合所述多目标优化函数计算多个优化目标值;[0170]非支配排序子模块t55,用于根据多个所述优化目标值对所述集合种群进行非支配排序,得到分层的帕累托前沿;[0171]下一代种群生成子模块t56,用于从所述分层的帕累托前沿中获取与所述初始种群的个体数量相同的个体,得到下一代种群;[0172]所述下一代种群生成子模块t56具体包括:[0173]判断单元t561,用于判断前h层的帕累托前沿中的个体数量是否等于所述初始种群的个体数量;[0174]若等于,则取前h层的帕累托前沿中的个体作为所述下一代种群中的个体;[0175]若小于,则令h=h+1,返回步骤“判断前h层的帕累托前沿中的个体数量是否等于所述初始种群的个体数量”;[0176]若大于,则取前h-1层的帕累托前沿中的个体作为所述下一代种群中的部分个体,并计算剩余个体数量;[0177]参考点生成单元t562,用于对所述集合种群中的所有所述个体对应的所有所述优化目标值进行标量化处理并根据标量化结果利用单纯形法生成多个参考点;[0178]目标参考点确定单元t563,用于计算小生境中所述参考点出现的次数,并选择出现次数小于预设次数的所述参考点为目标参考点;[0179]下一代种群生成单元t564,用于从第h层的帕累托前沿中,根据所述个体与所述目标参考点的相似性选择所述剩余个体数量的个体加入到所述下一代种群中,得到完整的下一代种群。[0180]判断子模块t57,用于判断当前迭代次数是否等于最大迭代次数;[0181]若是,则所述下一代种群即为最优的反事实样本集;[0182]若否,则令所述下一代种群为所述初始种群,并返回步骤“对所述初始种群中的个体进行交叉与变异产生中间种群”,直至到达最大迭代次数。[0183]解释文本生成模块t6,用于根据所述最优反事实样本与所述低维事实样本的特征值和预设的解释文本集解释所述最优反事实样本,得到最优反事实样本解释文本;[0184]决策策略获取模块t7,用于基于所述最优反事实样本解释文本得到所述待解释的黑盒模型中的自主空战的决策策略。[0185]本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。[0186]本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1