一种基于序贯多层融合的复杂系统成功率评估法

文档序号:32888078发布日期:2023-01-12 22:17阅读:21来源:国知局
一种基于序贯多层融合的复杂系统成功率评估法

1.本发明涉及复杂系统数据融合估计领域,具体是一种基于序贯多层融合的复杂系统成功率评估法。


背景技术:

2.对复杂系统成功率评估的过程中,由于系统设备造价昂贵,真实实验成本高昂,系统在定型阶段无法做大量真实实验,小样本实验使得常用于评估系统性能的专家打分法和传统实验统计法无法满足鉴定要求。近年来,随着信息技术和计算机技术的发展,人们利用仿真技术设计了各类替代型实验,结合小样本理论,对复杂系统成功率进行综合评估。目前,在复杂系统成功率的评估中,一般需要进行四种实验:数字仿真、半实物仿真、外场静态实验、真实实验。实验条件越来越接近真实,实验数据逼真度越来越高,但受限于成本等条件,所能进行的实验次数越来越少。
3.采用多来源实验信息综合评估复杂系统成功率会带来两个主要问题:异总体、小样本。事实上,由于各种客观因素,如实验条件的不一致性、仿真参数设置的差异等,都使得各类实验数据不同程度上偏离同一总体。此外,由于各种实验手段的成本具有很大的差异,因此它们的实验次数也大不相同,甚至相差几个数量级,在这种情况下,若将各种实验数据进行简单混合,即认为完全来自同一总体,就很可能存在大样本“淹没”小样本现象,从而导致最终结果的不可靠性。因此,在对复杂系统成功率进行评估时,不能直接混合来自不同信息源的实验信息。
4.针对以上问题,我们提出了基于序贯多层融合的复杂系统成功率评估方法。该方法的核心思想是引入继承因子和更新因子,当三种仿真实验条件与真实实验条件有差异时,将获取的仿真实验信息进行折合修正,使得折合后的信息和真实实验信息近似服从同一总体,即将不同环境、不同实验条件的实验信息折合到同一实验状态下,减少异总体性对复杂系统成功率评估结果的影响。同时,针对四种实验逼真度逐步升高,而样本数逐渐减少的特点,采用按步骤分阶段的多层融合方法,更加有效的利用先验信息,获得更加精确的估计值。基于序贯多层融合的复杂系统成功率评估法可有效解决实验方式多、实验次数少的矛盾,并在很大程度上避免主观性,使评估结果更为客观,同时它也可以在一定程度上解决大样本“淹没”小样本问题,更能反映系统的真实性能。


技术实现要素:

5.本发明的目的在于克服现有技术的不足,提供一种基于序贯多层融合的复杂系统成功率评估法,包括如下步骤:步骤一,先验分布的估计;根据先验信息给出复杂系统成功率所服从的先验分布密度函数,所述的先验信息包括数字仿真数据、半实物仿真数据和外场静态实验数据;步骤二,先验分布的修正;引入继承因子和更新因子,当获取先验信息的条件与现场实验条件不一致时,将获取的先验信息进行折合修正,使得折合后的信息和现场实验信
息近似服从同一总体,即将不同环境、不同实验条件的实验信息折合到标准实验状态下的实验信息,得到修正后的先验分布;步骤三,基于序贯多层的bayes融合,得到各层下的复杂系统成功率的先验分布,与逼真度较高的真实实验数据相结合,得到成功率的后验分布;步骤四,通过损失函数和风险函数,在风险最小准则下得到成功率给出bayes点估计。
6.进一步的,所述的先验分布的估计包括如下过程:假定成功率为, 则其失败的概率为,先验信息对应的先验分布为,次重复试验中的成功次数服从以为参数的二项分布:成功率的共轭先验分布为分布,即:其中,为超参数,设表示每种实验的实验次数为,其中失败次,则超参数计算公式如下:次,则超参数计算公式如下:次,则超参数计算公式如下:。
7.进一步的,所述的先验分布的修正,包括如下过程:先验分布为,引入继承因子,得到修正后的先验分布, 每一种先验子样引入相应的继承因子,为更新因子,得到修正后的先验分布:假设先验子样来自总体,其中为试验数, 为成功数, 为失败数;现场子样来自总体,其中为试验数, 为成功数, 为失败数;作统计假设:和有相同的总体;令
由上式定义的是一个 皮尔逊统计量,它依分布收敛到自由度为1的分布,给定显著水平,得到:对的一个修正:令为该检验的拟合优度,其中为分布密度函数;和之间具有函数关系:对于函数,一定存在一个多项式列,使得。
8.进一步的,所述的基于序贯多层的bayes融合,包括如下步骤:第一层:确定第一个阶段的超参数,得如下共轭先验分布,,计算继承因子,得出修正后的:,利用bayes公式,并结合当前现场实验信息即半实物仿真实验数据得到成功率的后验分布:
其中其中其中,为半实物仿真实验的实验次数,为半实物仿真实验的失败次数;计算继承因子,得出修正后的:第二层:将第一层计算得到的后验分布作为第二层中的先验分布,并结合离散处理后的外场静态实验数据,利用bayes公式同理得到成功率的后验分布:的后验分布:故
其中其中其中计算继承因子,得出修正后的:第三层:最后与真实实验数据相结合,得到成功率的后验分布:的后验分布:因此其中

9.进一步的,所述的通过损失函数和风险函数,在风险最小准则下得到成功率给出bayes点估计,包括如下过程:采用平方损失函数对成功率进行bayes点估计,风险函数即损失函数的统计平均,即表示用估计时引起的平均损失;在风险最小准则下对成功率给出bayes点估计,由于是的函数,而参数还是一个随机变量,它有先验分布,于是的损失应由来衡量,将上述积分记为, 为bayes解,即由于由于所以。
10.本发明的有益效果是:引入继承因子和更新因子将实验数据的来源条件统一;对先验信息进行了折合修正,降低了异总体性对评估的影响;提出了序贯分层bayes融合的融合方式,更加有效的利用先验信息,提高了估计的稳健性与准确度;避免了真实小样本实验成功率的大波动性对估计值造成的不稳定性,更好地反映了系统的真实性能。
附图说明
11.图1为一种基于序贯多层融合的复杂系统成功率评估法的流程示意图;图2为基于序贯多层融合的复杂系统成功率评估模型;图3为基于序贯多层的bayes融合示意图;图4为蒙特卡洛仿真试验。
具体实施方式
12.下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
13.为了使本发明的目的,技术方案及优点更加清楚明白,结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
14.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
15.而且,术语“包括”,“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程,方法,物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程,方法,物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程,方法,物品或者设备中还存在另外的相同要素。
16.以下结合实施例对本发明的特征和性能作进一步的详细描述。
17.将数字仿真、半实物仿真、外场静态实验的数据作为先验信息,而将真实实验数据作为现场信息。先验分布的估计是指根据先验信息给出复杂系统成功率(待估参数)所服从的先验分布密度函数。我们采用有先验信息情况下的先验分布确定方法—共轭分布法。共轭分布法的一个重要特点是,它要求先验分布与后验分布属于同一类型。这样还可形成信息链,即将当前阶段的后验分布作为下一阶段的先验分布,如此逐层进行可使得最终获得的成功率估值更为准确,这也是基于序贯思想的多层估计方法的基本思想。
18.假定成功率为, 则其失败的概率为,先验信息对应的先验分布为,它们共同反映了在真实实验前我们对成功率的认识程度。次重复试验中的成功次数服从以为参数的二项分布:因此,对于成功率而言,其共轭先验分布为分布,即:其中称为超参数超参数和的计算对成功率先验分布的估计精确程度有着重要影响。本评估法
采用经验法,该方法不仅可以给出超参数的合理估计,而且计算简单,是实际工程中确定先验分布超参数的常用方法。设表示每种实验的实验次数为,其中失败次,则超参数计算公式如下:。
19.超参数取法说明:利用先验信息求得的先验分布实际上可以看作无先验信息在结合试验数据后的后验分布。例如在蒙特卡洛仿真之前我们对成功率是未知的,即无信息,因此可认为服从均匀分布,它的密度函数是。在仿真之后,我们得到了关于成功率的试验数据(即蒙特卡洛仿真试验数据),因此可以利用蒙特卡罗仿真试验数据对无信息先验分布—均匀分布进行修正,即利用公式融合无先验信息下的均匀分布和蒙特卡洛试验信息,从而获得成功率后验分布,也即根据蒙特卡洛仿真试验数据得到的对于真实试验而言的先验分布:这里为蒙特卡洛仿真试验结果的似然函数,,为均匀分布的密度函数,。由密度函数的核可以看出,,且。
20.先验分布的修正由于各类实验在进行多次重复实验时受多种不可控因素的影响,其对应的先验分布很难与复杂系统成功率的真实分布达到高度一致,故需对共轭先验分布进行适当修正。其核心思想就是引入继承因子和更新因子,当获取先验信息的条件与现场实验条件不一致时,将获取的先验信息进行折合修正,使得折合后的信息和现场实验信息近似服从同一总体,即将不同环境、不同实验条件的实验信息折合到标准实验状态下的实验信息,减少异总体性对复杂系统成功率评估结果的影响。
21.主要步骤如下:(a)确定先验分布,重点确定分布中的超参数,它直接关系到先验分布与真实分布的接近程度。
22.(b)引入继承因子,得到修正后的先验分布,关键在于确定,它反映了现场子样对先验子样的继承程度。
23.继承因子的定义针对每一种先验子样引入相应的继承因子,为更新因子,得到修正后的先验分布:
由上式可见,修正后的先验分布实际上是共轭先验分布与基于假设的[0,1]均匀分布的加权和,其权重分别为继承因子与更新因子。
[0024]
其中,继承因子它反映了先验子样与现场子样对应总体之间的相似程度,或者现场子样对先验子样的继承程度。如果现场子样和先验子样相似程度较低,则值较小;反之,如果现场子样和先验子样相似程度较高,则值较大。在两个极端的情形:,认为两个总体是完全相同的, 此时混合先验分布就是共轭先验, 也就是完全使用历史样本作为先验信息;, 则认为两个总体完全不同, 此时混合先验分布就是[0, 1] 上的均匀分布,也就是完全不用历史样本, 在无先验信息的情况下,选择保守的作为先验分布;而则是介于两者之间的情形, 即两个总体是相似(或者说是相近) 的, 此时部分的使用历史样本中的信息。
[0025]
从以上的分析可以看到, 是对产生历史样本与现场样本的两个总体之间相似程度的度量, 所以考虑利用两个总体的拟合优度检验来确定的值。
[0026]
继承因子的计算假设先验子样来自总体,其中为试验数, 为成功数, 为失败数;现场子样来自总体,其中为试验数, 为成功数, 为失败数;作统计假设:和有相同的总体;令由上式定义的是一个 皮尔逊统计量,它依分布收敛到自由度为1的分布,给定显著水平,得到:这是一个大样本检验,对有限的,只能有近似服从自由度为1的分布。另外,(1)式中还要求都应大于5,这一要求在样本量较小时是很难满足的,
为此,给出了对的一个修正:(2)上式中近似服从自由度为1的分布,以下使用到的均如(2)式中的定义。
[0027]
例如,假设蒙特卡洛仿真试验数据,表示试验1000次,失败100次)、半实物仿真试验数据,表示试验100次,失败10次)和外场静态试验数据,表示试验10次,失败1次)分别与真实试验数据,表示试验5次,失败1次)作相容性检验,得到的检验统计量分别记作;在检验水平时,,因此假设检验的结果为接受原假设,即认为蒙特卡洛仿真试验数据、半实物仿真试验数据、外场静态试验数据均与真实试验数据来自同一总体。
[0028]
符号说明:表示试验次,失败次,下同。
[0029]
在上述检验问题中,一般来说,接受并不意味着原假设为真,特别是在样本量较小时,只能说否定的证据不充分。另外,一个略小于的和一个远小于的,意义有所不同,后者支持原假设的理由更为强烈。令称之为该检验的拟合优度,其中为分布密度函数。
[0030]
越大,支持原假设的证据就越强。给定的水平是一个阈值,一旦,就否定原假设。当时,,的取值越大,否定原假设的证据就越强,对应的值也就越接近于0;当时,,值越小则肯定原假设就越强烈,对应的值越接近于1,而在拒绝和接受原假设的边界上取值为。
[0031]
从的定义看到,它可以作为两个总体之间相似程度的度量。那么,和是相互联系和相互影响的,即它们之间具有函数关系:。
[0032]
以下对函数的几点假设是很自然的:a)是连续函数;b)是单调增函数;c)。
[0033]
于是由数学分析中的定理可知, 对于函数,一定存在一
个多项式列,使得。
[0034]
为计算方便,在不要求最优解时,可以考虑比较简单的形式,的取值依赖于先验子样和现场子样,由于无法得到其精确值,可以通过在各种可能的概率下产生与样本和历史样本相同容量的随机数来模拟计算, 比较计算结果并选择一个合适的值。在很多情况下,一般选取是比较合适的。
[0035]
针对四种实验逼真度逐步升高,而样本数逐渐减少的关系特点,采用按步骤分阶段的多层信息融合方法,该方法可以更加有效的利用先验信息,获得更加精确的估计。多层融合方法在第一步的先验描述基础上寻找第二步先验信息,如果第一步导出先验类,则第二步就是置于该先验类之上的一个估计,即将上一层bayes统计推断获得的估计信息作为下一层bayes统计推断的先验信息,并依次类推最终获得成功率的估计值。其结构图如下所示:在前文中,我们已经介绍了先验分布的确定方法,下面将在多层bayes融合中继续应用上述方法来得到各层下的复杂系统成功率的先验分布,最后与逼真度较高的真实实验数据相结合,得到成功率的后验分布。
[0036]
第一层:确定第一个阶段的超参数,得如下共轭先验分布,计算继承因子,得出修正后的:利用bayes公式,并结合当前现场实验信息即半实物仿真实验数据得到成功率的后验分布:其中,
为半实物仿真实验的实验次数,为半实物仿真实验的失败次数。
[0037]
计算继承因子,得出修正后的:第二层:将第一层计算得到的后验分布作为第二层中的先验分布,并结合离散处理后的外场静态实验数据,利用bayes公式同理得到成功率的后验分布:的后验分布:故其中其中其中计算继承因子,得出修正后的:
第三层:最后与逼真度较高的真实实验数据相结合,得到成功率的后验分布:的后验分布:因此,其中,成功率的bayes估计假设样本的联合密度是,简写为,其中是待估计参数,即为复杂系统成功率。我们采用点估计法实现对的估计。
[0038]
点估计就是寻找一个统计量去估计参数,简记为。从bayes观点来看,就是寻找随机向量的函数,使它尽可能地“接近”随机变量。这里的“接近”是依赖于某种准则的一种评价估计精度的指标。在传统估计理论中,通常用无偏性与最小方差来作为衡量指标,而在bayes估计中将损失函数和风险函数最小化作为估计准则同时也是评价估计优良性的一个指标。因此,要得到bayes点估计,首先需定义损失函数及风险函数。
[0039]
损失函数是一个二元非负实值函数,它表示用作为的估计值时由于估计不准确而引起的损失。损失函数的取值通常损失总是非负的,因此可以设。
[0040]
损失函数的形式有很多种,常用的有:1)平方损失函数;2)加权平方损失函数;3)绝对损失函数,等等。根据实际问题的不同,可以采用不同的损失函数,本文采用平方损失函数对成功率进行bayes点估计。
[0041]
风险函数实际上是损失函数的统计平均,可以理解为平均损失,即它代表了用估计时引起的平均损失。由于用样本函数去估计参数时,是随机变量的函数,因而也是一个随机变量。
[0042]
在定义了损失函数及风险函数后,我们就可以在风险最小准则(平均损失最小)下对未知参数给出bayes点估计。由于是的函数,而参数还是一个随机变量,它有先验分布,于是的损失应由来衡量,将上述积分记为,如能找到一个估计量使达到最小值,则它是bayes意义上的最佳估计,称为bayes解,即由于由于所以当损失函数取为平方损失函数时,我们还可以得到点估计的数学表达式,其形式较为简洁。具体推导如下:将被积函数中的损失函数用平方损失代入上式,有当样本固定时,是一个常数,因此可以对每一个选的值使
达到最小,也即选使达到最小,将它对求微商,令其微商为0,得即可见,参数在平方损失函数最小的准则下,其bayes点估计值为对的条件期望。
[0043]
对复杂系统成功率的评估中,数字仿真的次数可以达到真实实验的成千上万倍,高逼真度的小样本信息是否会被大样本信息覆盖,是衡量一个评估方法优劣的重要依据。下面对本评估方法是否真正解决“淹没”问题进行仿真验证,即固定半实物仿真实验、外场静态实验、真实实验的实验数据(包括实验次数和成功次数),通过依次增大蒙特卡洛仿真实验次数,来观察复杂系统成功率的最终估计值。蒙特卡洛仿真次数变化范围为 次(增大步长取 ),成功次数从成功率为 的二项分布中抽取。仿真参数设置如下表所示。
[0044]
从表中可以看到,随着蒙特卡罗仿真试验次数的逐渐增大,复杂系统成功率的最终估计值逐渐增大,特别是200次变化到2000次时增大幅度更为显著。而当仿真次数增大到5000次时,成功率的最终估计值基本稳定在0.786附近,而不会趋近数值仿真实验的成功率90%。可见,基于序贯多层融合的估计方法能够较好的控制在复杂系统成功率评估中数值仿真实验数据“淹没”真实实验数据的问题。
[0045]
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1