基于三元决策图的容错系统通用分析方法与流程

文档序号:11155824阅读:396来源:国知局
基于三元决策图的容错系统通用分析方法与制造工艺

本发明涉及一般容错系统的可靠性分析领域,具体来说是一种基于无关覆盖模型的三元决策图可靠性分析方法



背景技术:

容错系统被广泛应用于可靠性领域,常用于关键领域例如核电站,空间站,航天器和大型数据存储系统等。然而,在传统的覆盖模型中,如果某些故障组件没有能被检测出,那么该系统就无法针对该故障进行替换,系统也无法通过重构进行自我修复。除此之外,这些未被检测出来的故障组件可能会污染(比如软件病毒感染,缺陷指令)或影响其他正常的组件从而导致整个系统的故障。

于对覆盖模型完整性的考虑,当对容错系统进行可靠性分析时有必要去考虑这种没有被检测到位的故障组件。因此,不完全错误覆盖模型应运而生。这是一种包含未检测出的故障组件的覆盖模型,它将故障分为两种:一种为覆盖的故障(能够被检测的),另一种为未覆盖的故障(无法被检测的)。在发生覆盖的故障时系统会自动用备件替换进行自我修复,除非备件被完全消耗或无备件替换时才会导致整个系统的故障;一旦未覆盖的故障发生则直接导致整个系统故障。经过多年的发展,不完全错误覆盖(以下称不完全覆盖模型)被广泛的认可并应用于实践。但是,不完全覆盖模型过度关注于系统组件的故障问题而忽略了系统中组件之间的关联性问题(以下称为系统关联性)。

系统关联性是指系统中的组件相互关联共同影响系统。但是在大量的实际应用中,很多初始关联的系统在运行过程中由于某些组件的覆盖故障导致另一些组件与系统失去关联,例如对图4的故障树模型F=(x1+x2)(x3+x4),当组件x1发生覆盖故障时,组件x2与系统失去关联F(x1=1)=(1+x2)(x3+x4)=x3+x4。如果放任这些无关性组件,则会对当前系统留下一定的隐患。无关性组件也有发生未覆盖故障的风险,而传统的不完全覆盖模型并不能规避这些风险根据不完全覆盖模型,任何组件发生未覆盖的故障则直接导致系统失效。



技术实现要素:

本发明的目的在于:克服现有不完全覆盖模型无法检测系统无关性组件的缺陷,提出一种通用的三元决策图在兼顾传统的不完全覆盖模型的基础上适用于无关性覆盖模型,这种方法还能适用于各种条件下的覆盖模型并能在一定程度上提高系统的可靠性,加快系统可靠性的分析效率。

为实现上述目的,本发明所设计的基于三元决策图的容错系统通用分析方法,其特殊之处在于,包括如下步骤:

1)构建基于系统的故障树布尔表达式模型f,其中包括n个系统组件xi,i、n为自然数,且i=1~n;

2)构建所述每个系统组件xi的最小无关触发布尔表达式G(xi);

3)构建所述最小无关触发布尔表达式G(xi)的二元决策图;

4)根据所述二元决策图计算每个系统组件xi的无关触发布尔表达式的最小蕴含式PI(xi);

5)构建故障树布尔表达式模型f的最小割集

6)根据所述系统组件xi的无关触发布尔表达式的最小蕴含式PI(xi)和最小割集求每个系统组件xi发生故障时导致的无关组件为系统组件xi发生覆盖故障;

7)将所述步骤6)的结果代入系统无关性覆盖模型ICM,得到无关性覆盖表达式ficm

8)根据所述无关性覆盖表达式构建三元决策图,并根据所述三元决策图对系统做定性与定量分析。

优选地,所述步骤6)中系统组件xi发生故障时导致出现的系统无关组件的计算方法为从所述系统组件xi的无关触发布尔表达式的最小蕴含式PI(xi)中去除与所述最小割集中相同的元素,并去除含非式子,得到系统组件xi发生故障时导致出现的系统无关组件

优选地,所述系统无关性覆盖模型为其中ficm为系统无关性覆盖表达式,最小割集为系统组件xi发生覆盖的故障,xi为系统组件xi发生未覆盖的故障。

优选地,所述系统无关性覆盖模型ICM的构建方法为:

71)取系统表达式f的最小割集

72)取由系统组件xi发生覆盖故障导致的无关性组件

73)对所述步骤72)的结果做取非操作得到非无关组件

74)取系统组件xi未覆盖的故障xi和所述步骤73)中非无关组件的合取式

75)取整个系统中所有组件的析取式

76)将所述步骤71)的结果与步骤75)的结果析取即为无关性覆盖模型表达式

优选地,所述步骤8)中构建三元决策图的方法如下:

81)确定三元决策图的三个逻辑分支依次代表:无故障的状态、发生覆盖失效状态和发生未覆盖的失效状态;

82)确定三元决策图有三个基本事件分别对应无关性覆盖模型表达式的三种状态:覆盖故障,未覆盖故障和非覆盖故障;

83)对三元决策图的故障树做深度优先搜索,得到故障树结点的排列顺序并从左到右赋索引值0,1,2....n,根据索引值合并三元决策图。

优选地,所述步骤83)中合并三元决策图的规则为普通布尔与或运算。

本发明的主要思想如下:

在对某个容错系统进行可靠性分析时,既要考虑未覆盖的故障也需要兼顾整个系统的关联性(在系统某一状态下是否存在无关性组件),这样才能较为完整的分析整个系统从而提高系统的可靠性。然而无关性组件的检测与一般的故障(覆盖故障)检测是完全不同的,如果不能用一种有效的通用方法兼顾,则在很大程度上降低系统的可靠性分析的效率。因此,本发明将其两者有机的结合,提出了一种通用的三元决策图既可以针对无关性覆盖模型又可以应用于传统的不完全错误覆盖模型。

本发明与现有技术相比优点在于:

(1)本发明应用于容错系统的可靠性分析,解决了传统不完全覆盖模型无法隔离无关性组件的问题,并可以处理含非事件,大大降低了系统面临的风险,提高了系统的可靠性。

(2)现有的三元决策图一般都是基于不完全错误覆盖模型,其基本事件(叶子结点)并不能完整的描述无关性覆盖模型,且无法描述含非事件,例如:无关性覆盖模型表达式中的非覆盖故障,本发明运用集合论将含非事件做等价转化为一系列不含非事件的组件,从而有效的解决了这一实际问题,并能完美的分析无关性覆盖模型。

(3)本发明具有更好的普适性,其三元决策图的基本事件可以扩充至6种,涵盖系统组件所有可能的状态如图5所示(正常、覆盖故障、非覆盖故障、未覆盖故障、非未覆盖故障,故障=覆盖故障+非覆盖故障),既可以针对无关性覆盖模型也可以对传统的不完全覆盖模型也可以做出精准的分析(当系统处于一直关联状态即),即是一个通用的解决方案。

附图说明

图1为本发明中三元决策图,图中三个基本事件从左到右依次表示:覆盖故障基本事件、未覆盖故障基本事件和非覆盖故障基本事件。

图2为本发明中三元决策图的中间事件的一般表达式。

图3为本发明中三元决策图中的运算规则。

图4为实施例中系统的故障树模型。

图5为本发明中三元决策图能够扩展的6个基本事件第一排从左到右依次为:覆盖故障基本事件、未覆盖故障基本事件和非覆盖故障基本事件。第二排从左到右依次为:完全故障基本事件(覆盖+未覆盖)、非故障基本事件和非未覆盖故障基本事件。

图6为实施例中系统基于无关性覆盖模型的三元决策图。

图7为实施例中基于不完全错误覆盖模型的三元决策图。

具体实施方式

为了能够更好的理解本发明,首先对本发明中涉及的概念作简单的介绍:

三元决策图:二元决策图的一种扩展,含有三条互斥的边,包含中间结点与叶子结点并由叶子结点按照一定的逻辑规则自底向上构造而成。

故障树:一种表达系统失效的倒立树形模型,通过对系统失效原因向下逐层展开、直至无需或无法继续展开的基本部件为止而建立的模型。

最小割集:可靠性统计的基本概念,通常指导致系统整体失效的一组(一个或多个)故障组件的最小集合。

不完全覆盖模型:相对完全覆盖模型而言,包含了一种未覆盖的故障,这种故障可以直接导致整个系统失效。

无关性覆盖模型:相对不完全覆盖模型而言,包含了对无关性组件的处理,意味着单纯的未覆盖故障不一定导致整个系统失效除非当前故障组件是一个相关组件。

无关性组件:当前组件是否失效并不影响到其他组件或整个系统正常运作。

最小无关触发(MIT):Minimal irrelevant trigger,设f为当前系统的布尔表达式,x为当前系统组件,MIT[x,f]表示为由组件x失效(一般为覆盖故障)导致的无关性组件的最小集合(不包含f的最小割集与含非子式)。

无关性覆盖模型是一种考虑无关性组件的不完全覆盖模型。此模型既考虑了未覆盖的故障也兼顾了系统的关联性。利用最小无关触发(MIT,minimal irrelevant trigger)公式得出系统的无关性组件,依据无关覆盖模型将整个系统的失效归于两个部分:1)由覆盖故障组件组成的系统最小割集。2)非无关性组件的未覆盖故障。

以下结合附图和具体实施例对本发明作进一步的详细描述。

图4为某一系统的故障树模型,其故障树表达式为f=(x1+x2)(x3+x4),该系统由2个或门和1个与门组成。2个或门下面分别对应四个组件x1,x2,x3,x4

步骤1)构建基于系统的故障树布尔表达式模型f=(x1+x2)(x3+x4),其中包括n个系统组件xi,n=4,i=1,2,3,4。

步骤2)构建每个系统组件xi的最小无关触发布尔表达式G(xi)。G(x1)最小无关触发计算过程为:同理计算x2x3,x4的最小无关触发布尔表达式G(x2)、G(x3)G(x4)。

步骤3)构建最小无关触发布尔表达式G(x1)的二元决策图;

步骤4)计算系统组件x1的无关触发布尔表达式的最小蕴含式

步骤5)取故障树布尔表达式模型f的最小割集且该最小割集均由覆盖的故障组件组成,

步骤6)从系统组件x1的无关触发布尔表达式的最小蕴含式中去除与最小割集中相同的元素,并去除含非式子,得到系统组件x1发生故障时导致出现的系统无关组件为系统组件xi发生覆盖故障,。

重复步骤3)~6),计算系统组件x2、x3、x4发生故障时导致出现的系统无关组件,其结果分别为:系统组件x2发生故障时导致出现的系统无关组件系统组件x3发生故障时导致出现的系统无关组件系统组件x4发生故障时导致出现的系统无关组件

步骤7)将上述的计算结果代入无关性覆盖模型表达式中(xi表示组件xi的未覆盖故障的概率),其结果为:

上述系统无关性覆盖模型ICM的构建方法为:

71)取系统表达式f的最小割集(基于覆盖故障)

72)取由系统组件xi发生覆盖故障导致的无关性组件

73)对所述步骤72)的结果做取非操作得到即非无关组件;

74)取系统组件xi未覆盖故障概率xi和所述步骤73)中非无关组件的合取式

75)重复步骤74)取整个系统中所有组件的析取式

76)将所述步骤71)的结果与步骤75)的结果析取即为无关性覆盖模型表达式

步骤8)针对无关性覆盖模型表达式ficm构建如上述三元决策图,如图6所示。构建三元决策图的具体方法如下:

81)确定三元决策图的三个逻辑分支代表:无故障的状态,发生覆盖失效状态,发生未覆盖的失效状态(三种状态基于传统的不完全错误覆盖模型)分别称为“0”边,“1”边,“2”边。

82)确定三元决策图有三个基本事件分别对应无关性覆盖模型表达式的三种状态:覆盖故障,未覆盖故障和非覆盖故障。这三种基本事件即为当前三元决策图所对应的三种最小子图,其最小子图的叶子取0,1两种值,1表示对应当前状态发生,0表示对应当前状态未发生,如图1从左到右依次为:覆盖故障最小子图、未覆盖故障最小子图、非覆盖故障最小子图。

83)确定三元决策图的一般中间结点F如图2所示,表示当前系统状态,其中X表示当前三元决策图所对应的布尔表达式中某个变量x,与系统组件xi相对应,三条边从左到右分别表示当X未发生故障,发生覆盖故障,发生未覆盖故障时所对应的子图(布尔子表达式),即当前系统组件xi的三种状态F0,F1,F2。

84)对三元决策图所对应的故障树做深度优先搜索,得到一组故障树结点(对应布尔表达式的变量)的排列顺序并从左到右赋索引值0,1,2....n,根据这个索引值合并三元决策图,其规则为两个三元决策图中索引值较小的结点即为合并后新三元决策图的结点,然后结点索引值较小的三元决策图的叶子结点分别与索引值较大的三元决策图进行二次合并,如此反复直到最后出现最小子图,与最小子图的叶子结点合并规则为普通布尔与或运算如图3(Y也为变量,与系统组件xi相对应,X索引值小于Y)。如果两边索引相同,则合并后新的三元决策图的结点取原来任意的三元决策图结点,两个三元决策图的分支进行对应的合并,即左边三元决策图“0”分支叶子结点合并右边三元决策图的“0”分支的叶子结点,同理合并“1”分支,合并“2”分支,然后再根据索引值大小继续合并直到最终叶子结点均为“0”,“1”。

85)其三元决策图构造思想始终基于无关覆盖模型。

步骤9)如果要兼容传统的不完全覆盖模型则可以令(i=1,2,3,4),表明系统一直处于关联状态任何状态下不存在无关性组件。则该系统组件xi的不完全覆盖模型表达式则变为:构建如上述三元决策图,如图7所示。

设组件xi发生覆盖故障的概率发生未覆盖故障的概率xi=0.01。则上述系统基于无关性覆盖的不可靠性计算结果,基于传统不完全错误无盖的不可靠性计算结果(与传统的SEA方法计算结果一致)见表1。

表1基于无关性覆盖与传统SEA方法计算不可靠性结果对比

该实例可以拓展到大型容错系统的可靠性分析,并通过计算机软件,进行快速分析,为分析人员提供辅助,提高分析效率。

以上所述,仅为发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1