一种云模型相似度的分析方法与流程

文档序号:14748369发布日期:2018-06-22 05:46阅读:1190来源:国知局

本发明涉及安全系统工程,特别是涉及云模型相似度比较和评价对象的相似度比较。



背景技术:

随着国民经济的发展,科技的进步,国家在重视人们的基本需求外,对生产生活的安全性提出了更高的要求。制订了一系列与安全相关的法律法规,要求对特定行业,如:危化、矿山、建筑等,从立项、建造、运营,甚至废弃等环节进行安全评价。

对于目前的安全评价而言,工程上多数使用安全检查表的形式完成。其优点是编制简单,操作方便,但使用安全检查表的效果在很大程度上取决于实施者的经验和学识。另一方面在学界,对于安全评价问题提出了各种解决方案。可分为如下两类:1)评价指标和与之对应的算法。该类安全评价解决方案弱化了指标体系的作用,而主要集中在提出和改进现有的评价算法上。而算法要适应定性与定量的耦合、人的主观与客观的耦合等诸多条件,这样使得算法不断地向复杂方向发展,与实际工程应用水平程度相距逐渐增大。2)基于数据和信息推理的方法。这类方法基于现场给定的定性及模糊的信息进行逻辑推理,力求将信息中的相关知识分离出来,进行化简、推理和关联,利用这些知识来确定被评价系统的安全性。但现场的数据是有限的,很难形成证据链的推理过程,而且受到推理方法的限制,应用很少。

特别是对于机理不明确,认识不足的自然灾害问题,上述方法更加难以实现。分析这样的灾害问题主要是通过专家实地考察,然后进行现场会议磋商而确定的。那么由此带来的问题是由于专家个人知识和经验的差异,对于同一个问题会有不同的认识。多位专家给出的评判结果可能相互支持,也可能既有联系又有区别,甚至是对立的。那么对于这种具有定性和定量、模糊性和随机性、不确定性等特点的评价信息的处理,对于安全评价工作是至关重要的。因为这些问题实际存在于数据的分析过程中,所以是不能被忽略的。

对于具有这种特征的信息和数据,可以使用云模型进行表示。云模型是李德毅院士于20世纪90年代提出的一种能用定性语言与定量数值描述不确定性转换的模型,其应用实效得到认可和推广。云模型作为定性定量转换的不确定性模型,能够充分体现语言概念的随机性和模糊性,是实现定性定量转换的有效工具,其中云生成器是其实际应用的关键。云模型构造和参数设置特点正满足了处理上述信息的要求。

另外,在评价过程中可能出现这种情况,多位专家对于同一问题的看法虽然大体上一致,但随机性和模糊性却差别很大。从云模型的角度出发可描述为多位专家对同一问题的评判形成了多个云模型,这些云的最能够代表定性概念的点相差无几(云的位置基本相同),但是云滴的取值范围和云的厚度是有差别的(云的形状不同)。这些云可能重叠,可能包含,也可能分离。那么对于同一概念的多个云语义如何化简也是必须要处理的问题。

使用云模型来表示安全评价中的不确定信息,并提出一种基于包络线的云模型相似度确定方法,最终根据相似度来对专家的评价语义进行化简。



技术实现要素:

1云模型的基本概念和相似性算法

1.1云模型及其数字特征

设U为一个用精确值表示的定量论域,C为U上的定性概念,若定量数值x∈U,且x是定性概念C的一次随机实现,x对C的隶属度μ(x)∈[0,1],是具有稳定倾向的随机数μ,即,,。则x在论域U上的分布称为云记为C(x),每个x称为一个云滴(x,μ(x))。

云的数字特征反映了定性概念的定量特征,用期望Ex、熵En和超熵He表征,记为C(Ex,En,He)。期望Ex表示论域空间最具代表性的定性概念值,反映了论域空间的中心值。熵En是定性概念模糊性和随机性的综合度量,一方面反映了论域空间中可被定性概念接受的云滴的取值范围,另一方面又能反映云滴的离散程度。超熵He描述熵的不确定性度量,反映了论域空间中云滴的凝聚程度,He越大,云滴的厚度就越大。

1.2云发生器

生成云滴的算法或硬件称为云发生器,包括正向云、逆向云、X条件云和Y条件云发生器。正向云发生器实现了预言值表达的定性信息中获得定量数据的范围和分布规律,具有前向、直接的特点。逆向云发生器是将一定数量的精确数值有效转换为恰当的定性语言值,具有逆向、间接的特点。这里采用正向云发生器,其生成所需数量的云滴过程如下:

1)生成以En为期望,He为标准差的正态随机数En′;

2)生成一个以En为期望,En′的绝对值为标准差的正态随机数xi,xi称为论域空间U的一个云滴;

3)计算,则关于C的隶属度。

4)循环1)~3),生成n个云滴,则停止。

1.2云模型相似性算法

目前主要的云模型相似性算法有如下研究成果。刘常昱等提出基于云滴距离的相似度度量方法,该方法可以表示云模型的相似性,但其计算的相似性结果与云滴的数量有直接关系,且消耗的资源较大。张勇等对上述算法进行了改进,提出一种基于区间的云相似度算法,该算法在计算精度以及计算消耗上都有较大的优化。蔡绍滨等将云模型的数字特征作为向量,利用夹角余弦来衡量云模型间的相似度问题,虽在协同过滤算法中效果较好,但其过程中经常出现云期望值远大于熵和超熵,而使熵和超熵的作用被忽略。李海林等提出了两种正态云模型相似度计算方法,以期望曲线相似程度或最大边界曲线的相似程度对正态云模型相似度的定量表示。但该方法完全忽略了超熵的影响,波动程度不能刻画。

另外,虽然改进了云模型的相似性计算性能,但始终摆脱不了云滴数对相似性的影响。而在实际的安全评价中,云滴相当于专家对于一个具体工况给出的意见。一般情况下专家都是针对最具代表性的极端情况给出评价意见,而在这些极端情况之间的工况则由工作人员自行归类。也就是说这种情况下的云模型中的云滴都是靠近云模型边缘的,而在模型内部较少。这种情况显然使用上述方法处理是不适合的。

2基于包络线的云相似度计算

针对上述安全评价中的专家评价语义特点,提出一种基于包络线的云模型相似计算方法。方法大体可分为6步,下面给出这6步,并在其中进行了相应的解释工作。

1)两个云,通过正向云发生器,各产生一定数量的云滴。

2)对两云生成的云滴进行筛选。对于,保留落在中的云滴;对于,保留落在中的云滴。

3)对筛选后的上述两组云滴按照横坐标从小到大排序,分别得到有序的云滴集合和。

4)确定包络线参数。

根据云模型中云滴的生成特点,正向云发生器是一个指数函数,即。μ为x的确定度,即隶属于某种语义的程度,。所以,所生成的包络线函数的函数值在[0,1]之间,定义域在。

对于μ中参数确定,可为第一步中的云特征参数;为的均值,即期望值,这里用代替。

为了摆脱云滴数量对云相似度的影响,利用包络线来计算云相似度。根据上述云滴的形成特点分析,无论云模型参数带有怎样的随机性,其,,且通过生成。那么总是存在两条与μ函数形式相同而参数不同的同构曲线。第一条同构曲线使得云滴集合中所有云滴横坐标对应该曲线值均大于的云滴纵坐标值;第二条同构曲线使得云滴集合中所有云滴横坐标对应该曲线值均小于的云滴纵坐标值,即这两条曲线包络了的所有云滴。第一条曲线称为上包络线,第二条曲线称为下包络线。和与μ的形式一样,而参数是有差别的。

这里主要考虑两个方面,即云的位置和形状。如果这两个参数相同,那么云是相同的。对于云的位置,其特征参数就可表明。无论是正向还是逆向,给出云滴分布后是较容易判断的。所以和中的直接使用第一步中的云特征参数。对于,正向云发生器中定义为。式中直接采用第一步的云特征参数。,其使云滴均匀分布在μ曲线的两侧,所以对于确定包络线是关键的。对于,;对于,。采用第一步的云特征参数。

5)求和的包络线。

和与的形式一样,设

,其中,。使得所有(首次满足条件的),表示云中的一个云滴,分别表示云滴的横纵坐标。同理,设,其中。使得所有。所以确定-和就是要确定适当的。

通过MATLAB结合具体的云滴集合及上述函数结构,循环,当首次满足条件时和可求。

6)利用包络线的云相似度求法。

与以往的云相似度求法不同,该方法对于云滴的依赖性不强,主要是通过包络线积分实现的。对于某一个云而言,当云滴集合中的云滴数时,云滴将填满和之间的区域。也就是,当时,云滴存在的区域面积,其中。

两个云是否相似可以等效的看作当和中的云滴数时,的重合程度。下面以两个云比较为例定义并说明相似度求法。

对于云,

式中:和分别是根据第5步中确定的。

对于云,

式中:和分别是根据第5步中确定的。

当时,设的重叠部分为。即当时,云滴集合所填充的区域。对于的求法是通过分段积分完成的,分段的断点为定义域端点和曲线之间的交点。

显然两云比较的顺序不同,得到的相似度也是不同的。设相似度表示云与云的相似程度。

这种云的相似度计算实际上带有一定的云模型表示语义的特征。比如表示两种语义的云与云,如果的包含的,即,那么说明包含的语义概念范围可以表示的概念,,所以可以表示所表示的概念。这种情况下对于而言,的概念只是包含概念的一部分,,所以不能表示所表示的概念。上述情况的结果就是在语义分析中将表示的语义概念化简去掉。

所以可总结两云模型比较的四种情况:

1)如果,则两个云表示的语义概念相同,两个语义概念化简为一个概念。

2)如果,,在语义分析中将表示的语义概念化简去掉。

3)如果,则两个云表示的语义概念既有相同部分也有不同部分。可通过云合并的相关方法合并语义,进而化简。

4)如果,说明两个语义完全不同,不能进行化简。

附图说明

图1评价语义云模型;

横坐标表示稳定岩层距顶板表面的距离,单位为米(m),纵坐标表示中度风险确定度;T1表示专家1语义评价得到的云滴,T2表示专家1得到云滴的上包络线,T3表示专家1得到云滴的下包络线,T4表示专家2语义评价得到的云滴,T5表示专家2得到云滴的上包络线,T6表示专家2得到云滴的下包络线,T7表示。

具体实施方式

首先给出巷道冒顶问题的相关研究,具体工况及两位专家对巷道冒顶风险问题给出了评定意见。

巷道冒顶是多因素共同作用造成的,因此要寻找主要因素进行分析。确定锚杆锚索支护参数时,锚固应到具有一定厚度的稳定岩层中,以保证锚固效果,因此稳定岩层距顶板表面的距离和稳定岩层的厚度是应该考虑的主要因素。巷道的跨度影响顶板稳定性,跨度过大会使顶板岩层跨落,而跨度较小不能满足生产需要,因此巷道跨度是主要考虑的因素之一。顶板岩石抗压强度影响顶板稳定,顶板岩石的抗压强度表征了顶板岩层的承载能力,所以其也是要考虑的主要原因之一。顶板出现渗水反映了顶板的整体稳定性较差,更容易出现冒顶事故。综上得到了影响巷道冒顶的指标:1)稳定岩层距巷道顶板表面的距离D/m;2)地下水渗水量K1,取隧道每10延米长度在1分钟内的渗水量大小;3)巷道的跨度L/m;4)稳定岩层厚度H/m;5)顶板岩石的抗压强度Rc/MPa。

根据部分学者研究成果,把巷道冒顶风险等级作为评语层,分别用低度风险()、中度风险()、高度风险()和极高风险()来表示,如表1所示。

表1巷道冒顶风险指标及分级

某煤矿处于辽宁调兵山境内。四周城市均距离比较近,铁岭市位于其东面35km。矿井田总面积大约是23.0432km2,其东西向长度约为4200m,南北方向上长约5350m。

聘请两位专家对该矿冒顶风险进行评价。这里为说明上述云相似算法和语义化简过程,仅对专家评价中稳定岩层距巷道顶板表面距离的中度风险语义进行分析。两个专家分析了矿区实际工况,给出了该语义的云模型,样本云滴为200个,如图1所示。

根据3)和4)步的论述,4条包络曲线分别为:

。那么,

,得。

,这说明两位专家对于该问题的看法既有联系又有区别,可通过进一步处理将两者综合在一起。由于篇幅所限,其他三种情况不在此举例。

由于云模型中云滴的生成特点,正向云发生器是一个指数函数,即。本算法的优点在于不依赖于云滴数。由于以往的云相似度比较多依赖于云滴之间的计算,所以云滴数的变化对于相似性有明显影响,特别是当云滴数较少时影响更为严重。

因为本文算法是基于包络线的,主要矛盾集中在如何处理包络线的问题上。对于一个云而言只有上下两条包络线,而包络线是指数函数,这样只需要3个点便可确定一条包络线。所以,理论上计算云相似对于一个云模型只需要6个点即可。

当然由于点是随机分布的,最初的6个点并不一定能反映云滴的最大离散特征和与核函数的距离。但当云滴数增大时,该算法的优点就很明显了,因为包络线内部云滴数的增加对相似度精确性是没有贡献的,所以相似度会很快收敛。

另一方面,该算法的计算量很小,主要是寻找包络线时的计算。这里根据云滴形成的特点,在范围内,设,根据上下包络线满足的条件求即可得到包络线。对于分成了10次计算,对于一个云,确定两个包络线,相当于遍历所有云滴20次。由于算法所需云滴数很少,所以计算量也较少。的计算次数不易过少或过多,如果较少所形成的包络线与云滴的差别就会较大;相反如果过多那么遍历的云滴次数就会增加,消耗成本较大。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1