基于扩展多属性决策的诊断预测数据和特征再认知方法

文档序号:26942820发布日期:2021-10-12 17:15阅读:264来源:国知局
基于扩展多属性决策的诊断预测数据和特征再认知方法

1.本发明涉及一种故障诊断知识和预测知识提取方法,特别涉及一种基于扩展多属性决策的诊断预测数据和特征再认知方法,属于一种基于扩展型标签化多属性决策生成故障诊断预测数据的方法。


背景技术:

2.标签化多属性决策(lmadm)是一种专门为带有标签的数据集提出的决策理论。决策系统中的决策属性(即标签)仅为实例提供了一些粗略的分类信息,通常根据给定的实际情况手动设置或校准这些信息。标签化多属性决策是多属性决策(madm)的一种特例,二者的区别在于lmadm比madm的应用系统中多了决策属性(标签)的辅助作用。标签化多属性决策的本质是通过挖掘条件属性和决策属性之间的依赖关系而得出更进一步的推断决策信息,如决策属性的排序信息和新样本数据的归属问题。正是由于这种特殊的功用使得标签化多属性决策非常适用于故障预测和健康管理(phm)中的诊断和预测问题研究。其中,用于故障预测的知识本质上是分析数据的梯度关系,即一种时序性的排序关系;用于故障诊断的知识本质上是分析数据的区分性关系,即一种样本的归属关系。因此,本发明将标签化多属性决策理论应用于故障诊断和预测知识提取中。
3.然而,值得注意的是,现有的标签化多属性决策理论的研究将重点落在了条件属性赋权和集结算子的改进和应用中,尝试使用各种数据刻画手段及人工干预手段,实现更精准的条件属性赋权和集结运算。但是,随着phm应用对象的日益复杂化和体系化,phm系统采集的测点和获取的数据也呈现了激增的趋势。海量数据中蕴藏着丰富的可用于phm实践的知识,如何在海量测试数据中应用标签化多属性决策理论提取用于故障诊断和预测的知识是现阶段装备phm应用亟待解决的难题。上述难题是本发明重点解决的问题,在原始的标签化多属性决策理论基础上进行扩展,以应对海量数据对phm应用带来的挑战,实现在海量数据条件下提取有效的故障诊断知识和预测知识。


技术实现要素:

4.本发明旨在解决两个方面的问题:工程应用方面,解决海量数据条件下故障诊断和预测的知识提取不便的问题;理论方面,解决标签化多属性决策不能有效挖掘数据隐藏知识和应对海量数据挖掘的问题。
5.本发明的一种基于扩展多属性决策的诊断预测数据和特征再认知方法包括:
6.将用于检测设备故障的传感器定义为扩展多属性决策数据模型的条件属性,将设备典型故障模式或状态定义为扩展多属性决策数据模型的决策属性,典型故障模式或状态可以是从知识库中获取的数据集,或者根据检验得到的数据集;
7.根据所述决策属性与条件属性间的依赖关系进行条件属性子集选择,以便从多个用于检测设备故障的传感器中筛选出有价值的传感器(即,对故障诊断起到关键作用的传感器)集合;
8.为选择出的条件属性子集中的每个条件属性分配权重,得到条件属性子集中每个条件属性的属性权重;
9.将所述条件属性子集对应的传感器采集的且进行数据预处理的数据样本和条件属性子集的属性权重输入到相应的故障诊断模型(即,已知的任何一种故障诊断模型)中,对设备故障进行诊断。同样地,对于决策属性为设备状态的数据集,则将条件属性子集数据和权重输入到相应的预测模型,对设备未来状态进行预测。
10.优选地,进行数据预处理的数据样本是不改变原始数据空间结构的归一化数据样本。
11.优选地,对于传感器采集的随时间单调减少的数据样本,采用收入归一化模型将数据样本缩放到[0,1]。
[0012]
优选地,对于传感器采集的随时间单调增加的数据样本,采用成本归一化模型将数据样本缩放到[0,1]。
[0013]
优选地,扩展多属性决策数据模型为决策系统ds=(u,c∪d),u={x1,x2,

,x
m
}为一组候选数据集,c={c1,c2,

,c
n
}为条件属性集合, d={d1,d2,

,d
k
}(k≤m)是一组设备典型故障模式或状态。
[0014]
优选地,所述条件属性与决策属性间的依赖关系是指检测设备故障的传感器采集的数据样本与典型故障模式或状态的依赖关系;根据所述决策属性与条件属性间的依赖关系进行条件属性子集选择包括:
[0015]
利用模糊邻域半径δ,确定模糊邻域决策粗糙集模型;
[0016]
利用所确定的模糊邻域决策粗糙集模型,得到用于选取所述条件属性子集的属性约简算法的全局决策风险r和属性重要度sig
risk

[0017]
将所述ds=(u,c∪d)和属性约简参数ζ输入到所述属性约简算法中,将属性约简算法的输出作为选取的条件属性子集。
[0018]
优选地,利用全局决策风险r为选择出的条件属性子集的每个条件属性分配权重。
[0019]
优选地,模糊邻域决策粗糙集模型为;
[0020]
pos={x∈u|p(x|[x]
δ
)≥α},
[0021]
bnd={x∈u|β<p(x|[x]
δ
)<α},
[0022]
neg={x∈u|p(x|[x]
δ
)≤β}(8),
[0023]
其中,pos为正域,bnd为边界域,neg为负域,p(x[x]
δ
)是模糊条件概率;x为数据样本x在决策系统ds中指定归属的类别,[x]
δ
是模糊邻域集合;α,β为一对阈值参数,0≤β<α≤1。
[0024]
优选地,所述全局决策风险r为:
[0025][0026]
其中,λ
pn
,λ
bp
,λ
bn
和λ
np
是损失函数。
[0027]
优选地,基于全局决策风险的属性重要度为:
[0028][0029]
其中,c∈c,c为决策系统中的条件属性集合, r
b
为b的全局决策风险,r
c
为c的全局决策风险,r
b∪c
为b∪c的全局决策风险。
[0030]
优选地,所述条件属性子集中每个条件属性的属性权重w
ci
为:
[0031][0032]
其中,
[0033]
本发明的有益技术效果是,解决了目前海量数据条件下故障诊断和预测的知识提取不便的问题及标签化多属性决策不能有效挖掘数据隐藏知识和应对海量数据挖掘的问题;能够满足海量数据条件下基于数据驱动的故障诊断和预测知识提取的需求。
附图说明
[0034]
图1是本发明的故障诊断和预测知识的技术路线框图;
[0035]
图2是本发明的标签化多属性决策数据模型示意图;
[0036]
图3是本发明的给定决策系统的空间分布示意图;
[0037]
图4是本发明的所有决策属性的分布的示意图;
[0038]
图5是本发明的近似决策属性的过程的示意图;
[0039]
图6是本发明的扩展型标签化多属性决策结果与故障诊断和预测的关系的示意图;
[0040]
图7是本发明的fd001数据的典型分布的示意图;
[0041]
图8是所有选定属性的统计结果的示意图;
[0042]
图9是与80个训练单元有关的每个属性的统计风险的示意图;
[0043]
图10是每种属性的归一化权重的示意图;
[0044]
图11是20个测试单元的加窗分数结果的示意图;
[0045]
图12是窗口分数数据的统计结果的示意图;
[0046]
图13是拟合函数斜率的统计结果的示意图。
具体实施方式
[0047]
本发明目的在于解决phm工程应用和lmadm理论中存在的不足。在phm 工程应用中,随着phm应用对象的日趋复杂化和体系的庞大化,数据的采集点和数量均随之增加。数据的增加为phm中的故障诊断知识和预测知识挖掘带来了困扰。经过分析可知,标签化多属性决策非常适用于诊断知识和预测知识提取。但是,传统的标签化多属性决策由于其理论框架的局限性导致其无法有效应对海量数据条件下的决策制定。因此,本发明在phm领域中可用于处理海量数据条件下的故障诊断和预测知识提取,也可应用在其他的含有分类和排序的决策问题。
[0048]
本文所提出的基于扩展标签化多属性决策的诊断和预测知识提取技术主要由五个步骤组成,通过五个步骤可实现对海量数据的分类和排序知识挖掘,实现良好的分类和
预测结果。技术路线框如图1所示。
[0049]
步骤一、数据预处理:包括解决数据量纲不一致影响的标准化(规范化)处理,用于度量数据不确定性的粒计算。
[0050]
步骤二、属性子集选择:选择一些有助于决策制定的条件属性,构成属性子集。属性子集的选择方法有很多,包括仅考虑条件属性集合的过滤方法、嵌入式方法和包装方法等,以及综合考虑条件属性集合和决策属性的属性子集筛选方法。属性子集的选择是一种np

hard问题,通常应用优化方法或启发式思路实现。
[0051]
步骤三、权重分配:为筛选得到的属性子集中的条件属性分配适当的权重。属性分配的权重包括客观赋权法、主观赋权法以及混合赋权法。每种赋权方法有各自的优缺点及适应性,在具体应用时需根据具体情况选择合理的方法。
[0052]
步骤四、规则提取:在该步骤中,建立的规则类型不受限制。所建立的规则知识主要服务于实际需求。例如,对于诊断问题则建立分类的规则,对于预测的问题则建立排序类规则。所建立的规则集合构建成为规则知识库。
[0053]
步骤五、集结计算:根据实际需求,通过使用一些集结运算符获得决策结果。值得注意的是,集结运算得到的结果一方面可以直接作为决策制定的结果输出,另一方面可作为用于指定决策的规则知识放入规则知识库,结合其他模型完成最终的决策输出。例如,通过简单的加权集结算子得到的集结结果即可作为诊断或预测的判别值,又可作为一种决策参考边界,与分类模型、聚类模型、回归模型结合得到进一步的决策结果。
[0054]
步骤六、输出决策:组织计算结果并将其输出给决策者。结果形式的表达包括图形化表达、定量化表达以及定性化表达,也可给出交互式的结果形式便于决策者做进一步推断。
[0055]
本发明的详细技术方案的流程、步骤和说明如下。
[0056]
1)数据系统及标签化多属性决策数据模型
[0057]
标签化多属性决策理论的研究对象为决策系统,在决策系统中包括两类属性:条件属性和决策属性,这区别于信息系统只包含条件属性集合。决策系统的一般定义如下。
[0058]
决策系统是由一个四元组ds=(u,{a|a=c∪d},{v
a
|a∈a},{i
a
|a∈a})构成,u是一个有限的对象集合,称为论域,u={x1,x2,

,x
m
},a为属性集合, c为条件属性集合,d为决策属性集合(通常只有一个属性组成的决策属性集合,一般地,多个决策属性也可转化为一个决策属性进行研究), v
a
是a∈a的值集,i
a
是一个关于a∈a的信息函数。决策系统(ds)又可简单表示为ds=(u,c∪d)。
[0059]
在给定一个决策系统ds后,则标签化多属性决策理论可落实到具体的数据模型表述如下。u={x1,x2,

,x
m
}为一组候选数据集,c={c1,c2,

,c
n
}为条件属性集合,d={d1,d2,

,d
k
}(k≤m)是一组关于候选数据集的标签, w={w1,w2,

,w
n
}是一组关于条件属性的权重,且w
j
≥0,v=[v
ij
]
m
×
n
是由决策者给出的决策参考矩阵,v
ij
表示候选集样本x
i
关于c
j
的偏好值。对于 phm系统而言,决策者给出的决策参考矩阵v=[v
ij
]
m
×
n
通常是采集得到的数据,包括传感器数据、维修保养阶段记录的数据等。
[0060]
基于上述两个基本定义,可以构建一个二维的标签化多属性决策数据模型的可表示为如图2所示情况。
[0061]
2)扩展标签化多属性决策模型的辩证分析
[0062]
在传统的标签化多属性决策理论中,对条件属性的刻画仅停留在了属性赋权中,这对海量数据集而言难于适用。随着数据量的增加,条件属性个数多大数十甚至数百个以上,属性赋权后会导致条件属性之间的权重在实际计算中差别不大,从而降低了属性赋权的作用。属性子集选择是应对海量数据处理的有效办法,可从海量数据中提取有价值的非冗余数据子集,提高数据挖掘的效率和准确度。因此,本发明采用消融试验的方式,辩证地分析属性赋权和属性子集选择在标签化多属性决策理论中的作用,为提出扩展标签化多属性决策模型奠定基础。
[0063]
对于给定的一个决策系统ds={u,c∪d},c={c1,c2,c3,c4}。为不失一般性, u中的数据以高斯分布为例。决策属性d由具有某种高斯分布形式的数据表示,以反映从知识外延中抽象出来的内涵结果,这符合决策系统建立的初衷。
[0064]
本分析所进行的权重分配和属性子集选择是根据高斯分布形式的相似性确定的,即c
i
(i=1,2,3,4)的分布与d的相似度越大,c
i
的权重就越大,c
i
也将被优先选入属性子集。给定的决策系统如图3(a)和图3(b)所示,其中,图3(a) 为三维视图的数据分布示意图,图3(b)为将图3(a)转换为二维平面的示意图。
[0065]
从图3(a)可以很容易地看出,属性c3的分布呈现了独峰式的分布,这与d 的分布完全违背,c4的数据分布虽然呈现了双峰的分布特点,但峰的位置与d 的尚有差别,而c1和c2与d的分布差别较小。基于此,设计lmadm的四种可行方案如下:
[0066]
1)所有条件属性的平均总和,即算术平均(aa)算子:
[0067]
2)所有条件属性加权求和,即加权算术平均(waa)算子,记为其中w={w1,w2,w3,w4}={0.5,0.3,0.1,0.2}。
[0068]
3)属性子集的平均求和,即子集算术平均(saa)算子:
[0069]
4)属性子集加权求和,即子集加权算术平均(swaa)算子,表示为:其中,w={w1,w2,w4}={0.5,0.4,0.1}。
[0070]
在以上四种方案中,选择的属性子集为c
sub
={c1,c2,c4},是由四种方案产生的近似决策属性的集合。属性权重是根据数据分布的一致性原理设置的,即条件属性与决策属性之间的一致性越强,权重就越大。因此,所有决策属性的分布都可以在图4中描述。
[0071]
从图4的结果可以看出,d1的分布与目标d的分布完全不同,在[8,12] 范围内d2和d3的分布与d的分布不一致。相反,d4的分布比其他分布更理想,因此可以适当地近似目标属性d。这得益于合理选择属性子集和分配适当的权重。
[0072]
因此,从该示例可以看出,数据分布特性的描述不应该仅局限于权重分配,还应包括属性子集选择。因此,如图5所示,可以描述近似决策属性的过程。
[0073]
通过上述的辩证分析可以得出,在标签化多属性决策过程中,属性赋权和属性子
集选择均发挥了很大的重要性。因此,传统的标签化多属性决策仅仅包含属性赋权是不足以充分执行决策的,而且还无法应对海量数据的挑战。所以,本发明综合考虑属性赋权和属性子集选择,得到一种扩展型标签化多属性决策框架,使其更能充分表达数据的本质特征,也能更好地应对海量数据的挑战。
[0074]
3)扩展标签化多属性决策模型
[0075]
扩展型标签化多属性决策模型主要由以下几个步骤计算得到:
[0076]
步骤1:数据规范化处理
[0077]
一般地,为了避免数据的量纲差别带来的数据吞没问题,在执行后续计算前,需要进行数据的规范化处理。数据的规范化处理是将原始数据通过一定的变形公式映射到统一的阈值空间,这种映射不改变原始数据的空间结构。
[0078]
本发明采用成本型和收入型规范化模型将原始数据映射到[0,1]空间。在给定的ds系统中,对于给定的c
j
∈c,采用成本规范化模型(等式(1))和收入规范化模型(等式(2))分别表述如下:
[0079][0080][0081]
其中,v
ij
是归一化元素,max(
·
)和min(
·
)分别是最大和最小算子,即max
j
(v
ij
) 表示第j列中元素的最大值,而min
j
(v
ij
)是第j列中元素的最小值。
[0082]
步骤2:属性子集选择
[0083]
属性子集的选择又可称为特征选择、属性约简。在决策系统中,属性子集的选择往往需要依靠决策属性和条件属性之间的依赖关系而筛选得到。在本发明中,选用擅长进行属性约简的决策粗糙集模型(decision

theoretic rough set,dtrs)。决策粗糙集模型是概率粗糙集模型的一种广义形式,该模型源于三支决策理论,并运用最小贝叶斯风险决策原则得到最终的风险最小化的决策结果。为了实现混合型数据的处理能力,本发明采用擅长处理混合型数据系统的邻域关系模型度量样本间的空间结构。此外,为了更有效地刻画数据的空间关系,在邻域关系的基础上,增加了模糊关系来描述数据之间的不确定性关系。因此,模糊邻域决策粗糙集模型被选用为属性子集选择的手段。
[0084]
对于给定的两个样本x,y,二者的模糊关系可通过欧氏距离描述为:
[0085][0086]
其中,对于符号型属性,如果x
i
=y
i
,则x
i

y
i
=0,反之,x
i

y
i
=1。
[0087]
因此,可得样本的模糊邻域集合表述为:
[0088]
[x]
δ
={y∈u|r(x,y)≥δ}
ꢀꢀꢀꢀ
(4)
[0089]
其中,δ为模糊邻域半径,满足0≤δ≤1。
[0090]
所以,基于上述的模糊邻域关系可得出样本隶属于某个划分x的模糊条件概率,表述为:
[0091][0092]
显然,有0<p(x|[x]
δ
)≤1成立。
[0093]
因此,模糊邻域决策粗糙集模型可表示为:
[0094]
pos={x∈u|p(x|[x]
δ
)≥α}
ꢀꢀꢀꢀꢀ
(6)
[0095]
bnd={x∈u|β<p(x|[x]
δ
)<α}
ꢀꢀꢀꢀꢀ
(7)
[0096]
neg={x∈u|p(x|[x]
δ
)≤β}
ꢀꢀꢀꢀꢀ
(8)
[0097]
其中,pos为正域,bnd为边界域,neg为负域,α,β为一对阈值参数, 0≤β<α≤1。一般地,这一对参数由专家根据实际情况确定。此外,通过决策粗糙集模型推导的一般过程可得一组损失函数,该损失函数矩阵表示为如表1 所示情况。
[0098]
表1损失函数矩阵
[0099][0100]
其中,a
p
,a
b
,a
n
分别为执行将样本划分到正域、边界域和负域。λ则表示不同操作带来的损失值。因此,决策粗糙集中的两个参数也可表示为:
[0101][0102][0103]
利用模糊邻域粗糙集可设计一种基于全局决策风险最小化的属性子集选择策略,全局决策风险可表示为:
[0104][0105]
所以可得基于全局决策风险的属性重要度表示为:
[0106][0107]
其中,c∈c,c为决策系统中的条件属性集合。
[0108]
因此,可利用上述全局决策风险最小化的思想,设计贪婪的启发式属性子集选择算法。
[0109][0110][0111]
属性子集选择的算法包含两个主要循环,第一个循环为增加操作,第二个循环为减少操作。两个操作均以贪婪思想为主,分别选取最佳属性和剔除最差属性。因此,上述算法属于一种启发式属性子集选择方法。
[0112]
步骤3:属性赋权
[0113]
根据公式(9)的全局决策风险可推演得到各个属性的权重,表示为:
[0114][0115]
其中,显然,0<w
ci
≤1。因此,规整后输出的属性权重为且
[0116]
值得注意的是,根据扩展标签化多属性决策基本理论,最终输出的各个条件属性
的权重是针对筛选得到的属性子集而设定的,那些被剔除的条件属性不在考虑的范围内。
[0117]
步骤4:规则提取
[0118]
规则提取环节是将所得到的属性子集选择和属性赋权结果对应规整后存储到知识库中,便于后续直接调取使用。提取的规则在一定程度上还受所应用的对象而适当调整,以适应更复杂的应用场景。
[0119]
步骤5:集结运算
[0120]
集结运算则是利用集结算子将提取得到的规则知识进行合理地融合。经过集结运算后,决策者可利用集结运算结果得到期望的决策依据。最常用的集结算子为加权平均算子(wa):
[0121][0122]
d=v
·
w
t
ꢀꢀꢀꢀꢀꢀ
(13)
[0123]
其中,d∈r
m
×1为决策向量,t为转置运算算子。
[0124]
除上述集结运算算子外,还有算数平均算子(aa)、几何平均算子(ga)、加权几何平均算子(wga)、顺序加权算子(owa)等。
[0125]
步骤6:决策输出
[0126]
决策输出是指决策者根据集结运算结果给出需要的决策结果,在本发明中,给出的决策结果包括诊断结果和预测后的健康状态评估结果。
[0127]
4)故障诊断知识和预测知识的提取
[0128]
在phm技术体系中,故障诊断可等价为机器学习中的模式识别,属于一种分类问题;而故障预测可等价为机器学习中的回归问题,回归问题的本源则需要给出时间序列数据的规律性次序关系。另一方面,对于标签化多属性决策输出的结果而言,主要包含两类结果:样本的分类规则和样本的排序规则。因此,标签化多属性决策的输出结果可完全对应到phm中的故障诊断和预测中。
[0129]
在扩展型标签化多属性决策模型得到的集结输出结果(一种综合计算后得到的指标性结果)之后,可通过判断这种指标性结果的空间关系和时序结构关系得到利于诊断和预测的知识。对于诊断问题而言,应用数据的空间分布越离散、区分性越明显,则越有利于执行故障诊断、诊断结果的准确度越高;对于预测问题而言,应用数据的时序结构偏差越大、单调递变趋势越明显,则越有利于执行预测分析、预测结果的精确度越高。
[0130]
假设通过集结运算得到的指标数据分布如图6所示的4种分布情况,其中,图6(c)(d)的分布具有时序特性。若采用图6(a)(b)两组数据进行故障诊断,在使用相同诊断模型和参数的基础上,则图6(a)得到的诊断结果准确度将更高,因为图6(a)的数据区分性较图6(b)更清晰,更容易区分样本的类别特征。因此,采用图6(a)的指标数据及产生这些数据的过程规则作为故障诊断知识更有利于执行故障诊断。同样,对于预测应用的图6(c)(d)而言,图6(c)的时序数据趋势变化更为显著,更有利于训练模型和执行预测研究,预测结果的精度会更高一些。因此,采用图6(c)的指标数据及产生这些数据的过程规则作为状态预测知识更有利于执行预测问题研究。
[0131]
因此,为获取形如图6(a)(c)所示的指标数据,深入地挖掘数据特性,用最能表现数据本质的方法获取数据本真特征,是满足故障诊断知识和预测知识提取的关键。而本发
明所提出的扩展型标签化多属性决策模型正是基于这种充分挖掘数据本质特征的思想进行数据挖掘和决策制定运算的,因而更适用于诊断和预测知识提取研究。
[0132]
对于故障诊断和预测知识提取技术而言,本发明所提出的扩展型标签化多属性决策的6个步骤即可作为知识提取的主要步骤,输出得到的指标结果即可运用到诊断模型和预测模型的训练和测试中。
[0133]
具体实施案例
[0134]
对由燃气轮机仿真平台产生的多个时间序列信号组成的c

mapss数据集,进行故障诊断和剩余寿命预测研究。该数据集包含四类数据,分别代表不同的故障和运行状态。其中,由fd001表示的第一类数据是最常用的数据,包括100 个单位和20631个样本,我们将fd001数据集用作实验对象,并以前80个单元为训练集,后20个单元为测试集。
[0135]
故障诊断的实质可以等同于分类问题:使用的样本之间的差异越大,诊断结果将越准确,反之亦然。对于剩余寿命预测,时间序列数据的连续单调性越明显,预测越有利。因此,选择以下两个指标作为评估lmadm的标准:
[0136]
1)样本的差异;
[0137]
2)时间序列样本的连续单调性。
[0138]
对c

mapss数据集使用基于扩展lmadm的基本步骤如下,其中辅助参与运算的是模糊邻域决策粗糙集:
[0139]
步骤一、数据预处理
[0140]
fd001数据集的典型分布如图7所示。fd001数据集具有三种典型的分布特征。第一个随时间单调减少(参见图7中暖色突出显示的线),第二个随时间单调增加(参见图7中标有冷色的线),第三个是与时间无关的常数(参见图7 中的红色直线)。
[0141]
因此,对于以第一类分布为特征的样本(传感器id:7、9、12、14、20、21)使用收入归一化模型(公式(2))用于将样本缩放到[0,1]。相反,成本归一化模型(公式(1))用于具有第二种分布类型(传感器id:2、3、4、8、 11、13、15、17)的样本。具有第三种分布类型(传感器id:1、5、6、10、16、 18、19)的样本的预处理与两个规范化模型无关。
[0142]
步骤二、属性子集选择
[0143]
原始给定的c

mapss数据集不包括其相应的标签。我们先将每个发动机的寿命分为三个状态,即健康状态,退化状态和故障状态,每个状态具有相等的样本。
[0144]
然后,我们使用δ=0.95和ζ=0.2的基于模糊邻域关系的简单三参数决策模型从80个训练单元的数据中选择有价值的属性(燃气轮机传感器),统计结果如图8所示。从图8可以看出,传感器17的选定时间最多,最多为55次。但是,恒定类型传感器(传感器id:1、5、6、10、16、18、19)的选定时间为0。
[0145]
因此,根据图8中所选属性的统计结果,我们最终选择概率大于25%选中的那些属性,即,选择大于20次(80
×
25%)的那些属性。因此,将id为3、8、 13和17的传感器选择为属性子集中的传感器。
[0146]
步骤三、权重分配
[0147]
获取关于15个训练单元的每个属性的统计风险,如图9所示。
[0148]
通过比较结果在图8和图9,可以看出虽然传感器选择17次数最多的,它还带来了相对较高的风险,除了这些传感器(传感器id:1、5、6、10、16、18、 19)产生恒定值的样本。这
表明传感器17的重要性不仅取决于风险,还取决于被选择的概率。因此,每个属性的权值应该表示为:
[0149][0150]
其中w
risk
是风险产生的权重,w
reduct
是属性的选定次数产生的权重,n
c
是属性c的次数,c∈c。
[0151]
因此,每个属性的归一化权重可以在图10中表示。所选属性的权重可以归一化为{w
c3
,w
c8
,w
c13
,w
c17
}={0.1948,0.1889,0.2239,0.3925}。
[0152]
步骤四、规则提取
[0153]
对于故障诊断,可以将提取的规则存储为用于故障检测和隔离的知识,例如传感器子集,传感器权重,信号的联合状态基线等。为了进行预测,规则知识库由以下组成:传感器子集,权重,子集对应的剩余寿命等。
[0154]
步骤五、聚合
[0155]
对于这四个方案,我们可以基于四个不同的聚合算子来计算每个样本的聚合分数:
[0156]
1)算术平均(aa):
[0157]
2)加权算术平均(waa):
[0158]
3)子集算术平均(saa):
[0159]
4)子集加权算术平均(swaa):
[0160]
此外,加窗是用于表示系统状态的此类时间序列数据的常用方法。我们用l 个样本的窗口对得分数据进行分割,l=20。图11显示了20个测试单元的窗口化得分结果。在图11的子图中,蓝色垂直线表示添加窗口后分数的起始位置,即sampleid=20。四条实线表示通过四种策略获得的窗口化分数时间序列数据,而四点虚线是由窗口生成的时间序列数据。三阶多项式拟合,用于随后的预测能力评估。
[0161]
步骤六、输出验证决定
[0162]
综合考虑两个评估指标,我们对加窗函数数据和拟合函数的斜率数据的数值覆盖范围进行了一些统计分析,统计结果如图12

13所示。
[0163]
从图12中的统计信息可以看出,几乎所有测试单元生成的结果都表明,方案4给出的得分数据分布是分布最广的,符合第一个标准,即样本差异越大,诊断结果越准确。
[0164]
此外,从图13的结果可以看出,除了单元83、90和91之外,方案4为其他测试引擎生成的拟合曲线的斜率范围大于由单元4获得的拟合曲线的斜率范围。这证明了方案4生成的顺序得分具有更明显的单调特征,并且这种时间序列实例更有利于进行预测研究。
[0165]
此外,从图12

13中的结果可以看出,根据给定的两个评估指标,这四个方案生成
的结果逐渐变好,这表明适当的属性选择和属性权重分配可以改善 lmadm的能力。这些结果还表明,本文提出的扩展lmadm更加有效和优越。
[0166]
综上所述,本发明的基于扩展多属性决策的诊断预测数据和特征再认知方法包括:
[0167]
将用于检测设备故障的传感器定义为扩展多属性决策数据模型的条件属性,将设备典型故障模式或状态定义为扩展多属性决策数据模型的决策属性,典型故障模式或状态可以是从知识库中获取的数据集,或者是根据检验得到的数据集;
[0168]
根据所述决策属性与条件属性间的依赖关系进行条件属性子集选择,以便从多个用于检测设备故障的传感器中筛选出有价值的传感器(即,对故障诊断起到关键作用的传感器)集合;
[0169]
为选择出的条件属性子集中的每个条件属性分配权重,得到条件属性子集中每个条件属性的属性权重;
[0170]
将所述条件属性子集对应的传感器采集的且进行数据预处理的数据样本和条件属性子集的属性权重输入到相应的故障诊断模型(即,已知的任何一种故障诊断模型)中,对设备故障进行诊断。同样地,对于决策属性为设备状态的数据集,则将条件属性子集数据和权重输入到相应的预测模型,对设备未来状态进行预测。
[0171]
进行数据预处理的数据样本是不改变原始数据空间结构的归一化数据样本。
[0172]
对于传感器采集的随时间单调减少的数据样本,采用收入归一化模型将数据样本缩放到[0,1]。
[0173]
对于传感器采集的随时间单调增加的数据样本,采用成本归一化模型将数据样本缩放到[0,1]。
[0174]
扩展多属性决策数据模型为决策系统ds=(u,c∪d),u={x1,x2,

,x
m
}。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1