基于主元分析和d-s证据理论的故障诊断方法

文档序号:8223741阅读:405来源:国知局
基于主元分析和d-s证据理论的故障诊断方法
【技术领域】
[0001]本发明属于计算机领域,涉及数学建模,尤其是一种基于主元分析和D-S证据理论的故障诊断方法。
【背景技术】
[0002]随着人工智能、专家系统和信息融合的研宄不断深入,必然要遇到如何处理不确定信息的问题。现代计算能力的显著提高可以让我们对不确定性有更深入的研宄,对复杂问题的计算已经不是主要问题,关键是如何用数学框架(古典概率论)来完整的表示不确定性。对不确定性的两重性定义如下:
[0003]1、偶然不确定性(Aleatory Uncertainty):这种类型的不确定性主要是由于系统的随机性造成的,也称为随机不确定性,不可减少的不确定性,客观不确定性等。
[0004]2、认识不确定性(Epistemic Uncertainty):这种类型的不确定性主要是由于对系统缺乏一定的认识造成的,是进行系统分析时的产物。也称为主观不确定性,可减少的不确定性,认识的不确定性,或者称为无知。
[0005]对于这两种类型的不确定性,在传统上人们用概率论来描述。但是,古典概率论并不能描述认知上的不确定性。若用贝叶斯概率来解决认知不确定性,则要求分析者知道所有有关事件发生概率的相关知识。如果没有这些知识,根据拉普拉斯决策准则(又称不充分理由原则),常采用均匀分布函数,这就是当样本空间的概率分布在不知道的情况下,我们可以认为样本是以等概率事件发生的。比如引起某系统发生故障的原因有A、B和C三个。若认为A导致系统发生故障的概率为0.3,但是没有任何关于B和C的可靠性的知识。根据拉普拉斯决策准则,在古典概率论里会认为B和C可能导致系统无法正常工作的概率均为0.35。这是在对关于B和C毫无相关知识的情况下对这两个原因的不可靠性的一个比较准确的描述。
[0006]在古典概率里的另外一个假设就是加法定理,即满足某个性质的所有概率之和为1这就得到一个这样的结论,如果我们知道了某个事件可能发生的概率,比如是0.3,那就相当于我们知道该事件不可能发生的概率,就是1-03 = 0.7。但是这个结论往往是不正确的。这就涉及到在主观信念上对不确定性的建模问题。虽然加法定理和不充分理由原则可能适合于解决偶然不确定性里对于随机事件的建模问题,但是在应用于知识和概念上时还存在一定问题。
[0007]综上所述,当没有关于某一事件发生概率的知识,或者这部分知识是不确切的,模糊的,或者相互矛盾的,需要研宄不确定性更一般的表示,以解决认知不确定性的情况。虽然在概率论里不能解决此类问题,不可能对不确定性赋以一个确定的概率值,但是我们可以对集合或者区间进行概率赋值,把命题的不确定性问题转化为集合的不确定问题,这是Dempster-Shafer 理论的贡献。
[0008]主元分析(Principal Components Analysis) [165]又译为主成份分析,是多元统计过程控制技术中最常用的方法之一。它首先采集系统在正常运行过程中的各个变量信号,组成的高维变量空间,在力保数据信息丢失最少的原则下进行压缩处理,建立一个降维的统计模型:PCA模型,然后提取系统PCA模型输出数据的统计特征参数,通过分析处理这些统计特性参数监测并判断系统的运行状态,可以再采用其它的理论方法(如:多元统计的其它方法、人工智能理论、神经网络技术、信息融合理论等)来诊断具体的故障位置和性质。
[0009]主元分析方法的引入最早出现于多元统计学领域中[166,167],其核心思想是通过将相关的一组数据集进行降维,并尽量保留原来数据集的变化信息。降维的实现主要通过将原变量集转换成一组互不相关的新变量集(即所谓的潜隐变量),这些新变量按照其方差的大小进行排列。如此,新变量集中的前若干个变量(即所谓的主元)便保留了原始变量的绝大部分变化信息。
[0010]主元分析的过程实质是对原坐标系进行平移和旋转变换,使得新坐标的原点与数据集合的重心重合。新坐标系的第一轴与数据变异的最大方向对应,新坐标轴的第二轴与第一轴标准正交,并且与数据变异的第二大方向对应…依此类推。这些新的主轴分别就是PiQ = 1,2,若经过舍弃少量信息后,主轴Pi (i = 1,2,…,k,k〈m)能够有效地表示原始数据的变异情况,则原来的m维空间就被降至k维,这就是原样本集合在新空间投影所生成的新样本集合,可以近似地表达原样本集合。
[0011]由于主元分析技术将系统所有的测量变量视为一个整体,对它们进行一体化处理,所以各变量之间的相互耦合关系也被保留在PCA模型中。PCA模型描述了正常工况下各过程变量之间的关系,这种变量间的内在联系是由质量平衡、能量平衡以及操作限制等各方面的约束形成的。当系统运行数据与主元模型产生较大的偏离时,表现在检测样本的得分向量和变量噪声将超出主元模型中各自空间的正常范围。在进行故障分离时,采用PCA贡献图方法,以系统过程变量之间的关联性作为故障诊断的依据。
[0012]所谓的主元模型,指的是对来自正常稳态工况下的样本数据集合进行主元分析后得到的一系列统计信息,主要包括:变量均值向量U、变量方差矩阵DO、协方差矩阵COV(X)、主元方差矩阵D λ、负载矩阵P、主元得分矩阵T以及主元个数k等。
[0013]D-S证据理论方法在故障诊断中,需要合成、处理多各信息源所提供的关于故障的各种证据,证据也就是命题信任度的产生方法有很多,但都面临一个样本数据维数的问题,当数据维数过大时,会使证据的产生异常困难。一般来说,产生证据的各类算法的复杂度随着量测维数的增大和递推步数呈几何级数增加,会产生组合爆炸的情况,采用分类识别网络时会延长网络的训练时间,甚至导致网络不收敛。
[0014]基于主元分析法模型的贡献图故障诊断方法虽然简单易行,不需要预先的过程知识,但它是以系统过程变量之间的关联性作为依据进行故障诊断,无法为过程的故障与变量建立一种一一对应的因果关系,只能显示出一组与该故障相关联的系统变量,不一定是最后的所辨识的故障,没有分离出其本质,所以故障分离能力较弱,无法进行直接的故障诊断,并且当变量个数较多并且故障常常反映为多个变量变化时,会导致较高的误诊率,因此在实际应用中,还需要由工程操作人员根据经验进行合理的判断。
[0015]在故障诊断方法中,主元分析法和D-S证据理论方法都得到广泛应用,但这两种方法都有自身的缺点。为何克服上述两种方法的缺点,同时发挥各自的优点,本案将PCA与D-S证据理论结合起来进行研宄,采用PCA方法对数据处理,可以把高维数据压缩成一个携带了原数据绝大部分信息的较低维数的数据,对来自各个信息源的低维特征数据进行关联,以降低算法的复杂度,提高实时性,然后利用D-S证据理论进行融合处理,最终分离出故障。

【发明内容】

[0016]本方法针对D-S理论方法在进行多个数据源关联时,随着量测维数的增大和递推步数的增加,会出现组合爆炸的问题,以及主元分析方法虽然可以在损失最少信息的情况下把原有数据压缩成低维的新数据,但在故障分离方面能力较弱的缺点,提出一种PCA和D-S证据理论相结合的故障诊断方法。
[0017]为实现上述目的本发明所采用的技术方案是:
[0018]一种基于主元分析和D-S证据理论的故障诊断方法,该方法基于PCA与D-S证据理论相结合的故障诊断方法,其步骤为:
[0019]⑴采用主元分析法进行故障检测,利用PCA把相关过程数据所组成的高维数据空间投影压缩到低维特征子空间,用少部分独立的主元变量来描述多维空间的绝大部分动态信息,把检测数据用主元模型进行分析,判断PCA模型的T2统计量和Q统计量是否超限,若有一个超限,则认为发生故障;
[0020]⑵对于步骤⑴中已发生的故障,采用PCA方法分析处理正常运行数据&和各种故障数据fi(i = 1,2,…,η),从而得到相应的低维特征矩阵TKiQ =0,1,…,η),以此作为训练神经网络,建立分类识别器;
[0021]⑶将步骤⑵中的正常运行数据&和各种故障数据f i分别用正常主元模型PCAjP故障主元模型PCAiQ = 1,2,…,η)进行主元分析,得到各个主元模型下的低维特征矩阵tkji = 0,1,…,n),然后进行网络识别,其结果作为D-S证据理论的证据,再进行证据融合处理,按照分离法则最终分离故障。
[0022]而且,步骤⑴中所述的主元模型,指的是对来自正常稳态工况下的样本数据集合进行主元分析后得到的一系列统计信息,主要包括:变量均值向量μ、变量方差矩阵D。、协方差矩阵COV(X)、主元方差矩阵Dx、负载矩阵P、主元得分矩阵T以及主元个数k等。确定的主元数,其具有一定的主观性。一般来说当前k个主元的累积贡献率达到85%以上的时候,我们就可以认为已求的主元个数k可以综合原数据足够多的信息,可根实际情况选定。
[0023]而且,步骤⑴中,T2统计量,即Hotelling T 2统计量,Q统计量,即平方预报误差SPE (Squared Predict1n Error)统计量。
[0024]而且,步骤⑴中主元分析法建立的主元模型是:正常主元模型PCAtl和各类故障主元模型 PCAi (i = 1,2,…,η)。
[0025]而且,步骤⑵中,所述正常运行数据&是从传感器网络获得系统正常运行数据,各种故障数据A是通过实验以及历史运行数据得到各种典型故障数据,采用PCA方法分析处理即为将正常运行数据fo以及各种故障数据f 1建立与其相应的正常主元模型PCA ^和各类故障主元模型PCAiQ = 1,2,…,η),同时获得各个主元模型下的低维特征向量TKiQ = 0,1,…,η),组成低维特征矩阵ΤΚ。
[0026]而且,步骤⑵中,训练神经网络是采用径向基函数网络(RBFNN)对低维特征矩阵TK进行信息融合识别,得到TK = TVTK1-+TKn,TKiG RkXv(i = O, I,…,η)是第i种故障类型特征向量,k是选取的主元个数,V是变量个数,以此作为训练RBF神经网络,并建立分类识别器。
[0027]而且,步骤⑶中,通过步骤⑵中的分类
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1