基于粗到细深度网络的复杂工业系统智能故障诊断方法

文档序号:31562401发布日期:2022-09-20 17:22阅读:58来源:国知局
基于粗到细深度网络的复杂工业系统智能故障诊断方法

1.本发明属于工业大数据和机器学习技术领域,用于复杂工业系统的大规模故障诊断,具体涉及一种基于粗到细深度网络的复杂工业系统智能故障诊断方法。


背景技术:

2.随着制造业的迅速发展,工业系统变得越来越复杂。对故障不及时的响应可能会引发级联故障和大规模停电,甚至是灾难性事故。作为确保生产效率和操作安全的有效工具,故障诊断是工业物联网(iiot)特别关注的领域。传统的故障诊断方法基于使用各种信号处理技术提取的特征来识别不同的故障类型。近年来,随着传感技术的发展,监控系统产生了大量的工业数据,这使得数据驱动的故障诊断成为可能。其中,深度学习((deep learning,dl)方法旨在自动学习特征的层次结构,其中的特征来自于由较低层次特征组合形成的较高层次结构,从而显示出使工业系统更智能的潜力。几种不同的深度学习方法已经在故障诊断任务中展示了最先进的性能,包括自动编码器、循环神经网络(rnn)、深度信念网络(dbn)和最广泛的应用使用卷积神经网络(cnn)。
3.虽然深度学习方法非常有效,但它们仍然存在严重问题。基于dl的方法面对数十种或数百种故障类型时,其性能将迅速下降。其原因如下:在传统的dl方法中,不同的故障共享同一个用来进行特征提取和故障识别深度网络。这种设计在诊断单个组件的故障时可能是有效的,但在复杂系统的故障诊断中处理大量组件时可能会显示其短板。这是由于不同故障的多样性不断增加,将导致特征空间中类内/类间距离不平衡问题,或者说,一个组件的相似故障之间的特征距离很小并且难以区分,而不同组件中的故障之间的特征距离则存在显著差异因此可以很容易被区分。因此,在这种大数据环境中,某些相似故障的特征的类间距离甚至可以小于某些故障的类内距离,这可能会使学习过程偏离全局最优解。同时,面对大规模的故障诊断任务,大量的故障将导致参数的指数增长和结构的复杂性,从而在深度网络中引起严重的局部极小值问题。因此,对具有各种故障类型的复杂系统进行大规模故障诊断,不仅是一类典型的并且在iiot和智能工厂的发展中迫切需要的关键工业自动化应用,而且由于类内/类间距离不平衡和局部极小问题,这也是一个难以克服的艰巨任务。


技术实现要素:

4.本技术提供了一种基于粗到细深度网络的复杂工业系统智能故障诊断方法,从而能够将工业复杂系统的大规模故障诊断问题,分为不同粒度的几个简单子问题,并且可以通过沿着故障类型的ctfn架构执行从粗到细的方式来获得最终的诊断结果。
5.本发明提供的一种基于粗到细深度网络的复杂工业系统智能故障诊断方法的具体方案,包括如下步骤:
6.步骤s1:构建ctfn体系结构;
7.步骤s2:训练节点分类器,以层级的方式构建不用粒度的分类器;
8.步骤s3:测试样本故障诊断。
9.其中,
10.所述步骤s1包括如下步骤:
11.步骤s11:计算不同故障类型之间的相似度矩阵;
12.步骤s12:对相似度矩阵进行聚类;
13.步骤s13:构建故障类别ctfn架构。
14.其中,
15.在所述步骤s11中,采用的类间测量方法如下:
16.假设是第i个故障类别ci中的ni个样本,其中c={c
1,
c2,

,cn}是所有故障类别的集合,每两个类别之间的距离可以表示为:
[0017][0018]
其中s∈{1,

,ni},t∈{1,

,nj},公式(1)需要ni×
nj范数运算,对该方程进行变换以减少计算量:
[0019][0020]
其中是第i类的均值向量,注意到均值向量具有如下性质:基于这个性质,类间距离的测量被下式描述:
[0021][0022]
其中是第i类的方差,与等式(1)中的(ni×
nj)经典距离计算相比,等式(3)将范数运算减少到仅(ni+nj+1);
[0023]
将基于距离的度量转换为基于相似度的度量,基于等式(3)的结果来利用常用的高斯变换,因此,相似度矩阵的元素可以表示为
[0024][0025]
其中σ
ij
是[14]中相似度计算的比例因子,使用式(4)即可计算相似度矩阵中的每个元素。
[0026]
其中,
[0027]
在所述步骤s12中,使用无参数的分层社区检测方法对相似度矩阵进行聚类。
[0028]
其中,
[0029]
在所述分层社区检测方法中,需要在结构中计算qh:
[0030][0031]
其中ah是第h级的类间相似度矩阵,ah(i,j)是第i类与第j类之间的边缘相似度,ki=∑
jaij
是与类i顶点相连的边缘相似度之和,ci是为类i顶点分配的社区,如果p=q,则δ(p,q)函数为1,否则为0,并且在每个节点v上优化局部模块性变化和聚合社区,具体而言,通过删除第i个类并将其放置在与i相邻的第j个社区中来评估模块化的增益δqh,如果该增益为正,则将节点i放置在该增益最大的社区中;如果收益为零或负,i将留在原来社区;对所有节点重复和顺序地应用此过程,直到无法实现进一步的改进为止,通过递归应用算法,可以获得ctfn架构;
[0032][0033]
其中sh是第h级的社区,ah是由式(3)和式(4)计算的相似度矩阵,∑
in
sh(ah)是sh内部的链接权重之和,其中节点之间的关系由ah构成,∑
tot
sh是入射到sh中节点的链接权重的总和,ki是入射到节点i的链接的权重之和,k
i,in
是从i到sh中的节点的链接权重的总和,b是网络中所有链路的权重之和。
[0034]
其中,
[0035]
在所述步骤s3中,在诊断过程中,递归地从粗粒度节点到非常细粒度的节点按层次结构标识样本。
[0036]
其中,
[0037]
所述步骤s3具体为:
[0038]
假设是第l个测试样本,其中l∈{1,

,t},w是训练节点分类器的集合,ωv∈w是节点v∈v处的训练过的分类器,样本的属于v的第i个子节点的概率的定义为
[0039][0040]
其中i(i)one-hot向量,其中第i个元素为1,其他元素为0;为了确定要为样本分配
节点v的哪个子节点,在每个节点上采用贪心算法,该算法选择概率最大的子节点:
[0041][0042]
将测试样本以最大概率dv递归地分类到子节点,直到到达叶节点。
[0043]
与现有技术相比,本发明的有益效果为,
[0044]
本方案提出的基于ctfn的工业大数据分析系统能够智能地进行整个工业系统的大规模故障诊断。一方面,将以学习到的结构的不同粒度对数据进行分析,从而提供高层次的常规分析和低层次的精细分析;另一方面,由于从粗到细对故障数据进行了分析,因此使用该系统可以获得多粒度的定位结果。例如,假设在次级回路组件中发生加热器故障,则首先将其识别为次级回路中的故障,然后将其识别为加热器故障。可以获得这样的多级故障位置,这为用户提供了针对各种情况的更灵活的结果,并且由于减少了一个粗任务中的故障数量,因此也可以缓解局部极小值问题。因此,ctfn架构使智能地解决大规模诊断任务成为可能。
附图说明
[0045]
图1为本技术基于粗到细深度网络的复杂工业系统智能故障诊断方法的流程图。
具体实施方式
[0046]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
[0047]
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0048]
现有的基于深度学习的方法通常通过从全局视图对故障分类器建模而直接计算出最精细的诊断结果,而忽略每个故障的物理属性。例如,给定一个核动力系统的监控数据集,根据指标比较容易分辨出次级回路中是否存在故障,或者区分是次级回路中是加热器故障还是泵故障,但是直接诊断更精细的故障可能要困难得多。
[0049]
本发明中提出了一种基于粗到细网络(coarse-to-fine network,ctfn)模型的复杂工业系统智能故障诊断方法,该方法能够通过分治策略智能地进行工业系统的大规模故障诊断。因此,本方案通过探索和利用各种故障类型的多粒度关系,以解决工业复杂系统的大规模故障诊断问题。具体地,将这种困难的问题分为不同粒度的几个简单子问题,并且可以通过沿着故障类型的ctfn架构执行从粗到细的方式来获得最终的诊断结果。以这种方式,首先将样品诊断为粗粒度故障,例如次级回路故障,然后将其识别为更细粒度的故障,例如进气阀故障,直到找到预期的故障类型。
[0050]
如图1所示,为本发明提供的一种基于粗到细深度网络的复杂工业系统智能故障诊断方法的实施例,
[0051]
包括如下步骤:
[0052]
步骤s1:构建ctfn体系结构;
[0053]
首先从历史数据中学习一种由粗到细的体系结构,即ctfn体系结构,该体系结构由所有故障类型及其粗粒度故障概念组成,该步骤又分为对相似度矩阵进行聚类和分层社
区检测、得到ctfn体系结构子步骤;其中,相似度矩阵来测量不同故障类别之间的类间关系,随后,使用无参数的分层社区检测方法对相似度矩阵进行聚类,以有效地构建故障类别的ctfn架构。
[0054]
具体地,
[0055]
为了处理大数据环境中具有不同可分离性的复杂故障关系,需要将大型诊断任务分为几个子诊断任务。如果仅基于人类知识来构造这种从粗到细的树枝状结构,那么语义差距问题将成为提高性能的巨大障碍。也就是说,当手动构造ctfn架构时,不同故障的相似性是通过不同故障的语义理解相似性来衡量的,而不是通过工业数据的自然特征来衡量的。这将导致构造的ctfn架构可能更易于理解,但更难进行故障诊断。因此,本方案提出了一种数据驱动的ctfn架构学习方法,以解决上述问题。
[0056]
相似度矩阵构造:相似度矩阵中的元素代表该元素所在的行与列对应的类别之间的关系,并将所有关系表示为加权图。
[0057]
相似度矩阵构造的关键是正确计算每两个类别的距离或相似度。直观地,可以通过计算两个类别的所有样本对的相似度来测量类别间相似度。但是,大规模任务包含大量样本,这对于这种暴力的测量在计算上是不可接受的。因此,我们提出了一种有效和高效的类间测量方法以考虑样本的高阶信息。
[0058]
假设是第i个故障类别ci中的ni个样本,其中c={c
1,
c2,

,cn}是所有故障类别的集合。每两个类别之间的距离可以表示为
[0059][0060]
其中s∈{1,

,ni},t∈{1,

,nj}。公式(1)需要ni×
nj范数运算,这需要较高的计算成本。可以对该方程进行变换以减少计算量
[0061][0062]
其中是第i类的均值向量,注意到均值向量具有如下性质:基于这个性质,类间距离的测量可以被下式描述:
[0063]
[0064][0065]
其中是第i类的方差。与等式(1)中的(ni×
nj)经典距离计算相比,等式(3)将范数运算减少到仅(ni+nj+1)。另一方面,它包含高阶统计信息,即类别的方差,因此可以更好地描述特定类别的信息。
[0066]
要建立相似度矩阵,应将基于距离的度量转换为基于相似度的度量。基于等式(3)的结果来利用常用的高斯变换,因此,相似度矩阵的元素可以表示为
[0067][0068]
其中σ
ij
是相似度计算的比例因子。使用式(4)即可计算相似度矩阵中的每个元素。
[0069]
(2)分层社区检测:基于相似度矩阵使用分层社区检测算法,以构建ctfn体系结构。
[0070]
在构建ctfn体系结构的方法上,本方案提出的方法是从社区检测的进步发展而来的,并通过优化模块化社区检测算法来智能地学习参数,该算法可以自动找到社区模块的局部最优解而无需调整任何参数。我们改进了快速社区检测算法以用于分层社区检测。对于平面版本的社区检测算法来说,关键是计算第h级的质量或模块化qh。但是,在粗到细的诊断任务场景中,需要在结构中计算qh:
[0071][0072]
其中ah是第h级的类间相似度矩阵,ah(i,j)是第i类与第j类之间的边缘相似度,ki=∑
jaij
是与类i顶点相连的边缘相似度之和,ci是为类i顶点分配的社区,如果p=q,则δ(p,q)函数为1,否则为0,并且然后,按照的方法,在每个节点v上优化局部模块性变化和聚合社区。具体而言,可以通过删除第i个类并将其放置在与i相邻的第j个社区中来评估模块化的增益δqh。如果该增益为正,则将节点i放置在该增益最大的社区中。如果收益为零或负,i将留在原来社区。对所有节点重复和顺序地应用此过程,直到无法实现进一步的改进为止。通过递归应用算法,可以获得ctfn架构。
[0073][0074]
其中sh是第h级的社区,ah是由式(3)和式(4)计算的相似度矩阵,∑
in
sh(ah)是sh内部的链接权重之和,其中节点之间的关系由ah构成,∑
tot
sh是入射到sh中节点的链接权重的总和,ki是入射到节点i的链接的权重之和,k
i,in
是从i到sh中的节点的链接权重的总和,b是网络中所有链路的权重之和。这样,可以自动获得树的每个节点上的最佳社区数量。通过测量类间的相似性并使用此无参数的社区检测算法,可以自动构建从粗到细的网络,而无需任何先验知识。因此,它可以轻松地应用于各种情况。
[0075]
步骤s2:训练节点分类器,以层级的方式构建不用粒度的分类器;
[0076]
对不同的节点分类器进行训练,并将其嵌入到结构的每个非叶节点中以识别该粒度可能的故障,从而构成ctfn。
[0077]
通过第一步得到ctfn架构后,应将其嵌入到分类过程中,以进行有效的故障诊断。具体而言,应使用来自设备的监测数据训练树状ctfn的每个非叶节点上的分类器,这些分类器可以使用逻辑回归分类器或者svm分类器。
[0078]
具体的训练过程与一般的分类模型的训练过程相同。某节点分类器的输入数据为上级节点指向本节点的对应故障类别所包含的数据,输出为该节点的故障类型包含的子故障类型。
[0079]
步骤s3:测试样本故障诊断。
[0080]
ctfn以粗到细的方式对测试样本及其结构进行预测,其中样本从根节点开始,递归地诊断为当前节点的子节点,直到被诊断为叶子节点故障;从粗粒度节点到非常细粒度的节点按层次结构标识样本。
[0081]
在诊断过程中,采用自顶向下的方式,即从根节点到叶节点,以递归方式将收集到的数据以最高的概率诊断到子节点。每个分类器负责某个类别的某个子集,因此,原始的难题被分解为不同节点上的几个简单子问题,从而可以得出更准确的诊断结果。
[0082]
假设是第l个测试样本,其中l∈{1,

,t},w是训练节点分类器的集合,ωv∈w是节点v∈v处的训练过的分类器,样本的属于v的第i个子节点的概率的定义为
[0083][0084]
其中i(i)one-hot向量,其中第i个元素为1,其他元素为0。为了确定要为样本分配节点v的哪个子节点,在每个节点上采用贪心算法,该算法选择概率最大的子节点:
[0085][0086]
将测试样本以最大概率dv递归地分类到子节点,直到到达叶节点。利用这种方式,通过解决一系列简单的子问题而不是原来的困难问题,可以实现更准确的诊断结果。对于传统的基础分类器(例如逻辑回归和svm),这种自上而下和分治的分类可以提高效率。对
于常规的平面分类器,通过构造n个一对多子分类器,将多分类问题转化为多个二元分类子问题。就故障类型n而言,常规平面分类器的诊断复杂度为o(n)。相反,粗到细分类器将n个故障类型划分为几个子组,其中每个子组包含的故障类型更少。在每个粒度上,仅考虑部分故障类型,这使得诊断复杂度为o(logn)[19]。因此,该方法不仅可以提高诊断性能,而且可以提高诊断效率。
[0087]
总结以上步骤:在模型的训练阶段,将为每对故障类别计算类间相似度,并作为相似度矩阵的基础。然后将自适应分层社区检测应用于学习ctfn架构。最后,在所有非叶子节点上训练节点分类器。在诊断阶段,将样本以最大概率递归分配给子节点,直到到达ctfn体系结构的叶节点为止。
[0088]
需要说明的是,本技术中未详述的技术方案,采用公知技术。
[0089]
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1