一种故障诊断方法、系统、设备及存储介质与流程

文档序号:14452739阅读:192来源:国知局
本发明涉及故障诊断
技术领域
,特别涉及一种故障诊断方法、系统、设备及存储介质。
背景技术
:当前,人们在判断一台设备是否出现故障时,通常是通过人工判断的方式来进行确定,这样一方面由于人为主观因素的影响,导致故障诊断结果的可靠性不稳定,另一方面则需要消耗大量的人工成本,并且诊断效率较低。为了降低人工成本,提高诊断效率,现在人们逐渐开始采用支持向量机来对设备展开故障诊断,但是诊断结果的准确性还有待进一步的提升。综上,如何提升故障诊断结果的准确性是目前亟待解决的问题。技术实现要素:有鉴于此,本发明的目的在于提供一种故障诊断方法、系统、设备及存储介质,能够提升故障诊断结果的准确性。其具体方案如下:第一方面,本发明公开了一种故障诊断方法,包括:分别获取目标设备在正常运行和故障运行时的与初始特征集对应的特征数据集,得到包括正常特征数据集和故障特征数据集的训练数据;其中,所述初始特征集包括多种特征;分别计算所述正常特征数据集中每一特征数据与所述故障特征数据集中相应的特征数据之间对应的kl距离,得到kl距离集;采用支持向量机分类在所述训练数据上进行交叉验证,得到验证结果;根据所述验证结果以及所述kl距离集中kl距离的大小,从所述初始特征集中确定出与故障运行相关的特征,得到最优特征集;当获取到所述目标设备的待诊断数据,则从所述待诊断数据中确定出与所述最优特征集对应的特征数据,然后利用该特征数据对所述目标设备进行相应的故障诊断。可选的,所述分别计算所述正常特征数据集中每一特征数据与所述故障特征数据集中相应的特征数据之间对应的kl距离的步骤,包括:分别确定所述正常特征数据集和所述故障特征数据集中的每一特征数据所对应的高斯分布;分别计算所述正常特征数据集中每一特征数据对应的高斯分布与所述故障特征数据集中相应的特征数据对应的高斯分布之间的kl距离。可选的,所述分别确定所述正常特征数据集和所述故障特征数据集中的每一特征数据所对应的高斯分布的步骤,包括:分别对所述正常特征数据集和所述故障特征数据集中的每一特征数据进行标准化处理,然后分别确定所述正常特征数据集和所述故障特征数据集中的每一标准化处理后的特征数据所对应的高斯分布。可选的,所述采用支持向量机分类在所述训练数据上进行交叉验证的步骤,包括:采用支持向量机分类在所述训练数据上进行十折交叉验证。可选的,所述根据所述验证结果以及所述kl距离集中kl距离的大小,从所述初始特征集中确定出与故障运行相关的特征,得到最优特征集的步骤,包括:从所述kl距离集中筛选满足预设条件的kl距离,得到目标kl距离;从所述初始特征集中筛选所述目标kl距离对应的特征,得到目标特征;根据所述验证结果从所述目标特征确定出与故障运行相关的特征,得到最优特征集。可选的,所述从所述kl距离集中筛选满足预设条件的kl距离的步骤,包括:对所述kl距离集进行降序排序,得到排序后距离集;从所述排序后距离集中筛选出排在前面的预设数量个的kl距离。可选的,所述从所述kl距离集中筛选满足预设条件的kl距离的步骤,包括:从所述kl距离集中筛选出kl距离大于预设阈值的kl距离。第二方面,本发明公开了一种故障诊断系统,包括:特征数据获取模块,用于分别获取目标设备在正常运行和故障运行时的与初始特征集对应的特征数据集,得到包括正常特征数据集和故障特征数据集的训练数据;其中,所述初始特征集包括多种特征;kl距离计算模块,用于分别计算所述正常特征数据集中每一特征数据与所述故障特征数据集中相应的特征数据之间对应的kl距离,得到kl距离集;交叉验证模块,用于采用支持向量机分类在所述训练数据上进行交叉验证,得到验证结果;特征确定模块,用于根据所述验证结果以及所述kl距离集中kl距离的大小,从所述初始特征集中确定出与故障运行相关的特征,得到最优特征集;故障诊断模块,用于当获取到所述目标设备的待诊断数据,则从所述待诊断数据中确定出与所述最优特征集对应的特征数据,然后利用该特征数据对所述目标设备进行相应的故障诊断。第三方面,本发明公开了一种故障诊断设备,包括处理器和存储器;其中,所述处理器执行保存在所述存储器中的故障诊断程序时实现前述公开的故障诊断方法。第四方面,本发明公开了一种计算机可读存储介质,用于存储故障诊断程序;其中,所述故障诊断程序被处理器执行时实现前述公开的故障诊断方法。可见,本发明在获取到包含正常特征数据集和故障特征数据集的训练数据之后,计算正常特征数据集中每一特征数据和故障特征数据集中相应的特征数据之间对应的kl距离,并且利用支持向量机分类在训练数据上进行交叉验证,后续根据上述验证结果以及上述计算出来的kl距离,从初始特征集中确定出与故障运行相关的特征,当获取到待诊断数据之后,便可以从待诊断数据中确定出与上述与故障运行相关的特征对应的特征数据,由于这些特征数据能够反映出设备是否处于故障运行状态,所以后续便可以利用这些特征数据对设备进行故障诊断。由此可见,本发明在对设备进行故障诊断之前,先基于kl距离确定出与故障运行相关的特征,由于这些特征能够反映出故障运行特点,由此有效地提升了后续故障诊断结果的准确性。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明实施例公开的一种故障诊断方法流程图;图2a为使用svm时“故障21”的监控结果示意图;图2b为使用kl-fs-svm时“故障21”的监控结果示意图;图3为本发明实施例公开的一种故障诊断系统结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例公开了一种故障诊断方法,参见图1所示,该方法包括:步骤s11:分别获取目标设备在正常运行和故障运行时的与初始特征集对应的特征数据集,得到包括正常特征数据集和故障特征数据集的训练数据;其中,所述初始特征集包括多种特征。需要指出的是,本实施例中在获取目标设备在故障运行时的与初始特征集对应的特征数据集的时候,可以是获取目标设备在一种类型的故障下运行时的与初始特征集对应的特征数据集,这样最终得到了相应的一种故障特征数据集;当然,本实施例也可以获取目标设备在k种类型的故障下运行时的与初始特征集对应的特征数据集,这样最终得到了相应的k种故障特征数据集。其中,上述k值是大于1的整数。步骤s12:分别计算所述正常特征数据集中每一特征数据与所述故障特征数据集中相应的特征数据之间对应的kl距离(即kullback–leiblerdivergence),得到kl距离集。本实施例中,上述分别计算所述正常特征数据集中每一特征数据与所述故障特征数据集中相应的特征数据之间对应的kl距离的步骤,具体可以包括:分别确定所述正常特征数据集和所述故障特征数据集中的每一特征数据所对应的高斯分布;分别计算所述正常特征数据集中每一特征数据对应的高斯分布与所述故障特征数据集中相应的特征数据对应的高斯分布之间的kl距离。考虑初始采集到的不同的特征数据之间可能存在不同的量纲和数量级,为此,本实施例在确定特征数据对应的高斯分布时,需要先对特征数据进行标准化处理。也即,上述分别确定所述正常特征数据集和所述故障特征数据集中的每一特征数据所对应的高斯分布的步骤,具体可以包括:分别对所述正常特征数据集和所述故障特征数据集中的每一特征数据进行标准化处理,然后分别确定所述正常特征数据集和所述故障特征数据集中的每一标准化处理后的特征数据所对应的高斯分布。可以理解的是,对于每一种类型的故障,本实施例均会针对相应的故障特征数据集展开上述步骤s12以及下面步骤s13、s14和s15中公开的处理流程。步骤s13:采用支持向量机分类在所述训练数据上进行交叉验证,得到验证结果。其中,上述采用支持向量机分类在所述训练数据上进行交叉验证的步骤,具体可以包括:采用支持向量机分类在所述训练数据上进行十折交叉验证。步骤s14:根据所述验证结果以及所述kl距离集中kl距离的大小,从所述初始特征集中确定出与故障运行相关的特征,得到最优特征集。本实施例中,上述根据所述验证结果以及所述kl距离集中kl距离的大小,从所述初始特征集中确定出与故障运行相关的特征,得到最优特征集的步骤,具体可以包括:从所述kl距离集中筛选满足预设条件的kl距离,得到目标kl距离;从所述初始特征集中筛选所述目标kl距离对应的特征,得到目标特征;根据所述验证结果从所述目标特征确定出与故障运行相关的特征,得到最优特征集。在一种具体实施方式中,上述从所述kl距离集中筛选满足预设条件的kl距离的步骤,具体可以包括:对所述kl距离集进行降序排序,得到排序后距离集;从所述排序后距离集中筛选出排在前面的预设数量个的kl距离。可以理解的是,上述预设数量可以根据实际需要进行具体设定,在此不对其进行限定。在另一种具体实施方式中,上述从所述kl距离集中筛选满足预设条件的kl距离的步骤,具体可以包括:从所述kl距离集中筛选出kl距离大于预设阈值的kl距离。可以理解的是,上述预设阈值可以根据实际需要进行具体设定,在此不对其进行限定。步骤s15:当获取到所述目标设备的待诊断数据,则从所述待诊断数据中确定出与所述最优特征集对应的特征数据,然后利用该特征数据对所述目标设备进行相应的故障诊断。本实施例中,从所述待诊断数据中确定出与所述最优特征集对应的特征数据之后,可以利用该特征数据,并结合支持向量机(svm,即supportvectormachine),对目标设备进行相应的故障诊断。可见,本发明实施例在获取到包含正常特征数据集和故障特征数据集的训练数据之后,计算正常特征数据集中每一特征数据和故障特征数据集中相应的特征数据之间对应的kl距离,并且利用支持向量机分类在训练数据上进行交叉验证,后续根据上述验证结果以及上述计算出来的kl距离,从初始特征集中确定出与故障运行相关的特征,当获取到待诊断数据之后,便可以从待诊断数据中确定出与上述与故障运行相关的特征对应的特征数据,由于这些特征数据能够反映出设备是否处于故障运行状态,所以后续便可以利用这些特征数据对设备进行故障诊断。由此可见,本发明实施例在对设备进行故障诊断之前,先基于kl距离确定出与故障运行相关的特征,由于这些特征能够反映出故障运行特点,由此有效地提升了后续故障诊断结果的准确性。基于前述实施例,本发明实施例在田纳西伊斯曼过程(tennessee-eastmanprocess,tep)数据集上进行了相应的测试。tep数据集中包含正常运行对应的特征数据集和21种不同故障对应的特征数据集。对于每一种故障,训练集有480个故障特征数据,测试集包括960个观测数据,每个观测数据包含52个变量,测试集的数据以正常数据开始,到第161次采样出现故障,所有的数据每隔3分钟采样一次,所有数据均由tep仿真软件生成。本实施例取正常特征数据集中的500个训练数据和一种故障的480个训练数据作为训练集的输入,对每种故障的测试集进行故障检测。具体实施步骤如下:1)对已经收集到的工业过程中的正常特征数据集和故障特征数据集n0和nk分别是正常特征数据集和第k种故障特征数据集的样本数,m是特征个数,n为故障类别数,这里n1=500,nk=480,m=52,n=21,再分别对特征数据进行标准化预处理。标准化公式为:其中,为正常特征数据集第j个特征数据的均值,为正常特征数据集第j个特征数据的标准差。2)假设每个特征数据都服从不同的高斯分布,分别对不同类别数据的相应特征数据估计其广义高斯分布,每个特征数据的分布可由其高斯密度函数近似得到:其中,不同的参数和代表不同的高斯密度函数,即其高斯分布也是不同的。所以本发明提出第k类的第j个特征数据的高斯分布由参数和决定,和则是通过对高斯密度函数的最大似然估计法得到。最大似然估计法计算如下:其中ψ(z)=φ'(z)/φ(z),先通过上述公式求得和首先用矩法估计初始化再用牛顿法迭代求得f(β)计算如下:得到后,的计算如下:求得和即可得到第k类的第j个特征数据的高斯分布。3)kl散度测量两个分布p和q的距离,计算公式:所以将特征j的高斯密度函数代入kl距离中,得到特征j分别在正常和第k类故障情况下相应特征数据之间的kl距离:4)针对同一故障类型k,不同特征j对应的kl距离表示为对从大到小进行排序,其相应排序得到的特征集则记为r。5)采用支持向量机分类在在训练数据上进行十折交叉验证,从r中取分类效果最好的特征子集f,即为最优特征集。在得到上述最优特征集之后,本实施例便可以基于测试集来进行检验。具体的:1)实时收集工业过程的测试数据(m为特征个数),在这里,有960个测试样本,特征数m=52,并将测试数据标准化,相应的标准化公式为:2)根据前述得到的最优特征集f选取测试数据的特征形成输入数据,再用支持向量机分类,输出结果,判断测试样本是否有故障,是否属于此类故障。通过本发明实施例提出的基于kl距离的特征选择方法,以tep的正常特征数据集和故障特征数据集作为训练数据,tep的故障测试数据集测试,发现本发明实施例可以对每类故障有效地完成特征选择,找出关键特征,剔除无用特征,从而提高分类器的表现。实验表明本发明实施例提出的基于kl距离的特征选择方法和支持向量机结合(即kl-fs-svm)可以改善传统的支持向量机(svm)的故障诊断结果,同时对于复杂的过程数据,基于kl距离的特征选择方法的表现要远远优于一些传统的特征选择方法(如fscore和relief)。不同故障的故障诊断结果如表一所示,本实施例发现fscore-svm和relief-svm在“故障20”的检测率没有svm的高,表明引起该故障的特征比较多且差异不大,提出的基于kl距离的特征选择方法选出前47个特征得到的检测率要略高于没有特征选择的svm,这说明本发明实施例提出的特征选择方法的有效性。而在kl-fs-svm的故障诊断模型中,“故障11”和“故障21”的检测率都有了很大的提升。表一故障类型svmfscore‐svmrelief‐svmkl‐fs‐svm故障1183.50%76.88%84.75%87.88%故障2080.63%79.00%78.88%80.75%故障2112.88%13.38%42.13%100%表二故障类型fscorereliefkl‐fs故障1143152故障20272947故障2133351除了故障检测率以外,参见表二所示,对比fscore、relief和kl-fs三种特征选择方法得到的最优特征集的特征个数,kl-fs选择的特征个数最少,而且很大程度上改善了svm的诊断结果,特别是“故障21”的诊断表现最为明显,如图2a和图2b所示。其中,图2a为使用svm时“故障21”的监控结果示意图,图2b为使用kl-fs-svm时“故障21”的监控结果示意图。相应的,本发明实施例还公开了一种故障诊断系统,参见图3所示,该系统包括:特征数据获取模块11,用于分别获取目标设备在正常运行和故障运行时的与初始特征集对应的特征数据集,得到包括正常特征数据集和故障特征数据集的训练数据;其中,所述初始特征集包括多种特征;kl距离计算模块12,用于分别计算所述正常特征数据集中每一特征数据与所述故障特征数据集中相应的特征数据之间对应的kl距离,得到kl距离集;交叉验证模块13,用于采用支持向量机分类在所述训练数据上进行交叉验证,得到验证结果;特征确定模块14,用于根据所述验证结果以及所述kl距离集中kl距离的大小,从所述初始特征集中确定出与故障运行相关的特征,得到最优特征集;故障诊断模块15,用于当获取到所述目标设备的待诊断数据,则从所述待诊断数据中确定出与所述最优特征集对应的特征数据,然后利用该特征数据对所述目标设备进行相应的故障诊断。关于上述各个模块更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。进一步的,本发明还公开了一种故障诊断设备,包括处理器和存储器;其中,所述处理器执行保存在所述存储器中的故障诊断程序时实现前述公开的故障诊断方法。关于该方法更加具体的步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。进一步的,本发明还公开了一种计算机可读存储介质,用于存储故障诊断程序;其中,所述故障诊断程序被处理器执行时实现前述公开的故障诊断方法。关于该方法更加具体的步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或
技术领域
内所公知的任意其它形式的存储介质中。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上对本发明所提供的一种故障诊断方法、系统、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1