一种故障检测方法和系统与流程

文档序号:12270041阅读:187来源:国知局
一种故障检测方法和系统与流程
本申请涉及检测
技术领域
,更具体地涉及一种故障检测方法和系统。
背景技术
:随着现代化生产的发展和科学技术的进步,现代生产设备向大规模、复杂化和自动化的方向发展,工业过程变得越来越复杂,一旦发生异常,就可能对生产安全、效率或产品质量造成不良的影响,所以对工业生产的操作状态监督、过程变化和故障检测等过程监控提出了更高的要求。由于实际工业过程中,不确定因素多且过程复杂,一般包括非线性、时变、变量耦合、时间相关性、多模态、多时段、大规模等特性,使其难以建立精确的过程模型。但是工业过程中产生的大量数据能被用来分析去判断过程中是否有故障发生,所以基于这些数据的故障检测方法被广泛用于工业过程中,对系统运行状态和异常情况进行监视及诊断,对故障类型、故障部位及原因进行检测,最终给出解决方案,实现正常运作,为系统故障恢复提供依据。主分量分析法是最早应用于工业过程的故障检测方法之一,该方法把数据投影到正交的低维空间中,从而可以消除变量之间的相关性,能够在一定范围内对系统运行状态和异常情况进行监视及诊断,对故障类型、故障部位及原因进行检测。但是,主分量分析法的应用范围仅限于分析变量之间的线性关系,而工业过程中产生的数据通常具有非线性性质,因此主分量分析法并不能满足高精度的检测要求。技术实现要素:有鉴于此,本发明提供了一种故障检测方法和系统,以提高对于故障的检测精度。为实现上述目的,本发明提供如下技术方案:一种故障检测方法,包括:将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集;将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据;根据所述训练样本数据集判断所述测试数据是否为故障数据。优选的,所述将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集,包括:利用非线性映射函数k(xi,xj)=exp(-γ||xi-xj||2)将工业过程中的已有训练数据集映射到非线性特征空间xi→zi=[k(xi,x1),k(xi,x2),…,k(xi,xN)]T,生成映射后的训练样本数据集其中,xi∈RD表示工业过程中的过程变量,D表示所述过程变量的个数,yi={+1,-1}表示xi的类别标签,所述类别标签包括正常数据标签和故障数据标签,N表示所述已有训练数据集中的训练数据的个数,zi∈RN为xi在所述非线性特征空间中的像,是所述已有训练数据集中距离排序的第三四分位数,是所述已有训练数据集中距离排序的第一四分位数。优选的,所述将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据,包括:利用非线性映射函数k(x,xi)将在所述工业过程中收集的数据x∈RD映射到所述非线性特征空间x→z=[k(x,x1),k(x,x2),…,k(x,xN)]T,生成映射后的测试数据z∈RN。优选的,所述根据所述训练样本数据集判断所述测试数据是否为故障数据,包括:在训练样本数据集中查找与所述测试数据z∈RN距离最近的训练数据z*;判断所述训练数据z*是否为正常数据;如果所述训练数据z*是正常数据,则判定所述测试数据z∈RN为正常数据,如果所述训练数据z*是故障数据,则判定所述测试数据z∈RN为故障数据。一种故障检测系统,包括:第一映射模块,用于将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集;第二映射模块,用于将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据;判断模块,用于根据所述训练样本数据集判断所述测试数据是否为故障数据。优选的,所述第一映射模块,具体用于:利用非线性映射函数k(xi,xj)=exp(-γ||xi-xj||2)将工业过程中的已有训练数据集映射到非线性特征空间xi→zi=[k(xi,x1),k(xi,x2),…,k(xi,xN)]T,生成映射后的训练样本数据集其中,xi∈RD表示工业过程中的过程变量,D表示所述过程变量的个数,yi={+1,-1}表示xi的类别标签,所述类别标签包括正常数据标签和故障数据标签,N表示所述已有训练数据集中的训练数据的个数,zi∈RN为xi在所述非线性特征空间中的像,是所述已有训练数据集中距离排序的第三四分位数,是所述已有训练数据集中距离排序的第一四分位数。优选的,所述第二映射模块,具体用于:利用非线性映射函数k(x,xi)将在所述工业过程中收集的数据x∈RD映射到所述非线性特征空间x→z=[k(x,x1),k(x,x2),…,k(x,xN)]T,生成映射后的测试数据z∈RN。优选的,所述判断模块,包括:查找单元,用于在训练样本数据集中查找与所述测试数据z∈RN距离最近的训练数据z*;判断单元,用于判断所述训练数据z*是否为正常数据;如果所述训练数据z*是正常数据,则判定所述测试数据z∈RN为正常数据,如果所述训练数据z*是故障数据,则判定所述测试数据z∈RN为故障数据。经由上述的技术方案可知,与现有技术相比,本发明公开了一种故障检测方法和系统,将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集;将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据;根据所述训练样本数据集判断所述测试数据是否为故障数据。本申请提供的技术方案把工业过程中采集的数据经非线性映射投影到非线性特征空间,在非线性特征空间中利用训练样本数据集对测试数据进行高效的故障检测,可以提高对于故障的检测精度,能够获得更高的故障检测率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1示出了本发明一个实施例公开的一种故障检测方法的流程示意图;图2示出了本发明一个实施例公开的一种故障检测系统的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。参见图1示出了本发明一个实施例公开的一种故障检测方法的流程示意图。由图1可知,该方法包括:S101:将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集;在本申请实施例中,可以利用非线性映射函数k(xi,xj)=exp(-γ||xi-xj||2)将工业过程中的已有训练数据集映射到非线性特征空间xi→zi=[k(xi,x1),k(xi,x2),…,k(xi,xN)]T,生成映射后的训练样本数据集其中,xi∈RD表示工业过程中的过程变量,D表示所述过程变量的个数,yi={+1,-1}表示xi的类别标签,所述类别标签包括正常数据标签和故障数据标签,当类别标签为+1时代表该训练数据是正常数据,当类别标签为-1时代表该训练数据是故障数据,N表示所述已有训练数据集中的训练数据的个数,zi∈RN为xi在所述非线性特征空间中的像,是所述已有训练数据集中距离排序的第三四分位数,是所述已有训练数据集中距离排序的第一四分位数。S102:将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据;在本申请实施例中,可以利用非线性映射函数k(x,xi)将在所述工业过程中收集的数据x∈RD映射到所述非线性特征空间x→z=[k(x,x1),k(x,x2),…,k(x,xN)]T,生成映射后的测试数据z∈RN。k(x,xi)函数的形式及参数设置和上述步骤S101中的非线性映射函数k(xi,xj)=exp(-γ||xi-xj||2)的映射过程相同。S103:根据所述训练样本数据集判断所述测试数据是否为故障数据。在本申请实施例中,所述根据所述训练样本数据集判断所述测试数据是否为故障数据,可以包括:在训练样本数据集中查找与所述测试数据z∈RN距离最近的训练数据z*;判断所述训练数据z*是否为正常数据;如果所述训练数据z*是正常数据,则判定所述测试数据z∈RN为正常数据,如果所述训练数据z*是故障数据,则判定所述测试数据z∈RN为故障数据。经由上述的技术方案可知,与现有技术相比,本发明公开了一种故障检测方法和系统,将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集;将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据;根据所述训练样本数据集判断所述测试数据是否为故障数据。本申请提供的技术方案把工业过程中采集的数据经非线性映射投影到非线性特征空间,在非线性特征空间中利用训练样本数据集对测试数据进行高效的故障检测,可以提高对于故障的检测精度,能够获得更高的故障检测率。参见图2示出了本发明一个实施例公开的一种故障检测系统的结构示意图。由图2可知,该系统包括:第一映射模块1,用于将工业过程中的已有训练数据集映射到非线性特征空间,生成映射后的训练样本数据集;优选的,所述第一映射模块1,具体用于:利用非线性映射函数k(xi,xj)=exp(-γ||xi-xj||2)将工业过程中的已有训练数据集映射到非线性特征空间xi→zi=[k(xi,x1),k(xi,x2),…,k(xi,xN)]T,生成映射后的训练样本数据集其中,xi∈RD表示工业过程中的过程变量,D表示所述过程变量的个数,yi={+1,-1}表示xi的类别标签,所述类别标签包括正常数据标签和故障数据标签,N表示所述已有训练数据集中的训练数据的个数,zi∈RN为xi在所述非线性特征空间中的像,是所述已有训练数据集中距离排序的第三四分位数,是所述已有训练数据集中距离排序的第一四分位数。第二映射模块2,用于将在所述工业过程中收集的数据映射到所述非线性特征空间,生成映射后的测试数据;优选的,所述第二映射模块2,具体用于:利用非线性映射函数k(x,xi)将在所述工业过程中收集的数据x∈RD映射到所述非线性特征空间x→z=[k(x,x1),k(x,x2),…,k(x,xN)]T,生成映射后的测试数据z∈RN。判断模块3,用于根据所述训练样本数据集判断所述测试数据是否为故障数据。优选的,所述判断模块,包括:查找单元,用于在训练样本数据集中查找与所述测试数据z∈RN距离最近的训练数据z*;判断单元,用于判断所述训练数据z*是否为正常数据;如果所述训练数据z*是正常数据,则判定所述测试数据z∈RN为正常数据,如果所述训练数据z*是故障数据,则判定所述测试数据z∈RN为故障数据。需要说明的是,本申请中的系统实施例提供的故障检测系统可以采用上述方法实施例中的故障检测方法,可以用于实现上述方法实施例中的全部技术方案,其各个功能模块的功能可以根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述实施例中的相关描述,此处不再赘述。下面对本发明的实例作详细说明:本实例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实例。本发明在田纳西伊斯曼过程(Tennessee-EastmanProcess,TEP)数据集上进行了测试。田纳西-伊斯曼过程是一个标准的故障诊断数据集,该过程的原型是一个真实的化工过程,包括了52个过程变量。数据集包括了正常状态和21种不同的故障,每种状态包括了训练部分和测试部分。正常状态有500个训练样本,每种故障数据有480个训练数据。每种故障的测试部分均含有960个样本,但是这些测试样本中也包括了160个正常状态的样本。现在对故障3和故障8分别进行故障检测。具体实施步骤如下:1.数据映射:(1)已有训练数据的映射:设已有训练数据集为其中xi∈RD表示某个工业过程的过程变量,yi={+1,-1}表示xi的类别标签,即该数据是正常数据(+1),还是故障数据(-1)。N表示训练数据的个数,D表示过程变量的个数。在本实例中,N=980,D=52。现在把已有训练数据集映射到非线性特征空间,即xi→zi=[k(xi,x1),k(xi,x2),…,k(xi,xN)]T;其中zi∈RN为xi在特征空间中的像,非线性映射函数为k(xi,xj)=exp(-γ||xi-xj||2);其中是已有训练数据中距离排序的第三四分位数,是已有训练数据中距离排序的第一四分位数。在本实例故障3中,γ=0.0092,故障8中,γ=0.0013。由此,得到映射后的训练数据集为且zi∈RN。(2)新接收数据的映射:对新收集到的数据x∈RD,和训练数据具有相同的过程变量的个数。对之进行和训练数据相似的非线性映射过程,即x→z=[k(x,x1),k(x,x2),…,k(x,xN)]Tk(x,xi)函数的形式及参数设置和训练过程一样。由此,得到映射后的测试数据z∈RN。2.故障检测:对测试数据z∈RN,在训练样本数据集中,找到和测试数据最为匹配,即距离最近的数据z*。如果z*是正常数据,则测试数据为正常数据;若z*是故障数据,则测试数据也为故障数据。在本实施例中测试有1760个,要重复检测模块1760次。分别计算正常数据和故障样本的检测率。同时还对比了本发明与主分量分析和经典近邻方法的结果,其中主分量分析采用了Q统计量来进行检测。故障3和故障8的对比情况分别如表1和表2所示。在故障3上,主分量分析的故障检测率比较低,而正常数据的检测情况比较高。本发明的正常数据检测率低,但是故障数据的检测率高。从平均性能上来看,本发明的检测率有所提高。在故障8上,本发明的正常检测率和近邻方法相近,比主分量分析高。在故障数据检测率上,本发明和主分量分析相近,比近邻方法高。在平均性能上,本发明占有绝对优势。主分量分析近邻方法本发明正常数据检测率74.1757.4145.09故障数据检测率28.8848.8867.13平均检测率51.5253.1456.11表1在故障3上三种算法的检测率(%)主分量分析近邻方法本发明正常数据检测率74.1797.9597.77故障数据检测率98.2583.2598.00平均检测率86.2190.6097.88表2在故障8上三种算法的检测率(%)为了描述的方便,描述以上系统时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或
技术领域
内所公知的任意其它形式的存储介质中。还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1