一种基于深度学习的复杂装备点异常检测方法及系统与流程

文档序号:15047904发布日期:2018-07-27 23:07阅读:200来源:国知局

本发明涉及航空发动机技术领域,尤其涉及一种基于深度学习的复杂装备点异常检测方法及系统。



背景技术:

一直以来,复杂装备状态难以量化评估、无法实现故障预测等难题是工业界和学术界重点解决的方向之一。设计更加高效的复杂装备异常检测方法是大型复杂装备的健康管理系统中重要的一环。航空发动机作为一种典型的大型复杂装备,是飞机的最重要的核心部件,其运行状态的正常与否至关重要。

以航空发动机为例,传统的基于数据驱动的异常检测和故障诊断方法主要是通过对oem数据中的少数参数,例如起飞排气温度裕度(egtm)、燃油流量偏差值(δff)等参数进行分析的得到。这种传统的方法有两种明显的缺点,其一是使用的oem数据中的这些参数不是最开始的原始数据,是经过厂家系统处理过的数据,因此得到的数据不能保证实时性;其二是仅仅根据两到三个参数判断航空发动机正常异常效果有限。

此外,目前异常检测主要基于hawkins对异常的定义:异常是远离其他观测数据而疑为不同机制产生的观测数据。根据数据点相互之间是否独立,异常形式可以大致分为两类:点形式异常和时间序列形式异常。如果一个单独的数据点可以被认为是相对于其余数据的异常,那么该实例被称为点异常。这是最简单的异常类型,也是大多数异常检测研究的重点。如果一个数据点或者一段序列数据点在序列范围内相对于其他段数据是异常的,这样的异常被称为时间序列异常。同样地,航空发动机的异常形式同样可以这样划分为点异常和时间序列异常。依据航空发动机异常数据的不同形式,需要分别设计针对不同形式的异常检测方法。



技术实现要素:

本发明要解决的技术问题在于,针对现有的复杂装备点异常检测方法的检测效果不佳的缺陷,提出了一种基于深度学习的复杂装备点异常检测方法及系统。

为了解决上述技术问题,本发明第一方面,提供了一种基于深度学习的复杂装备点异常检测方法,包括以下步骤:

训练样本处理步骤、选取复杂装备的监控性能参数,并获取监控性能参数的正常样本和异常样本,构成训练样本集;

特征提取步骤、构建基于sdae的特征提取模型,输入所述训练样本集进行模型训练;

检测模型训练步骤、根据经特征提取模型训练得到的特征构建基于gsm的异常检测模型,得到异常检测模型的特征均值和特征标准差;

异常检测步骤、将待测样本输入到基于sdae的特征提取模型,得到的特征输入到基于gsm的异常检测模型中,进行点异常检测。

在根据本发明所述的基于深度学习的复杂装备点异常检测方法中,优选地,所述训练样本处理步骤还对训练样本集中的数据进行归一化处理。

在根据本发明所述的基于深度学习的复杂装备点异常检测方法中,优选地,所述特征提取步骤中sdae的堆叠层数为两层。

在根据本发明所述的基于深度学习的复杂装备点异常检测方法中,优选地,所述特征提取步骤中所使用的sdae的特征提取模型的结构通过以下步骤确定:

1)构建200个不同结构的sdae,其中dae的输入层-隐层-输出层的结构为a-x-y,其中1≤x≤20,1≤y≤10,x,y分别为隐层和输出层的个数,且均为整数,a为输入层的个数,与所述训练样本处理步骤中选取的复杂装备的监控性能参数的个数一致;

2)将训练样本集的原始参数输入到200个不同结构的sdae中,得到对应的200组特征集;

3)针对每个结构的sdae得到的特征进行分析,通过分析特征之间的相关性,筛选无效特征;

4)筛选无效特征之后,根据各个sdae的特征集相关度,选取各特征之间相关度小sdae结构,作为异常检测模型中的特征提取模型。

5、根据权利要求1~3中任一项所述的基于深度学习的复杂装备点异常检测方法,其特征在于,所述检测模型训练步骤中建立的基于gsm的异常检测模型为多元高斯模型,其条件概率为:

其中μ是训练样本的均值,∑为训练样本的协方差矩阵;对于待测样本x,分类器定义如下:

其中θ是判断待测样本是否异常的阈值,h(x)为判别函数,1代表正常值,0代表异常值。

在根据本发明所述的基于深度学习的复杂装备点异常检测方法中,优选地,所述复杂装备为航空发动机,所述训练样本处理步骤选取的复杂装备的监控性能参数包括:海平面温度、飞行高度、风扇指示转速、核心机指示转速、油液压力、进口总温、egt、油液温度、燃油流量和马赫数。

本发明第二方面,提供了一种基于深度学习的复杂装备点异常检测系统,包括:

训练样本处理模块,用于选取复杂装备的监控性能参数,并获取监控性能参数的正常样本和异常样本,构成训练样本集;

特征提取模块,用于构建基于sdae的特征提取模型,输入所述训练样本集进行模型训练;

检测模型训练模块,用于根据经特征提取模型训练得到的特征构建基于gsm的异常检测模型,得到异常检测模型的特征均值和特征标准差;

异常检测模块,用于将待测样本输入到基于sdae的特征提取模型,得到的特征输入到基于gsm的异常检测模型中,进行点异常检测。

在根据本发明所述的基于深度学习的复杂装备点异常检测系统中,优选地,所述特征提取模块中所使用的sdae的特征提取模型的结构通过以下步骤确定:

1)构建200个不同结构的sdae,其中dae的输入层-隐层-输出层的结构为a-x-y,其中1≤x≤20,1≤y≤10,x,y分别为隐层和输出层的个数,且均为整数,a为输入层的个数,与所述训练样本处理步骤中选取的复杂装备的监控性能参数的个数一致;

2)将训练样本集的原始参数输入到200个不同结构的sdae中,得到对应的200组特征集;

3)针对每个结构的sdae得到的特征进行分析,通过分析特征之间的相关性,筛选无效特征;

4)筛选无效特征之后,根据各个sdae的特征集相关度,选取各特征之间相关度小sdae结构,作为异常检测模型中的特征提取模型。

在根据本发明所述的基于深度学习的复杂装备点异常检测系统中,优选地,所述检测模型训练模块中建立的基于gsm的异常检测模型为多元高斯模型,其条件概率为:

其中μ是训练样本的均值,∑为训练样本的协方差矩阵;对于待测样本x,分类器定义如下:

其中θ是判断待测样本是否异常的阈值,h(x)为判别函数,1代表正常值,0代表异常值。

在根据本发明所述的基于深度学习的复杂装备点异常检测系统中,优选地,所述复杂装备为航空发动机,所述训练样本处理模块选取的复杂装备的监控性能参数包括:海平面温度、飞行高度、风扇指示转速、核心机指示转速、油液压力、进口总温、egt、油液温度、燃油流量和马赫数。

实施本发明的基于深度学习的复杂装备点异常检测方法及系统,具有以下有益效果:本发明首先构建基于sdae的特征提取模型,然后根据sdae提取的特征,通过单高斯模型进行异常检测,对于复杂装备尤其是航空发动机出现的点异常检测效果明显。

附图说明

图1为根据本发明优选实施例的基于深度学习的复杂装备点异常检测方法的流程图;

图2为自动编码器结构的示意图;

图3为dae的结构示意图;

图4为根据本发明的基于深度学习的复杂装备点异常检测方法的整体模型结构。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,为根据本发明优选实施例的基于深度学习的复杂装备点异常检测方法的流程图。如图1所示,该实施例提供的基于深度学习的复杂装备点异常检测方法包括以下步骤:

首先,在步骤s1中,执行训练样本处理步骤,选取复杂装备的监控性能参数,并获取监控性能参数的正常样本和异常样本,构成训练样本集。本发明的复杂设备包括但不限于航空发动机、数控机床、燃气轮机和核电设备等。优选地,当针对的复杂装备为航空发动机时,训练样本处理步骤s1选取的复杂装备的监控性能参数包括:海平面温度、飞行高度、风扇指示转速、核心机指示转速、油液压力、进口总温、egt、油液温度、燃油流量和马赫数。

随后,在步骤s2中,执行特征提取步骤,构建基于sdae(堆叠去噪自动编码器)的特征提取模型,输入步骤s1获得的训练样本集进行模型训练。本文中基于sdae的特征提取模型又可简称为sdae模型。

随后,在步骤s3中,执行检测模型训练步骤,根据经特征提取模型训练得到的特征构建基于gsm(单高斯模型)的异常检测模型,得到异常检测模型的特征均值和特征标准差。本文中基于gsm的异常检测模型又可简称为gsm模型。

最后,在步骤s4中,执行异常检测步骤、将待测样本输入到基于sdae的特征提取模型,得到的特征输入到基于gsm的异常检测模型中,进行点异常检测。

本发明的深度学习对深度挖掘数据中的隐藏信息起到很好的效果,因此可以进行复杂装置尤其是航空发动机的异常检测。

优选地,训练样本处理步骤s1还对训练样本集中的数据进行归一化处理。相应地,异常检测步骤中的待测样本也需要进行归一化处理后再输入sdae模型中。

优选地,特征提取步骤s2中所使用的sdae的特征提取模型的结构通过以下步骤确定:

1)构建200个不同结构的sdae,其中dae的输入层-隐层-输出层的结构为a-x-y,其中1≤x≤20,1≤y≤10,x,y分别为隐层和输出层的个数,且均为整数,a为输入层的个数,即将要输入的训练样本集有a种参数,也就是训练样本处理步骤s1中选取的复杂装备的监控性能参数的个数;

2)将训练样本集的原始参数输入到200个不同结构的sdae中,得到对应的200组特征集;

3)针对每个结构的sdae得到的特征进行分析,通过分析特征之间的相关性,筛选无效特征;

4)筛选无效特征之后,根据各个sdae的特征集相关度,选取各特征之间相关度小sdae结构,作为异常检测模型中的特征提取模型。

下面对本发明的基于深度学习的复杂装备点异常检测方法进行详细说明。

本发明提出的异常检测方法有两个主要部分:特征提取模型和异常检测模型。首先构建基于sdae的特征提取模型,然后根据sdae提取的特征,训练单高斯模型进行异常检测。下面分别介绍sdae和单高斯模型。

1、模型建立

1.1基于sdae的特征提取模型

请参阅图2,为自动编码器结构的示意图。虚线框内就是一个自动编码器(ae)模型,它由编码器(encoder)和解码器(decoder)两部分组成,本质上都是对输入信号做某种变换。编码器将输入信号x变换成编码信号y,而解码器将编码y转换成输出信号

自编码器的目的是,让输出尽可能复现输入x,相比于输出,中间层的编码,即y更重要。如果f和g都是恒等映射,就恒有但这样的变换没有任何意义。对中间信号y做一定的约束,一般选取非线性的sigmoid或tanh做激活函数f。在强迫编码y和输入x不同的情况下,系统还能够去复原原始信号x,那么说明编码y已经承载了原始数据的所有信息,但以一种不同的形式。这就是实现了自动地特征提取。

在自动编码器的基础上,训练数据加入噪声,所以自动编码器必须学习去去除这种噪声而获得真正的没有被噪声污染过的输入。这就是dae,如图3所示。而迫使dae去学习输入信号的更加鲁棒的表达,这也是它的泛化能力比一般自动编码器效果好的原因。假设原始数据x被“故意破坏”,比如加入高斯白噪,或者把某些维度数据抹掉,变成了然后再对编码、解码,得到恢复信号该恢复信号尽可能逼近未被污染的数据x。此时,监督训练的误差从l(x,g(f(x)))变成了

将dae进行堆叠,就是sdae,如图4左半部分所示。即将第一个dae的隐层作为第二个的输入层。图4所示的是本发明提出方法的整体模型结构。

1.2单高斯模型

通过对提取的特征参数进行分析,特征参数呈现单峰分布。因此,假设提取得到的每个特征参数服从高斯分布,使用单高斯分布模型进行异常检测。

如果只提取一组特征,采用一元高斯分布模型,

其中是μ训练样本的均值,h是标准差σ的倒数。根据2σ和3σ准则,如果测试样本距离均值2倍或3倍标准差以内,则测试样本正确的概率分别是:

p(|x-μ|<2σ)=95%(2)

p(|x-μ|<3σ)=99.73%(3)

这样从概率论的角度,可以认为是正常。反之,测试样本距离均值2倍或3倍标准差差以外,测试样本被认为是异常。

如果提取多组特征,采用多元高斯模型,其条件概率:

其中μ是训练样本的均值,∑为训练样本的协方差矩阵。新的样本x,分类器定义如下:

其中θ是判断待测样本是否异常的阈值,h(x)为判别函数,1代表是目标类,即正常值,0代表异常值。设定θ主要以使目标类样本上的错误率最小为准则。单高斯分布模型在二维空间应该近似于椭圆,在三维空间上近似于椭球。其中阈值的设定要至少保证测试样本中的异常值都被测出才有应用意义。

2、基于深度学习的复杂装备异常检测方法

2.1方法流程

为了充分发挥提出方法的效果,必须明确针对复杂装备的异常检测模型的具体结构。下面以航空发动机为例,对本发明的方法进行详细说明。其中,对航空发动机参数的选择、sdae模型具体结构即层数及节点数的确定以及单高斯模型阈值的选取对异常检测模型的效果至关重要。

步骤一:样本集的构建。异常检测的意义在于能够快速地,及时地,在厂家cnr报告通知之前,航空公司就发现飞机发动机的异常。飞机运行过程中,最快获得是原始参数。因此,选择飞机发动机的原始气路参数能够保证异常检测的及时性。

样本集的监控性能参数选取飞机巡航过程中的九组航空发动机原始参数作为参数,分别是:海平面温度、飞行高度、风扇指示转速、核心机指示转速、油液压力、进口总温、egt、油液温度、燃油流量和马赫数。

根据厂家提供的cnr(customernotificationreport)报告确定oem数据中的异常数据。cnr报告会提供出故障发动机的型号、编号、故障原因、故障发生的时间。正常数据,根据航空公司提供机队数据确定。机队报告会记录机队每台发动机状态、状态所处的时间以及状态变更的原因等情况。状态包括新发初始、在翼、待修和退租等。可以认为新发初始后到第一次送修的阶段为正常状态,为确保正常数据的准确性,选取新发初始之后一段时间的数据作为正常样本。按照一定比例的正常样本和异常样本构成训练样本集。为了验证本发明的异常检测效果,同时选取了一些已知状态的样本作为异常检测步骤中的待测样本,在此称为测试样本集。

步骤二:数据的预处理。对构建的各个样本集中的数据进行归一化处理。由于各参数之间的数值范围差别较大,直接放入模型中进行训练的话,数值较小的参数会被数值较大的参数稀释至近似为零,被稀释至零的参数的信息也将损失。归一化的目的是为了降低这种各参数之间的不正常的影响。

步骤三:sdae模型的具体结构。sdae堆叠的层数过多,不仅繁琐,而且容易丢失信息。层数过少,将失去深度学习的意义。针对选择的数据构建三层或超过三层的sdae时,模型的重构误差过大。又因为sdae至少需要两层,综合考虑,堆叠两层dae。

sdae每层的节点数如何确定是关键问题。本发明还提出了基于相关度分析的sdae模型结构确定方法。方法的具体步骤和分析将在后续步骤进行说明。

步骤四:构建基于sdae的特征提取模型。在确定了特征提取模型的具体结构之后,使用matlab构建特征提取模型。然后输入训练样本集,训练模型,经过训练的模型保留相应的权值矩阵不变。

步骤五:构建基于gsm的异常检测模型。根据经特征提取模型训练得到的特征,构建gsm模型,得到特征均值和特征标准差。构建gsm模型的关键是阈值的确定,设置自动阈值选择,选取检测精度最高的阈值作为模型的阈值。

步骤六:对测试样本集进行异常检测。将测试样本集首先输入到基于sdae的特征提取模型,得到的特征输入到基于gsm的异常检测模型中,进行点异常检测。并分析其测试的准确率。。

2.2基于相关度分析的sdae模型结构的确定方法

目前为止,现有技术中还没有公认的适用性强的sdae的模型结构确定方法。查阅国内外使用sdae的期刊论文,大多是直接给出sdae的模型结构,并不给出如何确定模型具体结构的具体方法或者思路。在对sdae模型的研究过程中,发现针对本发明构建的样本集数据,经过sdae特征提取,得到的特征之间大多呈现较强的线性相关性。根据这个现象,本发明提出了基于相关度分析的sdae模型结构确定方法。

sdae每层的节点数如何确定是关键问题。本发明采用基于相关度分析的sdae模型结构确定方法,构建多组不同结构的sdae,输入相同的原始参数。对得到特征进行分析,选取特征表现最好的sdae结构。该结构的sdae可以作为实验的特征提取模型。

具体步骤如下:

步骤一:构建200个不同的结构的sdae,即9-x-y,其中1≤x≤20,1≤y≤10,x,y均为整数。如果第一个隐层数x和第二隐层数y过低将损失数据的信息,过高又将增加模型的重构误差。因此,选取了这200个结构的sdae,分析以获得效果最好的模型结构。

步骤二:将9组训练样本集的原始参数输入到这200不同的结构的sdae中,得到200组特征。每组包括1到10不等个数的特征。

步骤三:针对每个具体结构的sdae得到的特征进行分析,通过分析特征之间的相关性,以判断特征的好坏。例如,某个结构的sdae得到4个特征。分别求第1个特征与第2、3、4个特征的相关度,然后求第2个特征与第3、4个特征的相关度,最后求第3个特征与第4个特征的相关度。相关度高于阈值的两个特征保留的信息相似,它们之间只需保留一个,即是同一个有效特征。同理,相关度低于阈值的两个特征全部保留。

步骤四:筛选完无效特征之后,进行具体结构的选择。依据特征提取的目的,可以认为,保留原始数据的信息,而且各个特征之间相互影响较低的特征集是较优的特征集。所以特性之间相关度越低的特征效果越好。因此,根据各个sdae的特征集相关度情况,选取各特征之间相关度较小的一个sdae结构,作为异常检测模型中的特征提取模型。

对得到的特征进行分析,得到如下结果:

(1)一些结构的sdae得到的特征参数之间成线性相关(只输出一个特征参数除外),因此输出的特征参数可看作只有一个有效特征参数。例如,模型结构为9-1-6的sdae输出6组特征参数,特征参数之间相关度如表1所示。

表1模型结构为9-1-6的sdae得到的特征参数之间相关度

对于上述9-1-6结构的sdae得到的特征参数之间相关性过强,各参数之间相关度均超过0.9,因此可以看作只有1个有效特征参数。因为9-1-6的第一隐层数太小(只有1),损失大量信息,因此得到的6组特征彼此之间线性相关。因此,筛选出五个特征,只需保留一个特征作为有效特征即可。

(2)还有一部分结构的sdae输出的特征参数,经过特征筛选,剩余的特征之间的相关度绝对值仍然较高。这里认为这样的sdae不是较好的特征提取模型。如表2所示的是9-5-6结构的sdae得到的参数之间相关度。从表中可以看出,第3个特征和第4个特征需要筛选掉其中一个。其他剩余的特征虽然没有超过阈值,但是相关度仍然较大,该结构提取出的特征效果不好。

表2结构为9-4-4sdae得到的特征参数之间相关度

(3)也有一些结构的sdae输出的特征参数,经过特征筛选(或者没并没有筛选),剩余的特征之间的相关度绝对值很低。这样的sdae模型被认为是好的特征提取模型。表3为9-13-5结构的sdae得到的参数之间相关度。各特征之间的相关度绝对值均较小,可以认为特征提取效果较好。

表3结构为9-7-8sdae得到的特征参数之间相关度

考虑到特征提取的目的是在保留原始参数信息的基础上,更容易实现不同类别的分类。选取9-13-5结构的sdae输出特征参数作为进行异常检测的特征。

3、实验分析

选取测试样本集中100样本点,和肯定为正常时间内的900个样本点组成测试样本集。为了对提出方法进行更好的比较,设置以手工提取特征加单高斯分布模型的对照组。测试样本输入模型当中,选取不同的阈值条件下,实验组和对照组准确率最高的三组实验结果如下表:

表4基于sdae的航空发动机点形式异常检测方法结果

由此可见,本发明提出的航空发动机点形式异常检测方法效果较好,主要原因在于基于深度学习的的特征提取过程有效。实验的过程中发现,该方法针对航空发动机出现的震动故障(avm)效果最好,对于其他类故障效果不明显。通过学习cnr报告,猜测是因为震动故障属于点异常,而其他类故障大多属于时间序列形式的异常。而输入的参数各样本点相互独立,因此不易检测时间序列形式的异常。针对这种情况,需要设计针对航空发动机时间序列形式的异常的检测方法。

基于同样的发明构思,本发明还提供了一种基于深度学习的复杂装备点异常检测系统,包括:训练样本处理模块、特征提取模块、检测模型训练模块和异常检测模块。

其中,训练样本处理模块用于选取复杂装备的监控性能参数,并获取监控性能参数的正常样本和异常样本,构成训练样本集。该训练样本处理模块与前述方法中训练样本处理步骤s1的实现过程相同,在此不再赘述。

特征提取模块,用于构建基于sdae的特征提取模型,输入所述训练样本集进行模型训练。该特征提取模块与前述方法中特征提取步骤s2的实现过程相同,在此不再赘述。

检测模型训练模块用于根据经特征提取模型训练得到的特征构建基于gsm的异常检测模型,得到异常检测模型的特征均值和特征标准差。该检测模型训练模块与前述方法中检测模型训练步骤s3的实现过程相同,在此不再赘述。

异常检测模块用于将待测样本输入到基于sdae的特征提取模型,得到的特征输入到基于gsm的异常检测模型中,进行点异常检测。该异常检测模块与前述方法中异常检测步骤s4的实现过程相同,在此不再赘述。

综上所述,本发明针对复杂装备尤其是航空发动机的点异常情况,首先根据航空发动机的运行的物理特性以及现有的数据集情况,对需要分析的数据进行参数选择,即选择哪几种参数作为检测方法的输入;随后对选择的输入数据预处理即进行归一化处理;然后将处理过的数据输入到特征提取模型当中,特征提取模型以堆叠去噪自动编码器为基础构建而成,并且提出了一种依据特征相关度的特征模型优化方法;最后将提取的特征输入到分类器中进行异常检测,建立了以单高斯模型为基础的异常检测模型。通过实验验证,证实本发明提出的复杂装备点形式异常检测方法效果有效。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1