一种基于深度学习和信息融合的航空发动机气路故障诊断方法与流程

文档序号:21366666发布日期:2020-07-04 04:42阅读:326来源:国知局
一种基于深度学习和信息融合的航空发动机气路故障诊断方法与流程

本发明属于动力机械故障诊断领域,涉及一种基于深度学习和信息融合的航空发动机气路故障诊断方法,用于航空发动机或燃气轮机实时故障检测与故障分类。



背景技术:

航空发动机(以下简称航发)被誉为“工业皇冠上的明珠”,其内部系统结构具有极高的复杂性。正因如此,研究人员难以利用航发领域的机械、流体及热力学方面的专业知识对其进行故障诊断。现有的航发故障诊断技术大多是通过大数据与人工智能的方法来实现的。故障检测与分类属于人工智能领域的模式识别问题。

在航发故障诊断这类模式识别的实际应用领域中还存在一些共性问题:航发大数据的数据格式不规范。从不同航空企业、研究单位获取的数据在维度、连续性、数量级及质量上有很大差异。所以,目前很多故障诊断模型的应用场景难以泛化,可能只针对某些特定采样方式下的航发参数数据集才有很高的精度。若将其推广应用,效果可能会下降很多。

当前应用信息技术方法进行航空发动机故障诊断的方法可归为以下几类:

基于信号处理的诊断技术,如应用小波变换、傅里叶变换、卡尔曼滤波等方法,对现场采集的连续的信号波形进行特征提取,分析得出结果。此类方法需要用一定时间间隔内的一段波形进行分析,才能得出数据特征。故只适用于连续采样的数据。

基于位置和距离进行分类的算法,如支持向量机。这类方法的思想是将样本的各维数据视为多维向量的坐标。不适用于较多分类的应用和数值区分度不高的样本数据。

基于专家经验与数学模型相融合的诊断方法。专家经验通常表现为依据样本属性或特征的阈值进行分支的决策树,每一叶节点对应一个故障类别的概率值。此类方法适合低维样本数据,样本维数过高时或多分类时,专家经验概率组合会十分复杂。此外,专家经验概率主观性较强,其正确与否将直接影响判别结果。

基于神经网络的诊断模型,如前馈神经网络、径向基神经网络、自组织竞争网络等基本的深度学习模型。这些模型通过拟合样本数据与其所属分类间的复杂函数关系,来做出正确的分类判断。相比于以上方法,神经网络由于有很强的泛化能力和一定的容错能力,因此神经网络在应用时,其对数据质量和规格要求相对较低,适用范围更广。此外还有些方法是利用卷积神经网络或循环神经网络提取样本数据特征,再用其他分类方法进行分类,但都是依据单一类别特征进行的。

基于信息融合思想的复合模型。该思想通过综合考量多信息源数据、样本的多特征或多模型的输出,利用信息间的互补来提高分类器的判别精度。信息融合学习方式可分为数据层融合、特征层融合、决策层融合。目前三种融合方式在航发故障判别技术上均有应用。其中,决策层融合是将不同基本分类模型的决策结果进行融合,也有一些方法对同一模型多次训练的决策结果进行融合。dempster-shafer证据理论(d-s证据理论)、模糊积分和贝叶斯网络等是常用的决策层信息融合方法。

集成学习思想和多视图学习方法,也属于信息融合理论,但对于航发故障诊断这种复杂的非线性问题来说,用于集成的基本分类器也应是比较复杂的,如神经网络、支持向量机等。因此其集成的轮次不能过高,否则训练难度较大。此外,一些集成学习方法选择的基础弱分类器间同质性过高,导致其互补性不强,集成的提升效果不明显。



技术实现要素:

现有的航发故障诊断机制大多基于单一模型的决策信息进行判别,未将优质模型的进行整合。信息融合与集成学习方法在此领域也有应用,但选择和构造的待融合基础模型存在一定的缺陷。

针对现有技术存在的问题,本发明提出一种基于深度学习和信息融合的航空发动机气路故障诊断方法。利用泛化能力较强的深度卷积神经网络(cnn)和深度前馈神经网络(bpnn)分别对样本数据进行判别,获得模型对样本所属各个类别概率的评分,将其作为dempster-shafer证据理论的证据体。之后利用证据理论对两种证据体的分类结果进行融合,得到最终的分类结果。

为了达到上述目的,本发明采用的技术方案为:

一种基于深度学习和信息融合的航空发动机气路故障诊断方法,包括四个阶段:数据预处理;神经网络训练;构造证据体的基本概率分布;证据体的合成与决策。首先,在数据预处理阶段,对时序样本数据进行清洗、归一化处理、添加标签等操作;其次,在神经网络训练阶段,利用处理后的样本数据将卷积神经网络模型和前馈神经网络分别训练至最佳,继而得到两个模型对样本数据所属类别的判定结果;再次,在证据体的基本概率分布的构造阶段,两种模型的判别结果被视为两个证据体,这一阶段要将证据体中样本所属各类别评分转换为样本的基本概率分布,同时计算出样本的不确定度;最后,在证据体的合成与决策阶段,根据d-s证据理论的合成规则计算两个证据体合成后的概率分布,并根据决策规则,给出每条样本最后所属的类别。具体步骤如下:

(1)对数据进行预处理:本阶段将初始的大量的航发故障数据样本处理为能够直接输入神经网络模型运行、并便于神经网络对其进行特征感知和数据拟合的形式。

1)清除原始样本的序号、列名等无关数据,舍去序列样本数据首部和尾部的零值较多的样本值。

2)对样本按列进行归一化处理,消除指标量纲的影响,增强不同属性指标间的可比性。

采用的归一化公式如下:

式中:xij表示样本中第i个序列数据的第j个属性;n表示样本中序列数据的个数;n表示每条样本的属性维度。max{·}表示取最大值;min{·}表示取最小值。

3)对样本逐条添加标签,按其所属的故障类别f1、f2...fm分类,用1,2,3,...,m作为对应标签值,使样本的第一列数据为标签。

4)对不同故障类型的序列数据进行合并,合为一个文件后,进行随机打乱。

5)将上述样本按比例分割为训练集d、验证集v和测试集t,分别用于神经网络的训练、验证和测试。

(2)对神经网络模型进行充分训练,神经网络模型包括cnn模型和bpnn模型。两个模型计算单元中的权重矩阵w和偏置系数b要在模型初始化过程中给出,并利用样本数据进行反复的训练得以调整。模型层数、每层单元数等超参数也需要人工进行调整,以使得模型的判别精度达到最佳。cnn模型的训练按照以下步骤进行:

1)设定模型中的激活函数和损失函数。所述的常用的激活函数包括线性修正单元(relu)、泄露型线性修正单元(leaky-relu)、挤压函数(sigmoid)等,损失函数包括交叉熵损失和平方损失等。

2)设定初始的超参数。对于cnn,超参数为:卷积层数、全连接层数、每层卷积核尺寸、卷积核数量、卷积步长、各层的单元数和迭代次数。对航发故障诊断问题,神经网络的全连接层数采用二层或三层结构。对于训练的迭代次数,根据训练过程中损失函数的下降情况确定。对于航发数据这种时间序列数据,进行一维卷积,卷积核尺寸应小于数据的维度。

3)在给定的超参数下训练cnn模型。将训练集d和验证集v的样本数据输入模型,运行模型,等待模型训练完毕,记录本次训练后模型对测试集t的判别精度。每组超参数下,要进行3~5次上述操作,取判别精度的平均值作为模型对测试集的平均判别精度。

4)遵循控制变量法对模型中的超参数进行调整。将本组超参数下与上一组超参数下的模型平均判别精度作对比,之后按使平均判别精度增大的方向对模型某一超参数进行小幅度调整,保持其他参数不变。

5)重复步骤3)~4),保留使模型平均判别精度达到最高的一组超参数设置。

6)固定已调整完毕的模型的初始化参数及超参数设定,保存已训练好的模型。用训练好的模型对测试集t中样本进行判别,保存判别结果和从输入样本数据中剥离的测试集t的标签。

对bpnn模型进行训练,其需要设置和调整的超参数为:层数、各层单元数和迭代次数。训练的步骤和方法与上述的cnn模型训练过程完全一致。训练完毕后,用bpnn模型对测试集t中样本进行判别,并保存其判别结果。

(3)采用神经网络的判别结果构造证据体的基本概率分布。本发明构造证据体基本概率分布的方法与步骤如下:

1)将神经网络模型判别结果中对每个样本属于的m个基本类别的概率评分作为初始的概率分布。计算公式如下:

式中,r代表神经网络输出的判别结果。em0代表样本的初始概率分布。角标i表示输入样本中的第i条序列。上标m代表某一证据体,m={a:cnn,b:bpnn}。l=1,2,3,...,m指故障类别之一。

2)设定样本的不确定性度量指标及其计算方式。利用初始概率分布计算样本不确定性度量值。选取每个证据体初始概率分布到两证据体的平均初始概率分布值的距离平方和作为不确定性度量。计算公式如下:

式中:avg_ei表示两证据体对第i条样本的平均判别结果;ea0、eb0是em0的具体取值,表示两个证据体的初始概率分布;表示证据体m的判定结果到平均判定结果的距离平方和。

3)将不确定性度量转换为样本的不确定度u,依据u和步骤1)中的初始概率分布,按照公式(10)和(11),对其余m项命题的概率进行重新分配,使得每条样本的m+1个可能项的概率之和为1,能够得到证据体对每条样本的每个命题的信度函数(概率值)。

式中:表示在证据体m中,样本i的基本概率分布中的第l项的概率值;表示在证据体m中,样本i的不确定度,即样本归属于全集项的概率值;表示证据体m对第i条样本的判别结果的不确定度。

(4)确定证据体的融合方式和决策准则。d-s理论在融合证据体时,以识别框架θ中的m个基础命题为出发视角,对不同证据体中各分布项的信度函数间的组合进行归类。依据合成后的信度函数,按决策规则可以获得样本最终的诊断决策。

1)将两个证据体的基本概率分布中各分布项两两组合。利用存在交集的证据组合,计算出合成后的各命题的信度函数。对于交集为空的证据组合,予以舍弃。如公式(12)和(13):

式中:k,h∈{f1、f2...fm}∪{θ},表示m+1个分布项中的两项;ai(k)、bi(h)表示针对第i条序列在a、b两证据体中分别取到的分布项;ui表示样本第i条序列数据的合成判别结果的不确定度;ei(l)表示按融合后的信度函数,第i条序列属于第l类的概率。

2)以信度函数为依据制定决策规则,取其概率最大的命题为该样本的决策结果。

3)利用步骤(2)中保存的测试集标签和经d-s理论融合模型的给出的决策结果,得到本发明的诊断精度。

本发明的有益效果:本发明针对航空发动机气路故障诊断问题,设计了一种基于卷积神经网络的特征感知能力、前馈神经网络的映射拟合能力和d-s证据理论的信息融合能力的判别方法。模型综合了两种深度神经网络从不同角度学习样本数据后给出的决策结果,二者互为补充,融合后可以提高判别精度。同时,可以克服非深度学习模型对不同来源的航发大数据判别能力不稳定、鲁棒性低的问题。

附图说明

图1是本发明基本框架。

图2是本发明的工作流程图。

具体实施方式

以下结合附图和技术方案,进一步说明本发明的具体实施方式。

一种基于深度学习和信息融合的航空发动机气路故障诊断方法,包括四个阶段:数据预处理阶段;神经网络训练阶段;构造证据体的基本概率分布阶段;证据体的合成与决策阶段。

第一步,在数据预处理阶段,将航发数据处理为能够直接输入神经网络模型运行的形式。同时,通过预处理,要使得样本更佳适用于神经网络对其进行特征感知和数据拟合。

1)清除原始样本的序列号、表头列名等无关数据,舍去序列样本数据首部和尾部第一列参数值为0的样本值。

2)初始样本数据的数值可能数量级过高、过低或不同属性间的单位量纲不统一。对样本按属性进行归一化处理,可消除指标之间量纲的影响,增强不同属性指标间的可比性,有助于模型更好的学习和判别数据。采用归一化公式如下:

式中:xij表示样本中第i个序列数据的第j个属性;n表示样本中序列数据的个数;n表示每条样本的属性维度。max{·}表示取最大值;min{·}表示取最小值。

3)对样本逐条添加标签,将数据集改造为uci标准时间序列数据集形式。按样本所属的故障类别f1、f2...fm分类,用l=1,2,3,...,m作为对应标签值添加到样本的第一列。

4)对多种故障序列数据进行合并,合为一个文件后将样本序列进行随机打乱。利用cnn和bpnn模型做序列分类问题时,不依赖样本间的顺序关系,打乱样本可以增加训练和测试样本的随机性,训练出更好的模型。

5)将样本按比例0.7、0.1和0.2的比例分割为训练集、验证集和测试集,保存为三个文件。用于神经网络的训练、验证和测试。

第二步,神经网络训练阶段,通过神经网络的超参数调整等工作,使每个作为证据体的神经网络的性能达到最佳。

1)设定模型中的激活函数和损失函数。常用的激活函数有:线性修正单元(relu)、泄露型线性修正单元(leaky-relu)、挤压函数(sigmoid)等。损失函数有交叉熵损失和平方损失等。激活函数一般默认采用relu,分类问题一般采用交叉熵损失函数,分别如公式(2)和(3)所示:

式中:x表示某条序列数据;y表示样本真实标签值;表示判别模型的输出值;w,b是各神经元中的参数;σ(·表示激活函数;l(·表示损失函数。

2)设定初始的超参数。cnn超参数为:卷积层数、全连接层数、每层卷积核尺寸、卷积核数量、卷积步长和各层的单元数。对于bpnn,要设置的超参数为:层数、各层单元数。此外学习率α,迭代次数等,在两种深度网络中都应进行设置。一般神经网络的全连接层数不应超过三层,对航发故障诊断问题,由于输入输出数据间的映射较为复杂,应采用二层或三层结构。对于训练的迭代次数,要根据训练过程中损失函数的下降情况确定,训练充分时,损失函数与训练精度会在一个值附近震荡,达到接近稳定的状态。对于航发数据这种时间序列数据,应进行一维卷积,即卷积核的第二维度尺寸为1。一维卷积核提取样本各属性间的内在联系。卷积核尺寸应小于数据的维度。

3)训练模型与调节超参数,超参数的调整遵循控制变量法。每次,将超参数设定后将样本数据输入模型,用公式(4)-(5)给出的误差反向传播的梯度下降法和链式法则对模型的各计算单元中参数w和b进行不断修正,训练完毕后记录该次模型对测试集的判别精度。每组超参数下进行3次实验,并把平均判别精度与上一组超参数下的模型平均判别精度作对比,按使模型平均判别精度增大的方向对某一超参数进行小幅度调整,保持其他参数不变。保留使模型平均判别精度达到最高的一组超参数设置。

z(l)=w(l).x(l)+b(l)(4)

式中:z表示净输入;α表示学习率;上标l表示第l层的数据;下标n表示第n轮训练后的数据。

4)固定已调整完毕的模型的初始化参数及超参数设定,可以保存已训练好的模型。用训练好的模型对测试集t中样本进行判别,保存模型对测试集的判别结果和从输入样本数据中剥离的测试集标签。

第三步,构造证据体的基本概率分布阶段。本发明构造证据体基本概率分布的方法与步骤如下:

1)将神经网络模型输出的对每个样本序列数据的所属m个基本类别命题的评分转化为初始的概率分布。计算公式如下:

式中,r代表神经网络输出的判别结果。em0代表样本的初始概率分布。角标i表示输入样本中的第i条序列。上标m代表某一证据体,m={a:cnn,b:bpnn}。l=1,2,3,...,m指故障类别之一。

2)设定样本的不确定性度量指标以及计算方式。利用初始概率分布计算样本不确定性度量值。选取每个证据体初始概率分布到两证据体的平均初始概率分布值的距离平方和作为不确定性度量。计算公式如下:

式中:avg_ei表示两证据体对第i条样本的平均判别结果;ea0、eb0是em0的具体取值,表示两个证据体的初始概率分布;表示证据体m的判定结果到平均判定结果的距离平方和。

3)将不确定性度量转换为样本的不确定度u,依据u和1)中的初始概率分布,按公式(10)和(11),对其余m项命题的概率进行重新分配,使得每条样本的m+1个可能项的概率之和为1。可以得到证据体对每条样本的每个命题的信度函数。

式中:表示在证据体m中,样本i的基本概率分布中的第l项的概率值;表示在证据体m中,样本i的不确定度,即样本归属于全集项的概率值;表示证据体m对第i条样本的判别结果的不确定度。

第四步,证据体的合成与决策阶段。确定证据体的融合方式和决策准则。d-s理论在融合证据体时,以识别框架θ中的m个基础命题为出发视角,对不同证据体中各分布项的信度函数间的组合进行归类。为给出每个样本的确切判别结果,最终决策结果不能再存在表示不确定类别的全集项。依据合成后信度函数和决策规则可以得到样本最终的诊断决策。合理的证据体融合方式和决策规则可以对最终决策精度的提高起到积极作用。

1)将两个证据体中的各证据进行两两组合。利用存在交集的证据组合,计算出合成后的各证据的信度函数。对于交集为空的证据组合,对其予以舍弃。如公式(12)和(13):

式中:k,h∈{f1、f2...fm}∪{θ},表示m+1个分布项中的两项;ai(k)、bi(h)表示针对第i条序列在a、b两证据体中分别取到的分布项;ui表示样本第i条序列数据的合成判别结果的不确定度;ei(l)表示按融合后的信度函数,第i条序列属于第l类的概率。

2)决策规则:为了使每一条样本都有一个确切的决策结果,将不对各命题间的信度函数差值设阈值限制,直接取每条样本融合后的各证据的最大的项作为该样本的决策结果,如公式(14):

yi=argmax(ei(l))(14)

式中:yi表示模型对第i个样本序列的判别结果。

3)利用第二步中保存的测试集标签和经d-s理论融合后的决策结果,计算本发明的诊断精度。

结合本发明的方案,进行实验分析如下:

由于航发故障诊断领域目前还没有公开的标准数据集,且基于人工智能技术判别航发故障的方法大都未公开源代码,故难以与其他研究人员所提出的航发故障方法的判别精度进行对比。

但航发故障数据本质上是时间序列数据,对时间序列数据进行分类的方法都可以用于航发故障数据。可以借助在时间序列标准数据集上的实验及相关对比来证明本模型的有效性。

因此,对一种基于深度学习和信息融合的航空发动机气路故障诊断方法的实验分析过程可以分两部分进行,一是将方法应用在标准时间序列数据集上,与已有的其他时间序列分类模型判别结果进行横向对比;二是使用真实的航发故障数据,验证此方法应用在目标领域时的有效性。

(1)在uci标准时间序列数据集上的实验

uci标准系列数据集是由研究人员汇总的,在各实际应用领域采集的时间序列数据,如心电图数据、传感器数据及模拟数据等。这组数据集主要用来研究时间序列分类问题。

本方法在uci标准数据集组中的chlor.conc、cinc_ecg等数据集上进行了实验验证。上述数据集的基本情况如表1所示。

表1实验使用的uci标准数据集基本情况

本方法实验结果与时间序列数据分类领域的其他优秀判别模型的对比情况如表2所示。其中,ctn-t是一种应用了迁移学习思想的基于cnn提取出的单特征深度学习方法,boss模型是一种基于距离的判别方法,这两种模型是研究人员于2019年提出的用于时间序列分类的新方法,具有较好的性能。

表2uci数据集上的实验结果比较

通过对实验结果的横向对比,可以看出深度学习模型总体上性能优于距离进行分类的方法,resnet、ctn-s、ctn-t模型对上述数据集的总体正确率在90%左右,高于sp-hi、botsw-bd、boss方法。在上述数据集中,基础的深度神经网络模型也能达到超出其他复杂方法的判别精度。经过模型融合后可以得到更好的结果,即使在基于单特征的判别模型正确率达到99%的超高精度情况下,融合模型仍能够提升判别精度。

(2)在航发故障数据集上的实验

1)航发故障数据集情况:

本实验使用的航发故障数据集来源于中国航发沈阳发动机研究所(606所),数据集中有a、b两种发动机机型的故障数据,每种机型数据有23维属性、5种故障模式。经过实验对比,共取每种机型60000条各种故障类别样本时,训练出的模型效果最好。

2)数据处理:

对上述样本进行如下处理:

数据清洗:去除各类故障数据中首尾的0元较多的样本序列;

数据归一化:将样本各维属性按公式进行归一化,增加属性间的可比性;

数据集分割:取70%的样本数据作为训练和验证集,30%留作测试集;

加入噪声模拟真实环境:本数据集中数据的采集环境为温度和气压相对稳定的实验室,为还原高空真实的恶劣工作环境的对数据采集的影响,随机选取了四分之一的样本数据加入了高斯白噪声。

实验步骤按具体实施方式中描述的步骤进行,得到的两个单特征模型的最优状态下超参数及其对故障数据集的判别精度如表3和表4所示。表4中也给出了利用d-s证据理论融合后的模型的正确率。

表3航发故障数据集实验两种神经网络最佳状态下超参数

表4航发故障数据集实验结果

在两种机型的故障数据集上,与单特征的最大值相比,融合后模型的精度均提高了0.25%。实验结果表明利用d-s证据理论将两种单特征模型进行决策融合可以有效提升判别精度,此模型对于航发故障分类问题具有很好的效果。

以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1