基于深度学习与高斯分布的航空发动机气路异常检测方法与流程

文档序号:11433537阅读:363来源:国知局
基于深度学习与高斯分布的航空发动机气路异常检测方法与流程
本发明涉及航空发动机气路异常检测方法,属于航空发动机故障诊断
技术领域

背景技术
:作为飞机的心脏,健康的航空发动机对于保证飞行的安全性、可靠性以及经济性来说无疑是至关重要的。如果发动机出现的异常不能及时地被发现并采取相应的措施,它们有可能会演变成故障,严重时甚至会导致飞行事故。为提高飞机飞行的安全性、可靠性以及经济性,除了对发动机本体进行定期检查以外,对发动机运行数据进行异常检测也是十分有必要的。具体来说,对发动机运行数据进行准确而及时的异常检测可以使管理者提前分配额外的监控资源,有效地安排预防性维护计划,最大化发动机在翼时间,提高发动机的可靠性,减少计划外维修活动所消耗的成本([4]zhongss,luoh,linl,andfuxy.animprovedcorrelation-basedanomalydetectionapproachforconditionmonitoringdataofindustrialequipment[c],ottawa:ieeeinternationalconferenceonprognosticsandhealthmanagement,2016,pp.1-5.)。快速存储记录仪(qar)数据中包含了发动机大量的有用信息,但是目前很少被用于航空发动机气路异常检测的工程实践中。因此,有必要对基于qar数据的航空发动机气路异常检测方法进行研究。随着航空发动机健康管理技术的不断发展,国内外多家企业以及科研机构纷纷开始对qar数据进行研究。西方发达国家的多家航空公司逐步认识到qar数据在发动机异常检测中的重要作用,将qar数据异常检测结果作为发动机维修决策的重要依据。总部位于加拿大的caeflightscape公司开发了insight软件包,insight是一个基于windows系统模块化功能齐全架构开放的飞行数据分析工具,其典型应用包括飞行数据分析、工程化、飞机性能、飞行测试、事故调查以及飞行品质监控,上述多项应用中都利用了qar数据([5]http://www.flightscape.com/products/.)。美国国家航空航天局(nasa)开发了apms(aviationperformancemonitoringsystem)软件,该软件能够高度自动地处理海量飞行数据(包括qar数据),以定时或者日常的方式来解决与操作性能和安全有关的问题([6]https://www.nasa.gov/centers/ames/research/technology-onepagers/aviation-performance.html)。通用电气(ge)公司正在与全世界多家航空公司合作,收集航空公司的qar数据。ge以qar数据作为数据源,然后应用包括机器学习算法、物理建模在内的多种手段对航空发动机进行异常检测、故障诊断、燃油消耗等分析,为航空公司的管理决策提供有力依据。除了工业界的研究以外,航空发动机故障诊断领域的多位学者也对发动机异常检测问题进行了研究。以发动机真实或者仿真数据为基础,多位学者提出了包括神经网络(nn)、支持向量机(svm)在内的各种智能算法模型来对发动机进行异常检测。([7]qiuh,eklundn,hux,yanwz,andiyern.anomalydetectionusingdataclusteringandneuralnetworks[c],internationaljointconferenceonneuralnetworks,2008,pp.3627-3633.[8]soumiks,jinx,andasokr.data-drivenfaultdetectioninaircraftengineswithnoisysensormeasurements[j].journalofengineeringforgasturbines&power.2011(133):783-789.[9]wangzt,zhaonb,wangwy,tangr,andlisy.afaultdiagnosisapproachforgasturbineexhaustgastemperaturebasedonfuzzyc-meansclusteringandsupportvectormachine[j].mathematicalproblemsinengineering.2015:1-11.)。按照研究角度的不同,当前航空发动机的异常检测方法大体可以分为5类:1)气路异常检测2)振动异常检测3)滑油异常检测4)静电异常检测5)多源信息融合异常检测。以往的统计资料表明发动机90%的失效都与气路部件有关,相应的维修费用占据整个发动机维修费用的60%([1]zhaon,wenx,andlis.areviewongasturbineanomalydetectionforimplementinghealthmanagement[c],southkorea:proceedingsofasmeturboexpo2016:turbomachinerytechnicalconferenceandexposition,2016,pp.1-14.)。通过对航空发动机气路异常检测研究现状的分析,主要存在以下三个方面的不足:(1)当前大部分关于发动机气路异常检测方法的研究都是以发动机制造商提供的性能偏差数据(oem数据)为基础。oem数据具有实时性好、获取方便等优点,但是采样周期长,一般情况下一个飞行循环只记录一两个数据点,比较适合于趋势分析而不是异常检测。除此以外,oem数据参数较少,难以全面地反映发动机实际状态。因此,基于以上两点分析,oem数据不能满足发动机异常检测的实际需要。相比于oem数据,qar数据具有采样周期短,记录参数全面等优点,作为发动机异常检测的数据源比较合适。但是qar数据量巨大、维度高等特点给以往的异常检测算法带来了挑战,使得其目前并没有广泛应用于航空发动机异常检测的工程实践中。(2)当前的航空发动机气路异常检测研究大部分都是针对单台发动机的运行数据进行建模分析;而工况转换以及外界环境变化等因素对发动机气路性能参数变化影响大,导致发动机异常检测的虚警率高。(3)发动机异常检测领域的大部分研究都是直接依据发动机原始数据构建智能模型来识别异常。原始数据中通常会包含较多的噪音,且维度高,这些都会导致发动机异常检测准确度低。技术实现要素:本发明的目的是为了解决现有的发动机气路异常检测方法中qar数据没有得到广泛应用、发动机异常检测的虚警率高以及准确度低的问题,而提出基于深度学习与高斯分布的航空发动机气路异常检测方法。基于深度学习与高斯分布的航空发动机气路异常检测方法具体过程为:步骤一、在qar数据中选择参数集,参数集包括发动机气路性能参数和外界环境参数;qar为快速存储记录仪;步骤二、在步骤一选取的参数集中计算同一架飞机上两台发动机性能参数的差异值,将差异值与外界环境参数构成新的参数集;步骤三、选用深度学习方法中的堆积去噪自动编码器(sdae)模型对步骤二中的新参数集提取数据特征;步骤四、采用基于高斯分布的密度估计算法对步骤三得到的数据特征进行异常检测,得到检测结果。本发明的有益效果为:(1)本发明针对基于qar数据的航空发动机气路异常检测方法进行了研究。该方法能够有效利用qar数据采样周期短、记录参数全面等优点,相比原先的方法本发明将qar数据应用于航空发动机异常检测中,进一步提高了异常检测准确度,能够及时发现航空发动机可能的异常,为航空公司的机队管理与维修决策提供依据,解决了现有的发动机气路异常检测方法中qar数据没有得到广泛应用的问题。(2)本发明提出将同一架飞机上两台发动机性能参数的差异值作为模型参数,这样可以减小工况转换以及外界环境变化等因素对气路性能参数变化的影响,从而提高发动机异常检测的准确度;而且还能够减小计算量,加快异常检测速度。(3)本发明采用深度学习方法从原始数据中自动提取特征,将从深度学习模型中提取的特征用于后续的异常检测任务。这样做可以降低模型参数的维度,使模型参数更加具有区分性,增强了异常检测模型的鲁棒性,提高了发动机异常检测的准确度。由表3可以看出本发明提出的基于堆积去噪自动编码器(sdae)和高斯分布的异常检测方法的精度值为0.9951,现有的去噪自动编码器(dae)和高斯分布异常检测方法的精度值为0.7890,现有的高斯分布异常检测方法的精度值为0.6905,本发明提出的基于堆积去噪自动编码器(sdae)和高斯分布的异常检测方法具有最高的精度和f1值(粗体表示)。与现有方法相比,本发明方法降低了虚警率,提高了异常检测准确度。试验结果证明了本发明提出方法的优越性。附图说明图1为某一段qar数据中两台发动机排气温度(egt)时间序列数据;图2为去噪自动编码器结构示意图,l(x,z)为原始数据与重构数据之间的误差;图3为基于深度学习与高斯分布的航空发动机气路异常检测方法总体框架图。具体实施方式具体实施方式一:本实施方式的基于深度学习与高斯分布的航空发动机气路异常检测方法具体过程为:步骤一、在qar数据中选择参数集,参数集包括发动机气路性能参数和外界环境参数;qar为快速存储记录仪;步骤二、在步骤一选取的参数集中计算同一架飞机上两台发动机性能参数的差异值,将差异值与外界环境参数构成新的参数集,作为步骤三的输入;步骤三、选用深度学习方法中的堆积去噪自动编码器(sdae)模型对步骤二中的新参数集提取数据特征;步骤四、采用基于高斯分布的密度估计算法对步骤三得到的数据特征进行异常检测,得到检测结果。具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤一中在qar数据中选择参数集,参数集包括发动机气路性能参数和外界环境参数;具体过程为:在qar数据中选择参数集对航空发动机进行气路异常检测前,首先根据航空发动机本体的结构特点与工作原理,同时结合工程实际经验,选取与发动机气路性能最为密切,对发动机气路性能变化最为敏感的参数构成发动机气路异常检测参数集。参数集表示:s={p1,p2,...pj,...pk,p1′,p2′,...pj′,...pk′,e1,e2,...eq,...er}式中,s为在qar数据中选择的参数集,其中pj为左发动机第j个气路性能参数,pk为左发动机第k个气路性能参数,1≤j≤k,k取值为正整数;pj′为右发动机第j个气路性能参数;pk′为右发动机第k个气路性能参数;eq为参数集中第q个外界环境参数,er为参数集中第r个外界环境参数,1≤q≤r,r取值为正整数。其它步骤及参数与具体实施方式一相同。具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述步骤二中在步骤一选取的参数集中计算同一架飞机上两台发动机性能参数的差异值;具体过程为:δj=pj'-pj式中,δj为两台发动机第j个气路性能参数的差异值。当前关于航空发动机气路异常检测的研究通常都是将异常检测算法运用于单台发动机的运行数据中来识别异常点。这样做有两点不足。一是发动机的气路性能参数会受到工况转换、海拔高度、温度、湿度、飞行马赫数等因素的影响而发生明显地变化,这种变化会导致当前异常检测方法的效果变差。二是每个qar数据文件都包含两台发动机的运行数据,当前方法需要对每台发动机的运行数据单独运行异常检测算法,也就是对每个qar数据文件都运行两次算法,计算效率低。根据理论分析以及工程师的经验,同一架飞机的两台发动机由于所处的工况与外界环境相同,推力大小比较接近,因此两台发动机的性能参数差异值一般保持在一个较小的范围内。同时工程实践经验也表明同一架飞机两台发动机同时出现异常的概率非常小。依据上述两点,我们可以将同一架飞机两台发动机的性能参数差异值大小作为异常检测的依据。相比以往针对单台发动机性能参数进行的异常检测,两台发动机性能参数差异值减弱了工况转换以及外界环境变化对异常检测算法的不利影响,因此该方法具有更高的异常检测准确度。同时工程实践也证明两台发动机性能参数差异值变化对发动机气路异常具有较高的敏感度。因此本发明中我们将同一架飞机两台发动机的性能参数差异值以及外界环境参数组成新的参数集作为模型的输入,用来判断两台发动机中是否有一台出现了异常。某段qar数据中两台发动机排气温度(egt)的时间序列数据如图1所示。如图1所示,前面500个样本为正常值,后面红色方框内包含50个异常样本。从图1中不难发现,当两台发动机都处于健康状态时,两台发动机的排气温度差异值仅在较小范围内波动。当右发动机出现异常时,两台发动机排气温度差异值变的很大,如图1中方框内的数据所示。其它步骤及参数与具体实施方式一或二相同。具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:所述步骤三中选用深度学习方法中的堆积去噪自动编码器(sdae)模型对步骤二中新的参数集提取数据特征;具体过程为:堆积去噪自动编码器(sdae)模型是深度学习方法中的一种,当前它已经在图像、语音以及视频识别等方面得到了一些成功的应用。该模型将去噪自动编码器(dae)作为其浅层学习单元。dae是自动编码器(ae)的一种变体。与ae相同的是,dae也是一种对称的神经网络结构,它通过最小化重构误差可以无监督地学习数据中的特征。与ae不同的是,dae在训练过程中对输入进行了“污染”,并尽可能缩小重构数据与原始数据之间的误差。通过该种结构设计,dae被训练成从被“污染”的数据中重构“干净”的输入,增加了提取特征的鲁棒性。如图2所示,一个dae中的数据包括输入数据x,被“污染”数据中间特征表示h以及重构数据z。它主要由编码器和解码器两部分组成。取步骤二中的新参数集作为dae模型的输入数据x,通过将dae模型的输入数据x污染成为编码器输入数据,qd(·)为随机匹配函数;过程为:dae为去噪自动编码器;a)在dae模型输入数据x,为实数空间,n为新参数集中数据维度,qd(x)为在输入数据x中随机选择ν%的样本并将其值设置为0,0<ν<100;通过将x污染成污染后的编码器输入数据通过编码器函数f(x)被映射到隐层h,编码器函数f(x)用公式1和公式2表示,s(x)=1/(1+e-x)(2)式中,w是一个m×n的权重矩阵,为偏置向量;为实数空间,n为新参数集中的数据维度,m为隐层h的维度,s(·)为s型(sigmoid)函数;隐层h通过解码器函数g(x)被映射到dae模型输出数据z;解码器函数g(x)用公式(3)和(4)表示:z=g(h)=s(w'h+b')(3)s(x)=1/(1+e-x)(4)式中,w'=wt是一个n×m的权重矩阵,是一个偏置向量,t为转置,dae模型的目标函数是输入数据x与输出数据z之间的误差平方和,如公式(5)所示:式中,jdae(w)是dae模型输入数据x与模型输出数据z之间的误差平方和;dae模型通过使公式(5)中的目标函数值最小来找到最优参数集{w,b,w',b'};dae模型通过梯度下降法找到最优参数集;([2]yanww,guopj,liangg,andlizk.nonlinearandrobuststatisticalprocessmonitoringbasedonvariantautoencoders[j].chemometrics&intelligentlaboratorysystems.2016(158):31-40.);目标函数的优化过程促使dae选择那些能够最大程度重构模型输入并且包含最丰富信息的压缩表示。另外,通过“污染”输入数据,dae能够学习消除数据中的噪声,dae提取的特征在鲁棒性方面通常要优于传统的ae。b)将隐层h作为下一个dae模型的输入,重新执行步骤a)得到新的隐层h′;新的隐层h′即为数据特征;将得到的两个dae模型堆叠起来构成堆积去噪自动编码器(sdae)模型;在堆积去噪自动编码器(sdae)模型的训练过程中,不断调整模型自身结构参数,(包括隐层个数、输出神经元个数以及学习率等)以寻找到一个使f1值(异常检测准确度指标)最大的最优sdae模型自身结构参数。当前主要依靠人工经验以及多次试验来搜寻合适的模型自身结构参数。针对某段qar数据,选定的堆积去噪自动编码器模型自身结构参数如表2所示。表2堆积去噪自动编码器模型自身结构参数参数去噪自动编码器1去噪自动编码器2输入神经元个数1420隐层神经元个数206输出神经元个数1420激活函数s型函数s型函数学习率11噪音率0.050.05循环数55批量大小1010其它步骤及参数与具体实施方式一至三之一相同。具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:所述步骤四中采用基于高斯分布的密度估计算法对步骤三得到的数据特征进行异常检测,得到检测结果;具体过程为:根据varunchandol等人的研究([3]chandolav,banerjeea,andkumarv.anomalydetection:asurvey[j].acmcomputingsurveys.2009(41):1-58.),异常检测方法可以被划分为有监督的、无监督的以及半监督的。现代航空发动机的高可靠性决定了发动机正常状态的数据很多而且容易获得,异常状态的数据很少而且不容易获得。这种情况下通常采用半监督的异常检测方法是更合适的选择。在半监督异常检测方法中,我们选择了一种基于高斯分布的密度估计方法。该方法的基本假设是研究数据服从高斯分布。该方法具有检测精度高、方便编程实现以及计算速度快等优势,可以较好地解决异常检测问题。在执行异常检测前,对于新的隐层(具体实施方式四中的隐层)h′={a(1),...a(l)...,a(d)},需要建立每个维度a(l)的高斯分布模型;a(d)为新的隐层h′中第d个维度,1≤d<n,a(l)为新的隐层h′中第l个维度,1≤l≤d,高斯分布模型有两个参数:均值μ(l)与标准差σ(l);采用最大似然估计(mle)方法估计每个维度a(l)的均值μ(l)和标准差σ(l);计算方程如公式(6)与公式(7)所示:式中,μ(l)和σ(l)分别是第l个维度a(l)的均值和标准差;c为样本个数(数据矩阵中的每一行可以理解为一个样本,每个样本包含多个参数。数据矩阵中某一列由所有样本的某个参数构成),取值为正整数;ai(l)为第i个样本在第l个维度上的数值;在获得第l个维度a(l)的均值和标准差后,第l个维度a(l)的高斯分布模型用公式(8)表示:式中,为ai(l)出现在第l个维度a(l)中的概率;假设数据服从高斯分布,在对每个维度建立高斯分布模型以后,我们可以计算每个样本属于该数据集的概率。通常来说,那些概率值较低的样本很有可能是异常。假设存在一个临界值ε,通过临界值ε划分正常样本与异常样本,划分方法通过公式(9)表示:式中,y是预测结果,p(ai)是第i个样本出现在给定数据分布中的概率,normal为正常样本,abnormal为异常样本;合适的临界值ε对于准确地识别异常样本是至关重要的。通常随机选择一部分包含异常的样本作为交叉验证集,选定不同的ε值,采用前面阐述的方法对交叉验证集进行异常检测,选取异常检测准确度最高时所取的ε值作为最终的临界值ε。通过比较不同ε值下异常检测的准确度,我们可以选择一个合理的ε值。其它步骤及参数与具体实施方式一至四之一相同。具体实施方式六:本实施方式与具体实施方式一至五之一不同的是:所述临界值ε确定过程为:比较不同ε值下精度、召回率以及f1的值,根据精度、召回率以及f1值评估异常检测方法的效果好坏,计算公式如公式(10)、(11)以及(12)所示:式中,tp为准确识别出的异常点数量(该点是异常,算法正确地将其归类于异常);fp为假异常点的数量(该点不是异常,算法错误地将其归类于异常);fn为假正常点的数量(该点是异常,算法错误地将其归类于正常);prec为精度,rec为召回率,f1融合了prec和rec,是用来评价异常检测算法效果好坏的综合指标;所述临界值ε选取使f1值最大的值。其它步骤及参数与具体实施方式一至五之一相同。具体实施方式七:本实施方式与具体实施方式一至六之一不同的是:所述步骤一中在qar数据中选择参数时要满足三个条件:1)、选取的参数(不论是气路参数还是外界环境参数)在qar数据集中需要有完整的记录;2)、选取的参数集要能够表征发动机气路性能的变化,或者说选取的参数都需要与发动机气路性能密切相关;3)、新选择的参数不能够与已选择的参数有确定的函数关系。这样会导致异常检测参数集冗余,不利于后续计算。比如针对某型常用航空发动机的qar数据记录,选取的14个参数如表1所示。表1针对某型常用航空发动机qar数据选取的14个参数参数名称缩写参数中文含义参数单位egt发动机排气温度摄氏度epr发动机压比1wf燃油流量磅/小时n1低压转子转速100%n2高压转子转速100%p2发动机进口总压磅/平方英寸p25低压压气机出口总压磅/平方英寸t25低压压气机出口总温摄氏度t3高压压气机出口总温摄氏度svapos静子叶片作动器开度100%fmvwf燃油计量活门燃油流量磅/小时bp燃烧室压力磅/平方英寸tat大气总温摄氏度alt高度英尺其它步骤及参数与具体实施方式一至六之一相同。采用以下实施例验证本发明的有益效果:实施例一:本实施例基于深度学习与高斯分布的航空发动机气路异常检测方法具体是按照以下步骤制备的:本发明提出的基于深度学习与高斯分布的航空发动机气路异常检测方法的总体框架如图3所示:以某型民用涡轮风扇航空发动机的qar数据作为试验样本,验证本发明提出的发动机气路异常检测方法总体框架的有效性,并与另外两种方法进行对比。试验结果如表3所示。表3不同方法的试验结果方法精度召回率f1值高斯分布0.690510.8167dae+高斯分布0.789010.8816sdae+高斯分布0.995110.9975由表3可以看出本发明提出的方法具有最高的精度和f1值(粗体表示)。与其他方法相比,本发明提出的方法大大提高了精度,改进了异常检测的效果。试验结果证明了本发明提出方法的优越性。本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1