基于集成GMDH框架的旋转机械剩余寿命预测方法与流程

文档序号:19376602发布日期:2019-12-10 23:56阅读:276来源:国知局
基于集成GMDH框架的旋转机械剩余寿命预测方法与流程

本发明属于旋转机械剩余寿命预测技术领域,具体涉及一种基于集成gmdh框架的旋转机械剩余寿命预测方法。



背景技术:

在机械工业领域中,旋转机械设备是最常用的设备,常常工作于重载荷、高强度等恶劣工作环境,也因此容易产生各类故障而影响其正常运行,甚至中断生产,严重地影响生产质量和工作效率。一旦故障发生而不能被及时发现和妥善处置,故障点可能快速蔓延,从而造成连锁反应,使整个生产线上的成套设备都瘫痪,同时极易引发灾难事故,威胁到人们的生命财产安全。因此,为了保障设备长期稳定地安全运行,实现旋转机械设备的早期故障预报,研究旋转机械剩余寿命预测技术显得尤为迫切和必要。

目前常用的预测方法是基于数据驱动的预测方法,该方法主要利用机器学习算法,通过历史数据建立系统的状态数据与剩余寿命之间的关联,从而预测设备的剩余寿命。基于数据驱动的预测方法主要有lstm网络和gmdh网络,其中lstm(longshort-termmemory,长短时记忆)网络主要分为两步:第一步进行特征提取,对数据进行经验模态分解,并以分解得到的imf能量熵之和作为机械状态特征,第二步设计lstm网络的结构并进行仿真验证,从而有效避免参数选取的难题,但是它通过调整窗口宽度等步骤具有的结构上的优势并不能带来综合不同维度参数后的最优解。ivakhnenko提出的gmdh网络能够根据训练数据自组织生成拟合精度与泛化能力达到平衡的最优网络结构,避免模型结构的过拟合与不足拟合,减少建模者主观因素的影响。因此,gmdh模型广泛应用于各种领域的预测,并取得了很好的预测效果。但是gmdh网络的建模过程基于对训练样本的划分,不同的样本划分将产生不同的模型,这些模型是在当前样本划分下记忆能力与泛化能力达到最优平衡的模型,但是并不能确保这些模型的全局最优性。因此,运用单一gmdh网络建立的预测模型易陷入局部最优,泛化能力不强。



技术实现要素:

本发明的目的是解决目前旋转机械剩余寿命的预测方法泛化能力不强、模型适用条件单一等问题,提出了一种基于集成gmdh框架的旋转机械剩余寿命预测方法,主要包括如下步骤:

s1.选取多个同一种类旋转机械,分别采集从正常运行到故障失效过程中的多个传感器数据,构造历史数据集{x,y},其中x为m×n矩阵,每行xt∈rn为t时刻n个传感器的读数,m为不同时间采集的样本总数,y为m×1向量,每行yt∈r为t时刻设备真实剩余寿命,通过数据处理得到训练数据集w;

s2.将训练数据集w进行有效划分,分别用于构建三个具有差异性的gmdh预测网络;

s3.将历史数据集的所有xt同时输入三个gmdh网络,得到的三个预测值组合成一个向量作为三层bp神经网络的输入,yt作为bp神经网络的输出,对三层bp神经网络进行训练,得到一个由三个gmdh网络和一个三层bp神经网络组合而成的集成gmdh框架;

s4.利用所述集成gmdh框架对旋转机械剩余寿命进行预测,计算并输出剩余寿命预测值。

进一步地,所述s1中的数据处理过程如下:

s11,对无效特征的识别方法为找出每个传感器测量值序列的最大值和最小值,判断它们是否相等,若它们相等,则该传感器的数据对训练过程不提供有效信息,为无效特征,将其剔除,;

s12,将传感器测量值归一化,即具有零均值和单位方差:

其中,xj为矩阵x的第j列,是第j个传感器测量值的时间序列,mean(xj)和std(xj)分别是序列xj的均值和标准差,是归一化后的传感器测量值;

s13,以某一恒定的剩余寿命值对响应y进行裁剪,使用的目标剩余寿命函数为分段线性退化模型,当系统相对较新时,将rul建模为常数值,随着时间的推移它会线性降低。

进一步地,所述s2具体步骤如下:

s21.将训练样本w平均划分为3部分ta,tb和tc,w=ta∪tb∪tc;

s22.其中一部分作为选择集合,另外两部分作为构造集合,分别构建3个gmdh预测网络。

进一步地,所述s22中单个gmdh网络的构造过程如下:

s221,对输入变量进行两两组合产生k个中间模型,参考函数采用如下形式:

式中,i≠j,i,j=1,2,...,m,系数a、b、c、d、e、f由构造集合的数据根据最小二乘法估计;

s222,用选择集合的数据按选定的外准则对得到的所有中间模型进行评估,这里采用均方根误差判据:

其中,为yi的估计值,ns为选择集合中的样本数。在所得到的k个中间模型中筛选留下rk值最小的m1个,其输出作为下一层的输入,并记下该层最小的rk值,记为rmin,m1一般取输入变量个数;

s223,重复第一步和第二步,求出rmin,如果产生的rmin比上一次产生的rmin小,再重复第一步和第二步的过程,直到产生的rmin比上一次产生的要大,停止迭代;

s224,根据最优复杂度原理找到最优复杂度模型,即将上一层中rmin值最小的中间模型作为输出单元,然后将与输出单元相关的下层中间模型逐层连接,以完成gmdh网络的建立。

进一步地,所述s3中三层bp神经网络的隐层中神经元都使用“tanh”激活函数,输出层有1个神经元并使用整流线性单元激活函数;训练bp网络时采用的成本函数为均方误差:

其中,m是训练数据样本的总数,yi与分别为第i个数据点的真实剩余寿命值和预测剩余寿命值。

本发明弥补了现有旋转机械剩余寿命的预测方法泛化能力不强、模型适用条件单一等缺陷,创新性的提出了一种集成多个gmdh网络和一个三层bp神经网络组合而成的集成gmdh框架,通过对一组训练数据的不同划分,同时生成三个具有差异性的gmdh网络,然后利用一个三层bp神经网络对三个gmdh网络的结果进行集成,从而有效地避免了陷入局部最优的不足,能够确保模型的全局最优性,更为精确的对旋转机械剩余寿命进行预测,提高了泛化能力和预测精度,保障设备长期稳定地安全运行,实现旋转机械设备的早期故障预报,为加强生产安全和提高生产效率做出了突出的贡献。

附图说明

图1是本发明的流程图。

图2是本发明的结构图。

图3是训练观测值1的剩余寿命目标函数。

图4是测试集中的4个样本引擎单元的寿命rul预测结果。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参照图1-2,一种基于集成gmdh框架的旋转机械剩余寿命预测方法,包括如下步骤:

s1.选取多个同一种类旋转机械,分别采集从正常运行到故障失效过程中的多个传感器数据,构造历史数据集{x,y},其中x为m×n矩阵,每行xt∈rn为t时刻n个传感器的读数,m为不同时间采集的样本总数,y为m×1向量,每行yt∈r为t时刻设备真实剩余寿命,通过数据处理得到训练数据集w。

所述数据处理步骤如下:

s11.剔除具有常量值的特征,一些传感器读数对于剩余寿命的估计不提供有效信息,因为它们在旋转机械的使用寿命中都保持不变,可能对训练产生负面影响。因此,找到最小值和最大值相同的传感器测量值,然后去除这些特征;

s12.将xt归一化为具有零均值和单位方差;

s13.使用分段线性退化模型来作为目标剩余寿命函数,以恒定的剩余寿命值对响应y进行裁剪。在神经网络训练时,我们应该准确地知道对应于输入数据的输出。然而,在健康管理的预测中,用于训练网络的目标rul的准确知识通常是不可得到的,一般是用基于物理学的模型来估计的。我们使用分段线性退化模型来确定目标rul,分段线性rul目标函数具有防止算法过高估计rul的优点,这种方法表示系统在其运行的初始阶段是健康的,当系统接近其“寿命终止”时,退化会增加。因此,当系统相对较新时,将rul建模为常数值,随着时间的推移它会线性降低,这是合理的。以恒定的rul值对响应y的最高值进行裁剪,从而限定网络输出rul值的最高值。

s2.将数据集通过不同的划分,分别用于构建三个具有差异性的gmdh预测网络。

所述s2具体步骤如下:

s21.将训练样本平均划分为3部分ta,tb和tc;

s22.其中一部分作为选择集合,另外两部分作为构造集合,分别产生3个gmdh预测网络。

所述步骤s22中单个gmdh网络的构造过程包括:

s221.对输入变量进行两两组合产生k个中间模型,参考函数采用如下形式:

式中,i≠j,i,j=1,2,...,m,系数a、b、c、d、e、f由构造集合的数据根据最小二乘法估计。

s222.用选择集合的数据按选定的外准则对得到的所有中间模型进行评估,这里采用均方根误差判据:

其中,为yi的估计值,ns为选择集合中的样本数。在所得到的k个中间模型中筛选留下rk值最小的m1个,其输出作为下一层的输入,并记下该层最小的rk值,记为rmin,m1一般取输入变量个数。

s223.重复s221和s222,求出rmin,如果产生的rmin比上一次产生的rmin小,再重复第一步和第二步的过程,直到产生的rmin比上一次产生的要大,停止迭代。

s224.根据最优复杂度原理找到最优复杂度模型,即将上一层中rmin值最小的中间模型作为输出单元,然后将与输出单元相关的下层中间模型逐层连接,以完成gmdh网络的建立。

s3.将历史数据集的所有xt同时输入三个gmdh网络,得到的三个预测值组合成一个向量作为三层bp神经网络的输入,yt作为bp神经网络的输出,对三层bp神经网络进行训练,得到一个由三个gmdh网络和一个三层bp神经网络组合而成的集成gmdh框架。

所述步骤s3中,三层bp神经网络的隐层中神经元都使用“tanh”激活函数,输出层有1个神经元并使用整流线性单元激活函数;训练bp网络时采用的成本函数为均方误差:

其中m是训练数据样本的总数,yi与分别为第i个数据点的真实剩余寿命值和预测剩余寿命值。

s4.利用所述集成gmdh框架对旋转机械剩余寿命进行预测,计算并输出剩余寿命预测值。

下面结合实施例来验证本发明有效性和正确性,数据来源于nasa的涡轮风扇发动机退化仿真数据集1。

训练数据包含100台发动机的仿真时序数据,长度各不相同,每个时序代表一台发动机。每台发动机启动时的初始磨损程度和制造变差均未知。在训练集中,发动机在每个时序开始时运转正常,在到达序列中的某一时刻时出现故障,故障的规模不断增大,直到出现系统故障。数据集以20631×26矩阵排列,其中20631为数据集中的数据点的数量。每一行是在一个运转周期中截取的数据快照,每一列代表一个不同的变量。26列数据包括两个表示发动机编号和当前运行周期次数的索引值,三个对发动机性能有重大影响的运行设置参数,以及21个传感器值。测试数据包含100个不完整序列,每个序列的末尾给出相应的剩余使用寿命值。实验的目标是利用提出的框架根据表示发动机中各种传感器的时序数据来预测发动机的剩余使用寿命(以周期为单位度量)。

c-mapss数据集由21个传感器测量值组成,但是一些传感器读数对于rul的估计不提供有效信息,因为它们在发动机的使用寿命中都保持不变,可能对训练产生负面影响。因此,找到最小值和最大值相同的传感器测量值,然后剔除这些特征,最后留下17个特征供选择。

将训练数据归一化为具有零均值和单位方差。以恒定的rul值100对响应进行裁剪,从而网络将具有更高rul值的实例视为等同。图3显示了第一个观测值及其对应的裁剪响应。

训练过程分两个阶段,第一阶段是通过对训练样本的不同划分训练产生不同的三个gmdh网络个体,第二阶段是将三个gmdh网络在训练样本上的输出连接成一个向量作为融合层的输入进行训练,目标是获得多层融合神经网络的最佳参数(权重和偏置),以使成本函数最小化。

对测试集中的100组发动机的rul值进行预测,测试集中的4个样本引擎单元的寿命rul预测结果如图4所示。从图中可以看出,预测的rul值基本反映了实际趋势,同时随着rul值的减小,对发动机的预测精度依然较高。这一点更具实际意义,因为较小的rul值更接近寿命终止,需要更高的预测准确性,在最佳时间执行cbm操作,从而及时避免灾难性故障的发生。

为了评价该方法的有效性,选取均方根误差(rmse)作为预测模型的性能评价指标,计算100组预测值的均方根误差。在测试数据基础上,选取经典的lstm网络和单个gmdh网络作为对比,分别利用两种方法对测试数据的100组rul值进行预测,计算均方根误差,得到的结果如下表:

从上表可以看出,集成gmdh框架可以改善单个gmdh网络易陷入局部最优的不足,从而提高泛化能力与预测精度。同时,集成gmdh框架在此测试集上的表现要优于lstm网络,充分体现了此方法的优越性。

以上具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明原理及实质的情况下,可对上述方法细节进行各种省略、替换和改变。本发明范围由所附权利要求书限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1