一种基于深度学习的机械装备故障诊断方法与流程

文档序号:22625317发布日期:2020-10-23 19:33阅读:257来源:国知局
一种基于深度学习的机械装备故障诊断方法与流程

本发明涉及系统故障诊断技术领域,特别涉及一种基于深度学习的机械装备故障诊断方法。



背景技术:

在智能制造中,装备的智能运维与健康管理必然会直接渗透到企业的运营管理乃至产品的整个生命周期,从而减少企业损失和影响企业的决策。而智能制造新模式关键要素之一为“远程运维服务”,其核心内容为:建立标准化信息采集与控制系统、自动诊断系统、基于专家系统的故障预测模型和故障索引知识库;可实现装备(产品)远程无人操控、工作环境预警、运行状态监测和故障诊断与自我修复等。

故障诊断技术在大型系统,特别是工业系统中起着至关重要的作用,其能通过检测获取诊断对象的故障模型,提取故障特征,在此基础上,根据预定的推理原则,对故障信息作出综合评估,并向系统的操纵者或控制者提示所要采取的措施,从而避免系统故障导致的人身、财产损失。在故障诊断技术的基础理论方面,最开始使用的是传统的故障诊断算法,如时域平均、快速傅里叶变换、包络谱分析、功率谱和倒频谱等分析方法。近些年故障诊断行业的学者已经开始使用先进人工智能算法来解决装备故障诊断的问题,如基于物理模型的故障诊断方法、基于经验的故障诊断方法,但上述方法仍然存在缺陷,具体为:

(1)基于物理模型的故障诊断方法很大程度上依赖于模型的好坏,且设备部件与不确定的工况密切相关,且其退化过程通常是非线性的,因此该类方法的应用场合十分受限;

(2)基于经验的故障诊断方法主要利用经验反馈数据(如失效时间)来调整一些分析模型(如威布尔分布、指数分布)的参数,通过这些参数模型估计系统的失效时间,但往往存在预测精度不够理想、过度依赖知识和经验等问题。

基于上述缺陷,现有技术做出了改进,如公开号为cn108645615a的专利文献公开了一种自适应模糊神经网络齿轮剩余寿命预测方法。如图1所示,该方法利用振动传感器对齿轮退化实时监测,将模糊系统和神经网络结合,用神经网络自学习机制补偿模糊控制系统的不足,建立一种模糊神经网络,并在模糊处理层所有节点加入记忆单元,将上一时刻信息记忆并应用到当前时刻的输出上,使信息持续保存,加强信息前后关联。又如公开号为cn109343505a的专利文献公开了一种基于长短期记忆网络的齿轮剩余寿命预测方法。如图2所示,该方法解决了现有rnn(循环神经网络)算法无法解决长时依赖和循环神经网络容易出现梯度爆炸或是梯度消散等现象的问题,建立了基于lstm(长短时记忆网络)的齿轮弯曲疲劳的实时监测数据预测模型。公开号为cn108645615a和公开号为cn109343505a的两篇专利文献虽然都考虑了时间依赖的问题,但是在对机械装备的疲劳状态进行特征提取的部分是利用的均方幅值,该方法的精确度不够,会导致提取出的特征存在问题,影响后续的预测,并且上述技术方案还存在如下问题:

(1)虽然采用了循环神经网络(rnn)、长短时记忆网络(lstm)或者各节点加入了记忆单元,但特征提取部分还是采用的传统方法,不仅会影响特征提取的准确性,更会影响后续健康状态预测的正确性。

(2)上述方案只是针对单一的传感器信号,而实际机械设备的健康状态不仅与实时的监测数据有关,还与其运行参数数据、检验数据有关,上述方案需要考虑的信息还不够全面。

基于上述缺陷可知,现有技术特征提取部分还是采用的传统方法,其精确度不够,不仅会影响特征提取的准确性,更会影响后续健康状态预测的正确性;并且采集数据依靠传感器信号,没有考虑到运行参数数据、检验数据等信息。因而,本领域亟需提出一种基于深度学习的机械装备故障诊断方法。



技术实现要素:

本发明的目的是提出一种基于深度学习的机械装备故障诊断方法,采用双向长短时记忆网络(bd-lstm)进行平滑跟踪和预测结果,处理了由于操作和环境干扰引起的不确定性;传感器监测数据采用卷积神经网络(cnn)和bd-lstm并行提取隐藏特征,两条没有相关性的路径输出都会影响预测,且可根据预测的误差校正网络中的每个参数。

本发明的技术方案是这样方式实现的:

一种基于深度学习的机械装备故障诊断方法,包括以下步骤:

步骤s1:对机械设备的主要数据源和次要数据源进行数据采集并进行预处理,得到数据集,其中,主要数据源为传感器监测数据,次要数据源为运行状态数据和历史检验数据;

步骤s2:采用5折交叉验证方法,将数据集分为训练集、验证集和测试集;

步骤s3:基于cnn和bd-lstm建立故障诊断模型,将训练集输入故障诊断模型中提取隐藏特征后进行训练,并输出诊断结果。

本发明的原理为:

大部分的基于数据驱动的故障诊断方法先用cnn提取特征,再用某个方法进行故障诊断,忽略了特征提取的结果会影响后续预测诊断的准确度,且cnn不能根据lstm的预测误差来校正。而本发明为了处理由于操作和环境干扰引起的不确定性,采用bd-lstm进行平滑跟踪和预测结果。传感器监测数据采用cnn和bd-lstm并行提取隐藏特征,将bd-lstm直接应用在数据中,两条路径之间没有相关性,但两条路径的输出都会影响预测,并且可以根据预测的误差校正网络中的每个参数。

常规的lstm模型结构图如图4所示,lstm可以捕捉到较长距离的依赖关系,通过训练过程可以学到记忆哪些信息和遗忘哪些信息。

lstm单元状态被分为两部分,长期状态c(t)和短期状态h(t);沿着状态路径有三个控制门:遗忘门f(t),输入门i(t)和输出门o(t)。

遗忘门f(t)通过sigmoid激活函数来控制从先前的长期状态c(t-1)中移除信息:

输入门i(t)通过sigmoid激活函数来控制信息从当前输出g(t)添加到当前长期状态c(t)中;输出门o(t)使用当前长期状态c(t)的信息来控制当前短期状态h(t)的形成。

输出g(t)实际上是一个标准的循环层:

因此,如果所有控制门均已移除,并且长期状态和短期状态合并,则lstm单元将转换回标准循环层,其中输出g(t)等于输出层z(t)和状态层h(t)。然而在lstm单元中,输出g(t)仅部分转移到当前状态c(t)和h(t)。最后单元输出的控制方程,长期状态和短期状态h(t)如下:

上述表达式中,下划线指示向后的路径,上划线表示候选状态;w和b分别表示对应权重系数矩阵和偏置项;σ、tanh分别表示sigmoid和双曲线正切激活函数。

上述lstm模型存在一个问题,即无法获取当前时间点之后的信息。因此本发明选择了bd-lstm进行建模,bd-lstm结构图如图5所示;

在bd-lstm模型中,通过传感器测量值x得出无量纲的故障,以表示系统状态y。将输入值x(t-k+1),x(t-k+2),...,x(t)替换为对应的系统状态y(t-k+1),y(t-k+2),...,y(t)。网络的输出时单步超前状态预测y(t-k+1),y(t-k+2),...,y(t)。通过将预测状态y′与真实状态y进行对比,可以建立损失函数并将其用于网络的反向传播训练。一旦得到了退化模型,就可以通过预测来得知状态何时达到预定的故障阈值。在每次迭代中,输入均包含前一次迭代中输入的最新的(k-1)个时间步长,以及前一次迭代中最后一个时间步长预测的输出信息。即如果之前迭代输入是[y(t-k+1),y(t-k+2),...,y(t)],则当前的迭代输入是[y(t-k+2),y(t-k+3),...,y(t),y′(t+1)]。

本发明的有益效果在于:

(1)大部分的基于数据驱动的故障诊断方法先用cnn提取特征,再用某个方法进行故障诊断,忽略了特征提取的结果会影响后续预测诊断的准确度,且cnn不能根据lstm的预测误差来校正;在本发明中,传感器监测数据采用卷积神经网络(cnn)和双向长短时记忆网络(bd-lstm)并行提取隐藏特征,两条没有相关性的路径输出都会影响预测,且可根据预测的误差校正网络中的每个参数;

(2)采用双向长短时记忆网络(bd-lstm)进行平滑跟踪和预测结果,处理了由于操作和环境干扰引起的不确定性;

(3)本发明采用批次的训练,将完整的训练数据集分为多个批次在训练过程中输入网络,解决了由于损失函数的不规则性而使网络容易陷入局部最优的问题以及提高计算效率。

附图说明

图1为本发明的一种流程图。

图2为本发明的另一种流程图。

图3为本发明的具体模型。

图4为长短时记忆网络结构图。

图5为双向长短时记忆网络结构图。

图6为双层双向长短时记忆网络结构图。

具体实施方式

下面结合附图和具体实施例对本发明进行说明,如无特殊说明,均为常规方法。

如图1和图2所示,一种基于深度学习的机械装备故障诊断方法,包括以下步骤:

步骤s1:对机械设备的主要数据源和次要数据源进行数据采集并进行预处理,得到数据集,其中,主要数据源为传感器监测数据,次要数据源为运行状态数据和历史检验数据;

传感器监测数据是通过传感器实时采集的测点信息,属于时间序列数据,因此时间序列存在相关性,本发明故障诊断方法的选取中充分考虑到时序相关性,首先获取设备的长期振动信号,再用滑动时间窗来产生短期序列,可获取更多的有用时间信息以提高预测性能。

运行状态数据是装备在运行时自身的属性,例如环境温度、环境湿度、压力等。

历史检验数据是从相关的检验机构(如山东特检院和中国特检院等)出具的检验报告中提取的有效信息,提取内容包括:是否定期检验,定期检验次数,是否存在检验不合格情况,检验不合格的项目和该型号装备是否多次出现该项不合格科目等。

步骤s2:采用5折交叉验证方法,将数据集分为训练集、验证集和测试集;

本发明采用的训练集为机械设备的数据,一般数据量较大,对于k折交叉验证方法来说,一般常用的是5折或者10折,如果训练集相对较大,可通过减小k值,来降低模型在不同的数据块上进行重复拟合的性能评估的计算成本,在平均性能的基础上获得模型的准确评估。

训练集是用来拟合模型,通过设置分类器的参数,训练分类模型;

验证集是模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估;

测试集用来评估最终模型的泛化能力。

5折交叉验证方法步骤为:

步骤a1:将全部训练集s分成5个大小相似的互斥子集,相应的子集称作{s1,s2,…,s5};

步骤a2:对于每一个模型mi,算法执行5次,每次从分好的子集中里面,拿出一个作为验证集,其它4个作为训练集;

步骤a3:根据训练集训练出模型或者假设函数,把这个模型放到验证集上,得到分类率;

步骤a4:计算5次求得的分类率的平均值,作为该模型或者假设函数的真实分类率。

在本发明中,采用5折交叉验证方法充分利用了所有样本,每次迭代过程中每个样本点只有一次被划入训练集或验证集的机会,可降低模型在不同的数据块上进行重复拟合的性能评估的计算成本,在平均性能的基础上获得模型的准确评估。

步骤s3:基于卷积神经网络(cnn)和双向长短时记忆网络(bd-lstm)建立故障诊断模型,将训练集输入故障诊断模型中提取隐藏特征后进行训练,并输出诊断结果。

进一步地,步骤s1中的数据预处理方法还包括如下步骤:

步骤s11,对所采集的数据进行缺失值处理;

步骤s12,对经s11处理的数据进行归一化处理;

步骤s13,对经s12处理的数据进行滑窗处理。在步骤s11中,对运行状态数据和历史检验数据采用多重插补法进行缺失值处理;对传感器监测数据采用删除存在缺失值的方法进行缺失值处理;在步骤s12中,采用z-score标准化方法进行归一化处理。

对传感器监测数据,数据的真实性易受其它因素影响,存在缺失值的样本的其他属性的真实值不能保证,依赖于这些属性值的插补也是不可靠的,所以对于较为主观的传感器监测数据采用删除存在缺失值的方法;而对较为客观的运行状态数据和历史检验数据插补采用多重插补法进行缺失值处理,其可靠性更有保证。

进一步地,故障诊断模型包括输入层、特征提取层、bd-lstm层和全连接层,具体如图3所示;

故障诊断模型输入层用于输入传感器监测数据、运行状态数据和历史检验数据经过预处理后的数据。

特征提取层用于对预处理后的数据进行隐藏特征学习,其中,传感器监测数据采用cnn和bd-lstm并行训练方式,由bd-lstm直接提取多个原始传感器信号中隐藏的特征,也就是将bd-lstm直接应用在数据中。两条路径之间没有相关性,但两条路径的输出都会影响预测,并且可以根据预测的误差校正网络中的每个参数,从而影响传感器监测数据的学习结果;

通过cnn对输入的运行状态数据和历史检验数据进行卷积运算,实现局部特征提取;由于传感器监测数据属于时序数据,而属于次要数据源的运行状态数据和历史检验数据都不具备该性质,因此针对次要数据源采用cnn进行局部特征提取。

bd-lstm层将传感器监测数据、运行状态数据和历史检验数据完成隐藏特征学习后的四个支路的结果结合在一起,再放入bd-lstm中学习更高的特征;在bd-lstm结构中,每个序列在两个单独的lstm中向前和向后呈现,从而允许在每个序列的每个时间步之前和之后均访问完整的信息,反向路径lstm进一步平滑了数据并减轻了噪声影响。

全连接层利用所有特征的学习表示进行最终回归,对所述机械装备的数据进行分类识别,最后实现对机械装备进行故障诊断。

进一步地,bd-lstm为双层双向长短时记忆网络,其网络结构图如图6所示,包括输入层、第一bd-lstm层、连接层、第二bd-lstm层和输出层;

bd-lstm层的网络输入层用于数据的输入;

第一bd-lstm层用于对数据的预测和平滑,并将来自预测和平滑过程的结果串联并通过连接层重新分配到第二bd-lstm层,第二bd-lstm层通过融合来自两个方向路径的结果来获得每个时间步长的最终预测。

bd-lstm模型单元状态被分为长期状态c(t)和短期状态h(t)两部分;沿着状态路径有遗忘门f(t),输入门i(t)和输出门o(t)三个控制门;长期状态、短期状态、遗忘门和输出门表达式分别为:

长期状态:

短期状态:

遗忘门:

输出:

上述表达式中,下划线指示向后的路径,上划线表示候选状态;w和b分别表示对应权重系数矩阵和偏置项;σ、tanh分别表示sigmoid和双曲线正切激活函数。

在bd-lstm模型中,每个序列在两个单独的lstm中向前和向后呈现,从而允许在每个序列的每个时间步之前和之后访问完整的信息。此外,反向路径lstm进一步平滑了数据并减轻了噪声影响。

进一步地,在本发明的故障诊断方法中,针对传感器监测数据采用的cnn与bd-lstm并行连接,也可以采用串行连接的方式,优选地,采用并行连接,具体理由如下:

并行的优点两条路径对模型训练结果都会产生影响,模型更加完善;而串行的缺点忽略了特征提取的结果会影响后续预测诊断的准确度,且cnn不能根据lstm的预测误差来校正。

传感器监测数据、运行参数数据、历史检验数据均可先用cnn提取特征,再合并在一起放入bd-lstm中进行更高层次的特征学习;

输入数据源的三类数据,也可变换为“传感器检测数据+x”(x为运行状态数据或历史检验数据)的形式。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步地的详细说明,所应理解的是,以上所述仅为本发明的具体实施方法而已,并不用于限制本发明,凡是在本发明的主旨之内,所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1