基于深度解耦卷积神经网络的复合故障诊断方法及装置与流程

文档序号：17466235发布日期：2019-04-20 05:31阅读：1157来源：国知局

本发明属于机械制造技术领域，涉及一种机械故障诊断技术，具体涉及一种基于深度解耦卷积神经网络的复合故障诊断方法。

背景技术：

轴承和齿轮等旋转件是机械设备中一种必不可少的通用零部件，在现代工业设备中扮演着重要的角色。对旋转机械的故障诊断是预防性维修系统的重要组成部分，对延长机械设备的使用寿命、减少维护费用和增加设备运行的安全性具有重要意义。

基于人工智能的故障诊断方法，已经被广泛的应用于旋转机械的故障诊断并取得了较好的效果。一般旋转机械故障诊断可通过振动信号的采集、特征提取、分类来完成，而分类过程可由反向传播神经网络、支持向量机等机器学习算法来实现。卷积神经网络以其高效的特征提取能力和对输入的平移不变性受到广泛关注，尤其是在图像识别等领域得到迅速应用。近年来，学者们开始研究将传统的卷积神经网络一维化，并运用于一维序列数据的分类中。

对于旋转机械的复合故障，由于多种单一故障的耦合形式过于复杂，因此目前大多数智能诊断方法将其单列为一种故障模式进行识别。对于一个深度学习诊断模型，如果要针对某个系统中多种可能的零部件复合故障建模，将会使得模型复杂度提高、模型参数数量大幅增加，而且还会导致某些复合故障数据量不足等问题。目前，机械复合故障的解耦分析仍然是智能诊断面临的一个挑战，它对机械设备的智能维护也具有重要意义。

因而现有的技术还不能满足实际工业应用的需求，还需要改进和提高，开发一种复合故障的智能诊断算法成为迫切需要。

技术实现要素：

为了解决现有技术所存在的问题，本发明设计一种基于深度解耦卷积神经网络的复合故障诊断方法及装置，通过深度卷积神经网络的特征学习能力深入挖掘复合故障中各零部件的单一故障特征，并结合解耦分类器多标签输出的特性，使得所构建的深度解耦网络模型在只有单一故障信号作训练集的情况下，也能够实现对复合故障的解耦与分类。通过本发明，可以提高故障诊断系统的对设备状态进行监控与预测的准确性、智能性和使用便利性。

本发明采用以下技术方案来实现：

一种基于深度解耦卷积神经网络的复合故障诊断方法，包括步骤：

步骤一：数据集的采集与标定，分别采集旋转机械单一及复合故障实验工况下的振动加速度信号，按一定的样本点长度截取得到若干样本，采用重叠采样的方法来对数据集的样本进行增强，样本长度为8个周期，重叠率为0.5；将单一故障样本组成训练集，以及所有复合故障样本组成测试集，并分别设定类别标签；

步骤二：构建深度可辨别性特征提取模型，在keras框架下，通过多层顺序堆叠卷积层和池化层，搭建一维深度卷积神经网络模型；

步骤三：构建解耦分类器，在keras框架下，以步骤二提取的特征为输入，通过堆叠多个解耦分类层，构建具有多标签输出特性的解耦分类器；

步骤四：网络模型的训练，采用边界损失函数替换现有智能诊断算法的交叉熵损失函数，同时结合路由协同算法，在只使用单一故障数据的前提下，对网络模型进行训练，并采用网络搜索算法来选取相应超参数，最终获得最优的深度解耦卷积神经网络模型；

步骤五：复合故障的智能诊断与分类，将采集到的复合故障信号输入已经训练好的深度解耦卷积神经网络模型中进行测试，通过解耦分类器的输出得到复合故障的实时诊断结果。

本方案所采用边界损失函数作为新的目标函数可以有效地增大类间距离而减少类内距离，使得提取到的深度特征更具有可辨别性，这将使得训练多标签输出的神经网络变得更加容易；同时，在训练过程中，仅仅使用单一故障数据，对网络模型进行训练，不依赖于复合故障数据及其标注信息，就可实现对复合故障的解耦和诊断，而且采用了网络搜索算法来选取相应超参数，避免了需要人工参数调优的过程，可以实现自动获得最优的网络模型。在设备硬件支持的条件下，可应用于在线监测与诊断系统，对复杂旋转机械设备进行实时的状态监测与故障诊断。

进一步地，步骤一中，所述样本由振动加速度信号直接截取得来，在划分样本集时，训练集中仅包含单一故障样本，测试集中则同时包含单一故障样本和复合故障样本，以此验证所提网络强大的解耦能力。

进一步地，

由振动加速度信号直接截取样本时，采用重叠采样的方法来对数据集的样本进行增强，样本长度为8个周期，重叠率为0.5。

进一步地，所述步骤二中以一维深度卷积神经网络为基础，通过多个卷积层和池化层的顺序堆叠构建深度可辨别性特征提取模型，其结构主要包括输入层、卷积层、池化层；所述深度可辨别性特征提取模型通过对信号进行逐层的特征提取获得具有可辨别性的深度特征。

进一步地，所述步骤三以向量神经元取代传统分类器标量神经元的方式构建解耦分类器；所述解耦分类器由多个解耦分类层堆叠组成，通过路由协同算法来优化相邻两个解耦分类层之间的映射与耦合关系，其构建步骤具体可表示为：

(1)由步骤二得到的最后池化层输出的多通道一维特征，通过维度变换组成一个矩阵，该矩阵即为初始解耦分类层的输入，用表示，其中kl表示向量神经元的个数，也等于最后池化层之前的卷积核个数，每个向量神经元储存一种特征信息，rl表示每个初始向量神经元的维度；

(2)假设第二个解耦分类层的向量神经元的个数为c，即单一故障的类别数，用来表示其输出，则整个计算过程为：

其中：i＝1,2,…,kl，j＝1,2,…,c，为权重矩阵，为中间特征，cij为耦合系数，squash函数为解耦分类层的激活函数；

(3)步骤(2)中的耦合系数cij由路由协同算法进行迭代更新，给定初始值bij，其计算公式为

通过计算相邻层向量神经元之间的路由协同的大小来计算更新相邻层向量神经元之间的耦合系数cij，可表示为

cij＝softmax(bij)

(4)依次计算与更新迭代可得最后一个解耦分类层的输出v，通过求v的l2范数可得每一输出向量神经元的长度，此长度即代表相应类别存在的概率；

(5)最后通过设定下个阈值若步骤(4)中得到的相应向量神经元的长度超过此阈值的类别则输出相应的单一故障标签，当对复合故障进行检测时，因为本发明能检测并解耦复合故障，因为解耦分类器输出组成复合故障的多个单一故障的标签，实现复合故障的解耦与识别。

进一步地，步骤(3)中，给定初始值bij时，先择零值初始化，以保证上一层向量神经元指向下一层向量神经元的概率都相同。

进一步地，所述步骤四中，进行网络模型训练时，所采用的目标函数为边界损失函数具体表达式为：

其中，m和c分别表示样本个数及类别个数；tc是分类的指示性函数，对于第m个样本，如果其真实状况包含第c类故障则否则表示第m个样本对应的第c个输出神经元的激活值；p+表示当即第m个样本真实包含第c类故障时，正确预测时的下限值；p-表示当即第m个样本实际不包含第c类故障时，正确预测时的上限值，此处取0.1；λ用于调节两个相加项的比重。

一种基于深度解耦卷积神经网络的复合故障诊断装置，包括：

数据集的采集与标定模块，用于分别采集旋转机械单一及复合故障实验工况下的振动加速度信号，按一定的样本点长度截取得到若干样本，将单一故障样本组成训练集，以及所有复合故障样本组成测试集，并分别设定类别标签；

深度可辨别性特征提取模型构建模块，在keras框架下，通过多层顺序堆叠卷积层和池化层，搭建一维深度卷积神经网络模型；

解耦分类器构建模块，在keras框架下，以深度可辨别性特征提取模型提取的特征为输入，通过堆叠多个解耦分类层，构建具有多标签输出特性的解耦分类器；

网络模型的训练模块，用于采用边界损失函数替换现有智能诊断算法的交叉熵损失函数，同时结合路由协同算法，在只使用单一故障数据的前提下，对网络模型进行训练，并采用网络搜索算法来选取相应超参数，最终获得最优的深度解耦卷积神经网络模型；

复合故障的智能诊断与分类模块，将采集到的复合故障信号输入已经训练好的深度解耦卷积神经网络模型中进行测试，通过解耦分类器的输出得到复合故障的实时诊断结果。

一种电子设备，包括存储器、处理器、存储在存储器上并可在处理器上运行的计算机程序，所述处理器运行所述程序时，实现所述的方法。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述的方法。

与现有技术相比，本发明的有益效果是：

1、本发明包含深度可辨别特征提取模型，具有强大的特征学习能力，可以从原始振动信号中深入挖掘复合故障中各零部件的单一故障特征，这些特征不仅具有优异的同类相似性及异类差异性，而且比传统的标量形式的特征保留了更多的结构化信息，能更好地帮助网络对复合故障的解耦，从而提高网络的识别精度。

2、本发明具有解耦分类器结构，具有输出多个标签的特性，使得本发明的输出结果能更加直观地反映旋转机械故障状态。通过对复合故障的解耦和分类，更有利于对目标设备故障进行快速的定位与维护，减少生产线停机时间，极大的提高了目标设备的生产效率，降低了生产成本，并可以在一定程度上避免由于复合故障发生而导致的重大事故，带来的人员伤亡与经济损失。

3、本发明所构建的深度解耦网络模型，充分考虑工业应用的实际情况，旨在仅仅利用正常和单一故障信号作训练集的情况下，来提取具有可辨别性的深度特征，并实现对复合故障的解耦与分类。其完全不依赖于复合故障数据及其标注信息等先验知识，从而无需进行高代价的复合故障实验来采集并标注多种复合故障数据，在很大程度上节省了经济开支和解放了实验劳动力。

4、本发明采用了网络搜索算法来选取相应超参数，避免了人工参数调优的过程，可以实现自动获得最优的网络模型。

附图说明

图1是本发明方法的算法流程图；

图2是本发明方法的网络结构示意图；

图3是本发明网络的解耦分类器的原理示意图；

图4是实例中五挡变速器上传感器位置示意图；

图5是传统网络在实例中的识别结果混淆矩阵；

图6是本发明一维卷积神经网络在实例中的识别结果混淆矩阵；

图7是本发明网络在实例中的实际输出标签形式。

具体实施方式

下面结合附图和具体实施步骤对本发明进行详细说明，但本发明的实施方式不限于此。

实施例

如图1所示，一种基于深度解耦卷积神经网络的复合故障诊断方法，所述方法通过深度卷积神经网络的特征学习能力深入挖掘复合故障中各零部件的单一故障特征，并结合解耦分类器多标签输出的特性，使得所构建的深度解耦网络模型在只有单一故障信号作训练集的情况下，也能够实现对复合故障的解耦与分类，深度解耦一维卷积神经网络的结构示意图如图2所示，该方法包括步骤：

步骤一：数据集的采集与标定，设计旋转机械单一及复合故障实验，分别采集这些工况下的振动加速度信号，按一定的样本点长度截取得到大量样本，将单一故障样本组成训练集，以及所有复合故障样本组成测试集，并分别设定类别标签；

步骤二：构建深度可辨别性特征提取模型，在keras框架下，通过多层顺序堆叠卷积层和池化层，搭建一维深度卷积神经网络模型；

步骤三：设计解耦分类器，在keras框架下，以步骤二提取的特征为输入，通过堆叠多个解耦分类层，搭建具有多标签输出特性的解耦分类器；

步骤四：网络模型的训练，本发明采用边界损失函数来替换传统智能诊断算法的交叉熵损失函数，同时结合路由协同算法，在只使用单一故障数据的前提下，对网络模型进行训练，并采用网络搜索算法来选取相应超参数，最终获得最优的网络模型；

进一步地，步骤三具体为：步骤三以向量神经元取代传统分类器标量神经元的方式，来构建解耦分类器；解耦分类器由多个解耦分类层堆叠组成，通过路由协同算法来优化相邻两个解耦分类层之间的映射与耦合关系，其构建步骤具体可表示为：

(1)由步骤二得到的最后池化层输出的多通道一维特征，通过维度变换组成一个矩阵，此矩阵即为初始解耦分类层的输入，用表示，其中kl表示向量神经元的个数，也等于最后池化层之前的卷积核个数，每个向量神经元储存一种特征信息，rl表示每个初始向量神经元的维度；

(2)假设第二个解耦分类层的向量神经元的个数为c(即单一故障的类别数)，其输出可用来表示，则整个计算过程为：

其中：i＝1,2,…,kl，j＝1,2,…,c，为权重矩阵，为中间特征，cij为耦合系数，squash函数为解耦分类层的激活函数；

(3)步骤(2)中的耦合系数cij可由路由协同算法进行迭代更新，给定初始值bij(通常先择零值初始化，以保证上一层向量神经元指向下一层向量神经元的概率都相同)，其计算公式为

通过计算相邻层向量神经元之间的路由协同的大小(定义为)来计算更新相邻层向量神经元之间的耦合系数cij，可表示为

cij＝softmax(bij)

(4)依次计算与更新迭代可得最后一个解耦分类层的输出v，通过求v的l2范数可得每一输出向量神经元的长度，此长度即代表相应类别存在的概率；

(5)最后通过设定下个阈值步骤(4)中得到的相应向量神经元的长度超过此阈值的类别则输出相应的单一故障标签，当对复合故障进行检测时，因为本发明能检测并解耦复合故障，因为解耦分类器会输出组成复合故障的多个单一故障的标签，来达到复合故障的解耦与识别。解耦分类器结构示意图如图3所示，整个算法的过程如表1所示。

表1.dynamicrouting算法流程

进一步地，步骤四进行深度网络模型训练时，所采用的目标函数为边界损失函数，其具体表达式为

其中m和c分别表示样本个数及类别个数；tc是分类的指示性函数，对于第m个样本，如果其真实状况包含第c类故障则否则表示第m个样本对应的第c个输出神经元的激活值；p+表示当(即第m个样本真实包含第c类故障)时，正确预测时的下限值；p-表示当(即第m个样本实际不包含第c类故障)时，正确预测时的上限值，此处取0.1；λ用于调节两个相加项的比重。

所述的深度网络模型训练方法采用边界损失函数作为新的目标函数可有效地增大类间距离而减少类内距离，使得提取到的深度特征更具有可辨别性，这将使得训练多标签输出的神经网络变得更加容易；同时，在训练过程中，仅仅使用单一故障数据，对网络模型进行训练，不依赖于复合故障数据及其标注信息，就可实现对复合故障的解耦和诊断，而且采用了网络搜索算法来选取相应超参数，避免了需要人工参数调优的过程，可以实现自动获得最优的网络模型。

步骤五所述的基于深度解耦卷积神经网络的复合故障智能诊断方法，可实现复合故障的智能诊断与分类，将采集到的复合故障信号输入已经训练好的深度解耦卷积神经网络模型中进行测试，通过解耦分类器的输出得到复合故障的实时诊断结果，同时此算法在设备硬件支持的条件下，可应用于在线监测与诊断系统，对复杂旋转机械设备进行实时的状态监测与故障诊断。

实验案例：

轴承和齿轮是齿轮箱的两个关键部件，是旋转机械的重要组成部分。为了验证本发明所提方法的有效性，以某汽车五挡变速器为研究对象设计了轴承与齿轮故障的识别实验。

1、实验数据

所研究的五挡变速器示意图如图4所示，实验时设定五挡齿轮接合，输出轴转速为1100r/m，负载转矩为50nm。通过安装在汽车变速器输出轴轴承座上的加速度计，以24khz的采样频率采集原始振动信号。设定样本长度为8192个点，重叠率为0.5进行样本划分。有关齿轮箱数据集的详细信息列于表2中。

表2.齿轮箱数据集信息

2、网络参数的确定

将上述训练集中的原始振动数据输入到深度解耦卷积神经网络中，网络先从中自动学习和提取深层特征，这些特征随后输入解耦分类器，计算代价函数并指导网络权值与偏置的调整。

网络的超参数是通过scikit-learn框架中的gridsearch方法进行穷举选定。最终确定的网络包括2组卷积-池化层、1个重塑层、2个解耦分类层。网络的详细参数信息见表3。

表3.获得的网络最优参数

实验使用keras工具箱实现，最大迭代次数设置为20，数据批尺寸设置为64，训练优化器选择adamoptimizer。

3、实验结果与分析

在本实验中，将基于解耦分类器的一维卷积神经网络模型与传统一维卷积神经网络模型进行了比较。为了评价本发明所提方法的优越性，采用混淆矩阵来评价两种方法的分类准确率和误分类率。图5和图6反映了传统模型和本发明所提方法识别结果的混淆矩阵。从混淆矩阵可以看出，传统一维卷积神经网络将所有复合故障都错误地划分到了正常类，而本发明所提方法取得了较好的分类效果，证明了所提方法的有效性和鲁棒性。另外，图6还表明，所提方法通过解耦分类器可以准确输出单个或多个样本的标签，同时，它并不会将单个故障情况识别成由正常状态和此故障组成的复合情况。

为了进一步说明本发明所提方法对复合故障的解耦能力，给出所提方法进行故障识别的过程中抛出的实际标签，如图7所示。从图中可以看出，本发明所提方法能将由轴承故障和齿轮故障耦合的复合故障完全解耦为两个单一故障。

综上所述，本发明公开了一种基于深度解耦卷积神经网络的复合故障诊断方法，首先，利用深度解耦卷积神经网络学习和提取振动原始信号的特征；其次，利用解耦分类器对复合故障进行解耦识别；最后，利用包含了正常状态、轴承故障、齿轮故障和由两故障耦合的复合故障的齿轮箱数据集对该方法进行了验证。实验证明，仅仅通过单一故障信号来训练深度解耦模型，本发明能提取复合故障信号中各单一故障特征，并通过解耦分类器实现复合故障的解耦与分类。

为了实现上述实施例，本发明实施例还提供了一种基于深度解耦卷积神经网络的复合故障诊断装置，包括：

深度可辨别性特征提取模型构建模块，在keras框架下，通过多层顺序堆叠卷积层和池化层，搭建一维深度卷积神经网络模型；

网络模型的训练模块，用于采用边界损失函数，同时结合路由协同算法，在只使用单一故障数据的前提下，对网络模型进行训练，并采用网络搜索算法来选取相应超参数，最终获得最优的深度解耦卷积神经网络模型；

为了实现上述实施例，本发明实施例还提供了一种电子设备，包括存储器、处理器、存储在存储器上并可在处理器上运行的计算机程序，所述处理器运行所述程序时，实现前述实施例所述的方法。

为了实现上述实施例，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现前述实施例所述的方法。

最后需要说明的是，上述实施方式只是对本发明一个优选实施例所作的描述，并非对本发明保护范围进行的限定，在不脱离本发明设计精神的前提下，本领域技术人员对本发明的技术方案做出的各种等效的变化、修饰和改进，均应包括在本发明申请专利范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李巍华;黄如意;刘龙灿
技术所有人：华南理工大学
我是此专利的发明人

上一篇：一种能够方便调节粒度大小的塑料制粒装置的制作方法
上一篇：一种用于公路水土保持植物景观营造方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、邢老师：1.机械设计及理论 2.生物医学材料及器械 3.声发射检测技术。
2、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
3、王老师：1.机器人 2.嵌入式控制系统开发
4、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。