一种基于深度神经网络的机械故障快速诊断方法与流程

文档序号:14098405阅读:575来源:国知局

本发明属于机械设备振动信号的故障诊断技术领域,涉及一种基于深度神经网络的机械故障快速诊断方法。



背景技术:

振动信号是机械故障特征的载体,对机械设备的振动信号进行分析,提取故障特征,然后根据故障特征判断机械设备的故障是机械故障诊断的常用方法。机械设备通常工作在多振源的工作环境中,背景噪声强烈,所以现场测得的机械振动信号通常是强背景噪声下的多分量非平稳信号,在这种情况下,从复杂的机械振动信号中提取故障特征,从而分离故障模式相近的机械振动信号就变得非常困难。同时,随着大数据时代的到来,传动的故障诊断方法已无法快速准确地应对日益增加的机械大数据。

作为机器学习的一个分支,深度学习可以通过隐藏层自动地从信号中学习到有用特征,这些算法包括玻尔兹曼机、自动编码器、卷积神经网络、循环神经网络等等。自动编码器作为最常使用的深度学习算法,在机械故障诊断领域取得了长足发展。虽然基于叠加自动编码器的机械故障诊断方法可以取得很高的分类准确率,但是仍然存在两个弊端:(1)为提取更有区分度的特征,在每层的训练过程中需要较多的迭代次数,因此在训练过程中会消耗大量时间。(2)每一层的数据分布都会随着前一层参数的改变而改变,这就需要所有层不断的去适应新的数据分布。因此这需要一个更低的学习率和很谨慎的参数初始化,这也使得为得到饱和的非线性训练变得异常困难。这种现象也叫做内部协变量转变。



技术实现要素:

本发明的目的在于克服现有技术的缺陷,提供一种基于深度神经网络的机械故障快速诊断方法,能够大大缩短故障诊断时间,并解决内部协变量转变问题。

为解决上述技术问题,本发明采用以下技术方案。

本发明的一种基于深度神经网络的机械故障快速诊断方法,其特征在于,包括以下步骤:

(1)收集训练样本和测试样本:采用凯斯西储大学的轴承振动信号的频谱作为总样本,其中25%训练样本,75%测试样本;其数据采样频率48k,包含10种故障类型、3种载荷;每种故障类型包含200个总样本,每个样本包含2400个数据点;经过傅里叶变换后得到1200个傅里叶系数;

(2)建立深度神经网络:将批标准化算法整合到叠加自动编码算法中,建立一个多层深度神经网络模型;

(3)深度神经网络模型的预训练:采用无标签的训练样本集对建立的深度神经网络模型进行逐层预训练;

(4)深度神经网络模型的微调:采用有标签的训练样本集,通过bp反向传播算法对深度神经网络进行微调;

(5)采用测试样本进行验证所建立的深度神经网络模型的有效性。

优选地,在步骤(2)中,将批标准化算法整合到叠加自动编码算法中,建立一个五层深度神经网络模型。其每层的神经元个数分别为:1200、600、200、100、10。

进一步的,将批标准化算法嵌入到叠加的自动编码器的每一层中,组成批标准化的叠加自动编码器。

进一步的,所述的深度神经网络模型的编码和解码函数为sigmoid函数。

进一步的,所述的深度神经网络模型每层的训练迭代次数为20,批尺寸为50,学习率为1e-4。

在上述步骤(2)将批标准化算法整合到叠加自动编码算法中,建立一个多层深度神经网络模型,是指:用批标准化的方式来重参数化所有的深度神经网络。其过程可以应用于每一个激活层而不需要参数调节,即通过一个独立的方式来标准化矩阵的每一行使其有零均值和单位方差:

上式中,xi,j,n表示位于(i,j)的值,n表示特征映射矩阵的行数,μ是每一个单元的均值,σ表示标准差;其中在训练过程中:

其中ε=10-8,以强制避免遇到的梯度在s=0处未定义的问题;

相应地,标准化的值经历移位和缩放:

其中γn和βn表示用于网络训练的新的移位和缩放参数。

本发明的有益效果和优点:

本发明通过批标准化的叠加自动编码器实现故障特征的自动提取,大大缩短训练时间,解决了现有技术的内部协变量转变问题。本发明通过这种深度学习方法对机械故障信号进行智能诊断,可快速准确地分析引起机械故障的类型。

附图说明

图1是本发明的基于深度神经网络的机械故障快速诊断方法的一种实施例的方法流程图。

图2是本发明的一种实施例方法的自动编码模型图。

图3四组轴承数据集下的20次试验准确率对比诊断结果。其中,图a是数据集a进行20次试验的训练和测试准确率,图b是数据集b进行20次试验的训练和测试准确率,图c是数据集c进行20次试验的训练和测试准确率,图d是数据集d进行20次试验的训练和测试准确率。

具体实施方式

本发明基于深度神经网络的机械故障快速诊断方法,将批标准化技术引入到叠加自动编码中,可有效地处理内部协变量转变问题。批标准化算法作为一种非常优雅的自适应重参数化算法,重参数化可以显著减少多层直接协调更新的问题。本发明将批标准化算法嵌入到叠加自动编码的每一层中,使得在训练开始时能够建立一个容易的开始环境,因此梯度可以从极其浅的路径开始。其结果是训练的迭代次数可以减少,相应的训练速度也随之加快。从而可对机械故障信号进行智能诊断,快速准确地分析引起机械故障的类型。

本发明的技术方案如下。

本发明的一种基于深度神经网络的机械故障快速诊断方法,其特征在于,包括以下步骤:

(1)收集训练样本和测试样本:采用凯斯西储大学的轴承振动信号的频谱作为总样本,其中25%训练样本,75%测试样本;其数据采样频率48k,包含10种故障类型、3种载荷;每种故障类型包含200个总样本,每个样本包含2400个数据点;经过傅里叶变换后得到1200个傅里叶系数;

(2)建立深度神经网络:将批标准化算法整合到叠加自动编码算法中,建立一个多层深度神经网络模型;

(3)深度神经网络模型的预训练:采用无标签的训练样本集对建立的深度神经网络模型进行逐层预训练;

(4)深度神经网络模型的微调:采用有标签的训练样本集,通过bp反向传播算法对深度神经网络进行微调;

(5)采用测试样本进行验证所建立的深度神经网络模型的有效性。

优选地,在步骤(2)中,将批标准化算法整合到叠加自动编码算法中,建立一个五层深度神经网络模型。其每层的神经元个数分别为:1200、600、200、100、10。

进一步的,将批标准化算法嵌入到叠加的自动编码器的每一层中,组成批标准化的叠加自动编码器。

进一步的,所述的深度神经网络模型的编码和解码函数为sigmoid函数。

进一步的,所述的深度神经网络模型每层的训练迭代次数为20,批尺寸为50,学习率为1e-4。

下面结合附图对本发明做进一步详细说明。

图1所示为本发明的基于深度神经网络的机械故障快速诊断方法的一种实施例的方法流程图。该实施例方法包括以下步骤:

(1)收集训练样本和测试样本:采用凯斯西储大学的轴承振动信号的频谱作为总样本,其振动信号包含四种不同的运转状态:正常、滚珠故障、内圈故障、外圈故障。每种故障状态包含3种不同的损伤程度:其数据的采样频率为48k,将总样本分为4组数据集,即a、b、c、d。每个数据集均包含10种健康状况,每种状况包含200个样本,每个样本包含2400个数据点,做傅里叶变换后得到1200个傅里叶系数。其中数据集a的载荷为1hp、数据集b为2hp、数据集c为3hp,因此数据集a、b、c均各含有2000个样本。数据集d含有1hp、2hp、3hp三种载荷,共6000个样本。其具体数据如下表1所示。每个数据集随机选取25%的样本组成训练样本集,其余75%组成测试样本集。

(2)建立深度神经网络:将批标准化算法嵌入到叠加自动编码器的每一层中,组成批标准化的自动编码器。深度神经网络模型为5层批标准化的自动编码器叠加而成,每层的神经元个数分别为:1200、600、200、100、10。

图2是本发明的一种实施例方法的自动编码模型图。如图2所示,自动编码是一种无监督学习方式主要包含两部分:编码和解码。编码用于将输入数据映射成隐层表达,解码是从隐层表达中重建输入数据。给定一个无标签输入数据集其中hn表示从xn计算得到的隐层编码向量,为输出层的解码向量,因此编码过程如下所示:

hn=f(wxn+b1)(1)

其中,f(·)是编码函数,本发明实施例采用sigmoid函数,w是编码的权重矩阵,b1是偏置向量。

解码过程如下所示:

其中g(·)是解码函数,wt是解码的权重矩阵,b2是偏置向量。

自动编码的参数集通过最小化重构误差实现优化:

其中l表示损失函数

批标准化可以用一种优雅的方式来重参数化几乎所有的深度神经网络。其过程可以应用于每一个激活层而不需要参数调节。它可以通过一个独立的方式来标准化矩阵的每一行使其有零均值和单位方差:

其中xi,j,n表示位于(i,j)的值,n表示特征映射矩阵的行数,μ是每一个单元的均值,σ表示标准差。注意在训练过程中:

其中ε=10-8以强制避免遇到的梯度在s=0处未定义的问题。

相应地,标准化的值经历移位和缩放:

其中γn和βn表示用于网络训练的新的移位和缩放参数。

在此,本发明实施例将批标准化技术应用到每一个激活层之前。在这种情况下,非线性单元可以在产生激活时有一个稳定的分布,同时也可以减少内部协变量转变的问题。批标准化技术用于归一化(wxn+b1)。在此偏置项b1未被使用,由于其效果会在接下来的平均减法运算中消除。

(3)深度神经网络模型预训练:采用无标签训练样本集对建立的深度神经网络模型进行逐层预训练。

(4)深度神经网络模型微调:采用有标签训练样本集,并使用bp反向传播算法通过最小化提取特征与标签的误差来实现对深度神经网络模型的权重更新和参数微调。

(5)测试:采用数据集a-d的训练样本及测试样本来验证本发明方法的有效性。每组实验均进行20次,以确保结果的准确性。

图3是四组轴承数据集下的20次试验准确率对比诊断结果。其中,图a是数据集a进行20次试验的训练和测试准确率,图b是数据集b进行20次试验的训练和测试准确率,图c是数据集c进行20次试验的训练和测试准确率,图d是数据集d进行20次试验的训练和测试准确率。

如图3所示的记录每次试验的准确率,采用本发明实施例方法处理的数据集a-d的准确率都几乎接近100%,且均高于未加批标准化处理的深度网络模型的准确率。

下表1是轴承数据集描述表。

下表2是四组轴承数据集下的20次试验平均准确率及训练时间诊断结果表。

20次试验总的平均准确率及耗时,并对比未加批标准化的方法如表2所示,采用本发明实施例方处理的数据集a-c的训练平均时间均在30s左右,数据集d由于数据样本大训练平均时间在93s左右;而未加批标准化处理的数据集a-c的训练平均时间为150s左右,数据集d的训练平均时间高达450s左右,因此可以看出本发明实施例方所消耗的时间仅占未加批标准化处理方法的1/3左右。该测试结果显示,本发明实施例方不仅在准确率上都有提升,而且大大缩短了训练时间。

表1.轴承数据集描述表

表2.四组轴承数据集下的20次试验平均准确率及训练时间诊断结果表

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1