一种基于不平衡数据的工程机械故障诊断方法

文档序号:33158022发布日期:2023-02-04 00:04阅读:22来源:国知局
一种基于不平衡数据的工程机械故障诊断方法

1.本发明涉及工程机械技术领域,具体涉及一种基于不平衡数据的工程机械故障诊断方法


背景技术:

2.加强基础设施建设是一项重大而紧迫的任务,在该任务中作为施工工具的工程机械发挥不可替代的作用,进而导致工程机械的作业负荷提升。在实际工程使用中,作业人员轮流换班,但是工程机械持续作业。又由于工程机械经常在大载荷下使用,容易加速机械零部件的磨损,对于机械零部件的使用寿命极为不利。一旦机械发生故障停机,就会增加备件储备运输和维修的时间和成本,进而影响工程开展进度。结合如今工程机械智能化的发展方向,作为智能化应用之一的工程机械故障诊断显得意义非凡。
3.在工程机械结构中,拥有大量齿轮、轴承的齿轮箱的故障率较高,且齿轮箱结构复杂,故障后现场维修难度较大,实际维修的策略是直接换新,这将增加工程机械厂商的售后服务成本,所以对该痛点进行故障诊断成为研究热点。总体来说,齿轮箱故障诊断方法分为两类,分别为基于模型的方法和基于数据的方法。但由于齿轮箱内部结构复杂,包含多组齿轮和轴承,以及各种油路和附件,导致对其建立准确模型十分困难,而基于数据的方法对于复杂工业过程具有强大的处理能力。基于数据的方法进行故障诊断时,需要大量的齿轮箱正常数据和故障数据作为训练样本,但实际中获得的齿轮箱数据是不平衡的,其故障数据不易获得,导致传统基于数据的方法无法识别出故障状态。本发明提出一种基于不平衡数据的工程机械故障诊断方法,对采集到的振动信号利用小波包分解(wpd)、经验模态分解(emd)和时域统计分析提取信号特征,然后利用自适应合成过采样(adasyn)的方法合成故障数据,改善数据不平衡的分布问题,接着采用深度自编码器(da)对提取的特征进行选择,最后根据改善的数据和选择的特征建立svm分类器,对齿轮箱正常状态和故障状态进行分类,进而实现齿轮箱故障诊断。


技术实现要素:

4.本发明针对现有技术的不足,提供了一种基于不平衡数据的工程机械故障诊断方法,该方法针对故障诊断存在的故障数据难以获取,正常数据和故障数据样本数量不平衡的问题,首先利用adasyn方法来合成故障数据样本,改善数据分布情况,同时该方法通过在损失函数中引入最大相关熵和稀疏惩罚项,来克服da在提取特征过程中受噪声和冗余数据影响导致的鲁棒性差的问题,而且svm分类器训练简单,能够有效识别齿轮箱故障状态。
5.本发明的技术方案为:一种基于不平衡数据的工程机械故障诊断方法,所述方法包括如下步骤:
6.步骤1,通过振动加速度传感器采集齿轮箱振动信号;
7.步骤2,对采集到的齿轮箱原始振动信号进行特征提取;
8.步骤3,利用自适应合成样本算法(adasyn)合成齿轮箱故障数据;
9.步骤4,在分布改善后的数据集中使用深度自编码器(da)进行特征选择,选择时,在损失函数中引入最大相关熵和稀疏惩罚项;
10.步骤5,利用选择后的特征和改善后的数据集来训练svm分类器,svm分类器对齿轮箱正常与故障振动信号进行分类,实现齿轮箱故障诊断。
11.进一步地,步骤2中对采集到的齿轮箱振动信号进行特征提取,所使用的方法为小波包分解(wpd)、经验模态分解(emd)和时域统计分析,小波包分解是让信号通过一系列中心频率不同但频宽相同的滤波器,在通过三层分解后得到高低频分量,然后从高低分量中提取信号能量特征和信号能量熵。经验模态分解是根据数据自身的时间尺度特征来进行信号分解,使复杂的信号分解为有限个本征模态函数(imf),然后从前八个imf中提取能量特征,并计算能量熵。经过时域统计分析可以得到信号的均值、方差、均方根值、峭度、脉冲因子。
12.进一步地,步骤2中,小波包分解具体为:通过高通滤波器和低通滤波器对输入波形进行滤波,得到近似分量和细节分量,最终将原信号转换到2j个频带中,j为分解层数,通过双尺度方程构造小波包,双尺度方程可写作:
[0013][0014][0015]
其中ψ(t)为母小波,j为分解层数,n为该层中结点编号,i为节点编号,k为位移因子,hk和gk为一对互补的正交镜像滤波器,则第j层第k个频带的小波包系数计算公式为:
[0016][0017][0018]
当输入信号为s时,对输入信号进行3层小波包分解,输入信号可以表示为:
[0019][0020]
式中右下标为分解层数,右上标为该层中频带编号,
[0021]
提取小波包分解得到的子频带信号能量特征即信号的均方值,信号能量计算公式为:
[0022][0023]
式中xi(t)为第k个子频带信号每一时刻的信号幅值,n为信号长度,
[0024]
由每个子频带信号的能量特征计算能量熵,公式为:
[0025][0026]
进一步地,经验模态分解具体为:经验模态分解将输入信号分解为几个本征模态函数和一个残差组成,公式为:
[0027][0028]
式中imfm(n)表示第m个本征模态函数,resm(n)表示残差,
[0029]
经验模态分解具体步骤为:
[0030]
vi.根据原始信号上下极值点,分别得到上下包络线;
[0031]
vii.求上、下包络线的均值,得到均值包络线;
[0032]
viii.原始信号减去均值包络线,得到中间信号;
[0033]
ix.判断该中间信号是否满足本征模态函数的两个条件,如果满足,该信号就是一个本征模态函数分量;如果不是,以该信号为基础,重新做i-iv的分析;
[0034]
x.使用上述方法得到本征模态函数1后,用原始信号减去本征模态函数1,作为新的原始信号,再通过i-iv的分析,可以得到本征模态函数2,以此类推,完成经验模态分解分解;
[0035]
完成经验模态分解分解后,选择前8个本征模态函数分量,分别计算各自能量特征,再由能量特征得到能量熵。
[0036]
进一步地,步骤3包括:利用自适应合成样本算法自适应合成少数类样本,根据每个少数类样本周围的多数类样本情况,来自适应地决定每个少数类样本需要合成的样本数量,进而改善样本集的分布问题。
[0037]
进一步地,步骤3中自适应合成样本算法包括:
[0038]
vii.计算不平衡度,记少数类样本为ms,多数类样本为ml,则不平衡度为:
[0039][0040]
viii.计算需要合成的样本数量
[0041]
g=(ml-ms)*b,b∈[0,1]
[0042]
ix.对每个属于少数类的样本用欧式距离计算k个邻居,δ为k个邻居中属于多数类的样本数目,记比例r为:
[0043][0044]
x.在iii中得到每个少数类样本的ri,计算每个少数类样本的周围多数类的情况,公式为:
[0045][0046]
xi.对每个少数类样本计算合成样本的数目,公式为:
[0047][0048]
xii.在每个待合成的少数类样本周围k个邻居中选择1个少数类样本,根据下列公式进行合成,重复合成直到满足步骤v合成的数目为止,
[0049]
si=xi+(x
zi-xi)*λ。
[0050]
进一步地,步骤4中,深度自编码器(da)通过堆叠自编码器(ae)得到,每个ae由一
个输入层、一个隐藏层和一个输出层组成,隐藏值和输出值计算公式为:
[0051]
h=s(w
x
+b)
[0052][0053]
其中w和w

为连接权重,b和b

为偏置,s(
·
)为sigmoid激活函数。标准损失函数为均方根误差(mse),公式为:
[0054][0055]
但由于标准da受噪声和冗余数据影响导致的鲁棒性差的问题,设计新的损失函数。作为相似性的度量,引入最大相关熵到损失函数中来降低噪声的影响,最大相关熵的计算公式为:
[0056][0057]
其中k
σ
(
·
)为高斯核,公式为:
[0058][0059]
其中σ为核尺寸。
[0060]
为了减少冗余或者不相关特征对诊断准确度的影响,引入稀疏惩罚项到损失函数中,公式为:
[0061][0062][0063]
其中ρ为特定稀疏参数,是k个隐层单元的平均值。
[0064]
为了提高泛化性,引入权重衰减项,公式为:
[0065][0066]
最终新的损失函数为:
[0067]jnew
=-j
mc
+βj
sparse
+λj
weight
[0068]
其中β和λ是系数。
[0069]
本发明的有益效果:本发明在对齿轮箱振动信号进行特征提取之后,利用自适应合成样本算法合成故障数据样本,改善现有数据集中正常数据与故障数据不平衡的问题,尤其重视数据中更具挑战性的区域,能够提升分类器的性能。然后利用深度自编码器对特
征进行选择,降低特征维度,在深度自编码器的损失函数中引入最大相关熵和稀疏惩罚项来提升方法的鲁棒性,最后构建svm分类器进行故障分类,为工程机械的故障诊断提供一种可行的技术方案。
附图说明
[0070]
图1为本发明的流程图;
[0071]
图2为本发明中小波包分解示意图;
[0072]
图3为本发明中深度自编码器特征学习过程示意图;
[0073]
图4为本发明中svm分类器原理图。
具体实施方式:
[0074]
如图1所示,一种基于不平衡数据的工程机械故障诊断方法,所述方法包括如下步骤:
[0075]
步骤1,通过螺栓将振动加速度传感器安装在齿轮箱壳体上,采集正常运行和发生故障的齿轮箱振动数据。
[0076]
步骤2,对步骤1采集到的原始振动信号进行特征提取,所采用的方法包括:小波包分解,经验模态分解和时域统计分析。
[0077]
步骤2.1,小波包分解
[0078]
小波分解能够实现对时间序列的时频分析,能够将原信号分解为包含高频信息和低频信息的两部分,并对低频部分进行同样的分解过程直至满足需求。小波包分解在小波分解的基础上对高频部分也进行分解,具有更好的性能。
[0079]
小波包分解通过高通滤波器和低通滤波器对输入波形进行滤波,得到近似分量和细节分量,最终将原信号转换到2j(j为分解层数)个频带中,通过双尺度方程构造小波包,双尺度方程可写作:
[0080][0081][0082]
其中ψ(t)为母小波,j为分解层数,n为该层中结点编号,i为节点编号,k为位移因子,hk和gk为一对互补的正交镜像滤波器。则第j层第k个频带的小波包系数计算公式为:
[0083][0084][0085]
当输入信号为s时,对输入信号进行3层小波包分解,示意图如图2所示,输入信号可以表示为:
[0086][0087]
式中右下标为分解层数,右上标为该层中频带编号。
[0088]
提取小波包分解得到的子频带信号能量特征即信号的均方值,信号能量计算公式为:
[0089][0090]
式中xi(t)为第k个子频带信号每一时刻的信号幅值,n为信号长度。
[0091]
由每个子频带信号的能量特征计算能量熵,公式为:
[0092][0093]
步骤2.2经验模态分解
[0094]
经验模态分解将输入信号分解为几个本征模态函数(imf)和一个残差组成,公式为:
[0095][0096]
式中imfm(m)表示第m个本征模态函数,resm(n)表示残差。
[0097]
经验模态分解具体步骤为:
[0098]
xi.根据原始信号上下极值点,分别得到上下包络线;
[0099]
xii.求上、下包络线的均值,得到均值包络线;
[0100]
xiii.原始信号减去均值包络线,得到中间信号;
[0101]
xiv.判断该中间信号是否满足imf的两个条件,如果满足,该信号就是一个imf分量;如果不是,以该信号为基础,重新做i-iv的分析。
[0102]
xv.使用上述方法得到第一个imf后,用原始信号减去imf 1,作为新的原始信号,再通过i-iv的分析,可以得到imf2,以此类推,完成emd分解。
[0103]
完成emd分解后,选择前8个imf分量,分别计算各自能量特征,再由能量特征得到能量熵,计算公式同上。
[0104]
上述两个条件为经验模态分解的公知技术,具体是指:
[0105]

l函数在整个时间范围内,局部极值点和过零点的数目必须相等,或最多相差一个;
[0106]

在任意时刻点,局部最大值的包络(上包络线)和局部最小值的包络(下包络线)平均必须为零。
[0107]
步骤2.3时域统计分析
[0108]
经过时域统计分析可以得到信号的均值、方差、均方根值、峭度、脉冲因子。
[0109]
均值表示一定时间内振动信号幅值的平均值,是一阶矩,xi(t)表示振动信号,n表示信号长度,均值可用如下公式表示:
[0110]
[0111]
方差是每个样本值与全体样本值的平均数之差的平方值的平均数,代表了信号能量的动态分量,反应数据间的离散程度,是二阶中心矩,可用如下公式表示:
[0112][0113]
均方根是将所有值平方求和,求其平均值,再开平方,可用如下公式表示:
[0114][0115]
峭度表示波形平缓程度,用于描述变量的分布,可用如下公式表示:
[0116][0117]
脉冲因子是信号峰值与整流平均值的比值,用于检测信号中是否存在冲击,可用如下公式表示:
[0118][0119]
式中,x
p
表示信号峰值,表示信号绝对值的平均值。
[0120]
步骤3,通过步骤2将原始振动信号的时序数据转换为包含多个特征的正常状态和故障状态的样本,但由于故障状态样本难以获得,如果对不平衡的数据不进行处理,会使得训练出来的分类器更偏向于多数类导致分类器性能下降。利用adasyn对样本集进行自适应合成过采样,算法步骤如下:
[0121]
xiii.计算不平衡度。记少数类样本为ms,多数类样本为ml,则不平衡度为:
[0122][0123]
xiv.计算需要合成的样本数量
[0124]
g=(ml-ms)*b,b∈[0,1]
[0125]
xv.对每个属于少数类的样本用欧式距离计算k个邻居,δ为k个邻居中属于多数类的样本数目,记比例r为:
[0126][0127]
xvi.在iii中得到每个少数类样本的ri,计算每个少数类样本的周围多数类的情况,公式为:
[0128][0129]
xvii.对每个少数类样本计算合成样本的数目,公式为:
[0130]
[0131]
xviii.在每个待合成的少数类样本周围k个邻居中选择1个少数类样本,根据下列公式进行合成,重复合成直到满足步骤v合成的数目为止。
[0132]
si=xi+(x
zi-xi)*λ
[0133]
步骤4,在步骤3获得平衡数据后,下一步需要使用da选择有用的低维特征。da通过堆叠自编码器(ae)得到,每个ae由一个输入层、一个隐藏层和一个输出层组成,隐藏值和输出值计算公式为:
[0134]
h=s(wx+b)
[0135][0136]
其中w和w

为连接权重,b和b

为偏置,s(
·
)为sigmoid激活函数。标准损失函数为均方根误差(mse),公式为:
[0137][0138]
但由于标准da受噪声和冗余数据影响导致的鲁棒性差的问题,设计新的损失函数。作为相似性的度量,引入最大相关熵到损失函数中来降低噪声的影响,最大相关熵的计算公式为:
[0139][0140]
其中k
σ
(
·
)为高斯核,公式为:
[0141][0142]
其中σ为核尺寸。
[0143]
为了减少冗余或者不相关特征对诊断准确度的影响,引入稀疏惩罚项到损失函数中,公式为:
[0144][0145][0146]
其中ρ为特定稀疏参数,是k个隐层单元的平均值。
[0147]
为了提高泛化性,引入权重衰减项,公式为:
[0148][0149]
最终新的损失函数为:
[0150]jnew
=-j
mc
+βj
sparse
+λj
weight
[0151]
其中β和λ是系数。
[0152]
具体的特征学习过程如图3所示,ae1,ae2,ae3分别将平衡数据,ae1的隐藏值和ae2的隐藏值作为输入。然后通过最小化新的损失函数来训练网络。ae3的输出即为低维特征。
[0153]
步骤5,对于平衡数据和学习得到的低维特征,构建svm分类器,svm分类器原理如图4所示,svm分类器对齿轮箱正常与故障振动信号进行分类,实现齿轮箱故障诊断。
[0154]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1