基于旋转机械的工作状态的自学习识别方法与流程

文档序号:17726182发布日期:2019-05-22 02:31阅读:144来源:国知局
基于旋转机械的工作状态的自学习识别方法与流程

本发明涉及机器学习算法的领域,具体地,涉及基于旋转机械的工作状态的自学习识别方法。



背景技术:

机械设备的状态监测与故障诊断是指利用现代科学技术和仪器,根据机械设备(系统、结构)外部信息参数的变化来判断机器内部的工作状态或机械结构的损伤状况,确定故障的性质、程度、类别和部位,预报其发展趋势,并研究故障产生的机理。

机械设备状态监测与故障诊断技术是保障设备安全运行的基本措施之一,旋转机械的状态监测,首选在设备上安装传感器,主要是根据加速度采集的振动信号来识别设备的运行状态,进而识别出故障,其实质是了解和掌握设备在运行过程中的状态,预测设备的可靠性,确定其整体或局部是正常或异常。它能对设备故障的发展作出早期预报,对出现故障的原因、部位、危险程度等进行识别和评价,预报故障的传统的处理是基于数字信号的算法得到信号的特征值,再利用统计分析和模式识别判决设备状态,这样的方法已经有一定使用价值,但是在实际系统中,振动信号变化大、建立数据模型复杂,导致这样的处理方法设备的状态和故障识别的准确性不高。



技术实现要素:

针对现有技术中的缺陷,本发明的目的是提供基于旋转机械的工作状态的自学习识别方法。本发明提供一套基于机器学习的算法,基于小波变换和机器学习的算法开发出一套用于监测具有振动信号的设备的运行状态和故障的识别算法;是基于旋转机械的振动信号的长期监测的大量数据,以机器学习的算法为核心,辅助以数字信号处理算法,提高了对机械设备的状态和故障的高分类识别率。

根据本发明的一个方面,提供基于旋转机械的工作状态的自学习识别方法,包括以下步骤:

步骤一,数据准备:采集监测设备的工况数据,将采集的工况数据按2s或3s的时长截取作为处理的原始样本,也是机器学习算法的训练样品;

步骤二,数据预处理:采用z-score归一化方法对原始数据的均值和标准差进行数据的标准化处理;经过处理的数据符合标准正态分布,均值为0,标准差为1,转化函数为:

其中,公式中x表示为原始信号,μ表示为原始数据的均值,σ表示为原始数据的标准差,x*表示为归一化后的信号;为了使得归一化更合理,训练数据和测试数据需要分开归一化;

步骤三,特征提取:采用deepscatteringspectrum算法获得6级迭代运算的参数特征,将六组参数特征串联得到原始特征,维数为7347维,以除去信号的时变性,以及获得完整的信号;步骤三的核心是除去信号的时变性,设备运行过程中的振动信号是时变信号,高频部分的信息不稳定,傅里叶变换不能除去信号的时变性,而梅尔频谱通过对频率进行平均可以稳定这些系数,但是有信息丢失;本发明为了稳定时变信号,以及分析这些丢失的信息,使用小波变换,选择恒定q滤波器组的小波变换可以得到等效的梅尔频谱,梅尔频谱会丢失高频的信息,但是小波变换得到的梅尔频谱保留了高频信息,因此对它继续做小波变换,可以恢复出高频部分带有的信息;

步骤四,特征降维:先采用t-test方法对原始特征进行降维,将显著性p<0.05的特征选择出来,维数降为3849维,再采用featuregeneratingmachine算法再次降维,得到140维的新特征值;每一段数据的维度都很高,但是在小波变换中基的选取会得到稀松的特征系数,也就是说大部分特征量是接近于0很小的数,这就为降维带来便利;另外,从大数据理论来看,虽然特征值维度很高,但是往往大部分维度和输出是无关的,因此需要进行特征降维;

步骤五,分类识别:将降维之后的特征值送入支持向量机中,训练支持向量机进行分类识别,最终得到分类识别的算法。

优选的,所述工况数据包括6种工况的数据,分别为3种正常工况的数据:启动、无负载空转、低速运行带负载,以及3种异常工况的数据:高速带负载、转子不平衡、轴承故障和润滑故障;所述原始样本总数为3723个,其中,3种正常工况的样本各521个,3种异常工况的样本各720个。工况数据包括传感器采集到旋转机器(如发动机、轴承、齿轮箱等)不同工作状态的振动信号。

优选的,所述步骤三中的特征提取过程包括以下步骤:

(1)将设备运行过程的振动信号采用恒定q滤波器组进行小波变换、求模和时间平稳三步处理得到等效的梅尔频谱,以获得信号的短时平稳特性;

(2)通过继续做小波变换来恢复等效的梅尔频谱数据中压缩的高频信息。

通过多次基于小波变换的迭代运算,除去了信号的时变性,且不会丢失信号的高频信息。其中第一次迭代,即步骤(1)得到了等效的梅尔频谱,而等效梅尔频谱可以除去信号的时变性,再继续做数次小波变换恢复梅尔频谱的中压缩的高频信息。算出等效的梅尔频谱后,再将隐藏的高频信息经过一系列新的小波的变换的模运算恢复,这个过程被定义为散射变换。

优选的,所述步骤(1)得到等效的梅尔频谱的运算过程包括以下步骤:

a)对信号样本x使用倍频程分辨率为q1的小波ψλ1做小波变换,其中,所述小波变换使用的基函数是一组q值为q1的带通滤波器;经过测试验证,q1设为8时具有很好的效果;

b)对所述小波变换的输出进行模运算,在模运算过程中用一阶模“||”代替平方运算,由公式(2)替代公式(1),

公式(1)为:

公式(2)为:

因较大的小波系数会被平方运算符放大,为了避免被放大到异常值,所述运算过程中用一阶模“||”代替平方运算;

c)所述模运算的结果再经过大小为t的低通滤波器φ(t)平均化,确保与时间偏移的局部不变性,得到等效的梅尔频谱,其等效的梅尔频谱系数,即一阶散射系数为:

s1x(t,λ1)=|x*ψλ1|*φ(t)

其中,所述x表示为原始信号的样本,λ表示为带通滤波器的中心频率,t表示为时间,ψ是小波变化的基,其基函数是一组带通滤波器,以下公式中x、λ、t、ψ表示的含义相同。

φ(t)是一个归一化的低通滤波器,而且满足在0~t时间内对φ(t)积分的结果等于1,t为样本的时长,本发明中时长为2s或3s。

优选的,所述步骤(2)中继续做小波变换包括以下步骤:

a)将得到的一阶散射系数做第二次小波变换,并求模和进行时间平稳后得到二阶散射系数,公式如下:

此步可以恢复部分信号的高频信息;

b)重复步骤a)的处理数次,计算m个小波卷积和模数的级联,得到m阶散射系数,公式如下:

高频信息每经过一次步骤a)的小波变换,就可多恢复一部分,但其恢复的量逐次减少,经过数次步骤a)的小波变换后信号的高频信息基本可完全恢复。

虽然等效梅尔频谱获得了时间的平稳性,但是高频信息被压缩,因此将步骤a)得到的一阶散射系数做第二次小波变换,并求模和做时间平稳后的计算,可以恢复信号的高频的信息,这也是小波变换获得的等效梅尔频谱的优点,正常的梅尔频谱运算中高频信息会丢失,不可恢复。

优选的,所述步骤b)中重复步骤a)的处理6次,所述m等于6。经过6次小波变换后每一段样本数据得到7347维的特征量,此时高频信息可恢复到原来的98%,再继续进行小波变换其恢复的高频信息量太少,因此选择进行6级小波变换最合适。

优选的,所述每一阶的散射系数是基于上一阶的一阶模计算得到:

|w|x=(x*φ(t),|x*ψλ(t)|)t∈r,λ∈λ。

优选的,所述小波变换满足以下条件:

一,为q值恒定的带通滤波器;

二,

三,为解析小波,且解析小波的中心频率归一化到1。解析小波是具有正交相位的复小波,其满足:其中ω<0,将解析小波系数的模数解释为子带希尔伯特包络解调。解调用于分离载波,并且得到包络。虽然小波模运算符去除了复相,但是它不会丢失信息,因为保留了多尺度包络的时间变化。信号不能从其傅立叶变换的模数中重建,但可以从其小波变换的模数中恢复。由于时间变量t不被二次采样,所以小波变换具有比原始信号更多的系数。当滤波器具有显着的频率重叠时,这些系数是高度冗余的。

优选的,所述步骤四中featuregeneratingmachine算法分为:最坏情况分析和子难题优化两步,算法中的特征数、惩罚因子、损失函数、以及迭代次数均自由设置,均可调。

更优选的算法中的特征数b=7,惩罚因子c=12,损失函数loss_type='squred_hinge',以及迭代次数max_iter=20。

优选的,所述步骤五中将训练数据的特征值作为算法的输入数据送入作为分类器的支持向量机后,采用10-fold交叉验证方法训练得到算法模型,且经过不断地调整参数优化,再次输入新数据后,支持向量机可自动分类识别。

与现有技术相比,本发明具有如下的有益效果:

(1)本发明涉及的基于旋转机械的工作状态的自学习识别方法,设计原理为:首先对于信号做归一化的预处理,其次利用deepscatteringspectrum方法对信号做特征提取,此时得到的特征值维度很高,再把特征降维,最后基于支持向量机对于信号做分类识别,得到机器的状态;

(2)本发明涉及的基于旋转机械的工作状态的自学习识别方法,是基于旋转机械的振动信号的长期监测的大量数据,以机器学习的算法为核心,辅助以数字信号处理算法,提高了对机械设备的状态和故障的高分类识别率;

(3)本发明涉及的基于旋转机械的工作状态的自学习识别方法,对于传统的信号处理方法无法得到有足够区分度的故障特征,可以利用本机器学习算法改进识别,以及识别当前工作状态,对于长期监测数据做分类处理,达到高准确率地识别设备状态和故障;

(4)本发明涉及的基于旋转机械的工作状态的自学习识别方法,基于机器学习方法处理旋转机械设备的振动信号,从而识别旋转机械设备的工作状态,进一步提升监测系统对设备的故障的诊断能力;

(5)本发明涉及的基于旋转机械的工作状态的自学习识别方法,算法简单,设计巧妙,效果显著;

(6)本发明涉及的基于旋转机械的工作状态的自学习识别方法,运行稳定可靠,适合大范围推广应用。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为步骤框图;

图2为散射变换示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。

实施例

本实施例涉及基于旋转机械的工作状态的自学习识别方法,其步骤框图如附图1所示,包括以下步骤:

步骤一,数据准备:采集监测设备的工况数据,将采集的工况数据按2s或3s的时长截取作为处理的原始样本,也是机器学习算法的训练样品;

步骤二,数据预处理:采用z-score归一化方法对原始数据的均值和标准差进行数据的标准化处理;经过处理的数据符合标准正态分布,均值为0,标准差为1,转化函数为:

其中,公式中x表示为原始信号,μ表示为原始数据的均值,σ表示为原始数据的标准差,x*表示为归一化后的信号;为了使得归一化更合理,训练数据和测试数据需要分开归一化;

步骤三,特征提取:采用deepscatteringspectrum算法获得6级迭代运算的参数特征,将六组参数特征串联得到原始特征,维数为7347维,以除去信号的时变性,以及获得完整的信号;步骤三的核心是除去信号的时变性,设备运行过程中的振动信号是时变信号,高频部分的信息不稳定,傅里叶变换不能除去信号的时变性,而梅尔频谱通过对频率进行平均可以稳定这些系数,但是有信息丢失;本发明为了稳定时变信号,以及分析这些丢失的信息,使用小波变换,选择恒定q滤波器组的小波变换可以得到等效的梅尔频谱,梅尔频谱会丢失高频的信息,但是小波变换得到的梅尔频谱保留了高频信息,因此对它继续做小波变换,可以恢复出高频部分带有的信息;

步骤四,特征降维:先采用t-test方法对原始特征进行降维,将显著性p<0.05的特征选择出来,维数降为3849维,再采用featuregeneratingmachine算法再次降维,得到140维的新特征值;每一段数据的维度都很高,但是在小波变换中基的选取会得到稀松的特征系数,也就是说大部分特征量是接近于0很小的数,这就为降维带来便利;另外,从大数据理论来看,虽然特征值维度很高,但是往往大部分维度和输出是无关的,因此需要进行特征降维;

步骤五,分类识别:将降维之后的特征值送入支持向量机中,训练支持向量机进行分类识别,最终得到分类识别的算法。

进一步的,所述工况数据包括6种工况的数据,分别为3种正常工况的数据:启动、无负载空转、低速运行带负载,以及3种异常工况的数据:高速带负载、转子不平衡、轴承故障和润滑故障;所述原始样本总数为3723个,其中,3种正常工况的样本各521个,3种异常工况的样本各720个。工况数据包括传感器采集到旋转机器(如发动机、轴承、齿轮箱等)不同工作状态的振动信号。

进一步的,所述步骤三中的特征提取过程包括以下步骤:

(1)将设备运行过程的振动信号采用恒定q滤波器组进行小波变换、求模和时间平稳三步处理得到等效的梅尔频谱,以获得信号的短时平稳特性;

(2)通过继续做小波变换来恢复等效的梅尔频谱数据中压缩的高频信息。

通过多次基于小波变换的迭代运算,除去了信号的时变性,且不会丢失信号的高频信息。其中第一次迭代,即步骤(1)得到了等效的梅尔频谱,而等效梅尔频谱可以除去信号的时变性,再继续做数次小波变换恢复梅尔频谱的中压缩的高频信息。算出等效的梅尔频谱后,再将隐藏的高频信息经过一系列新的小波的变换的模运算恢复,这个过程被定义为散射变换。

进一步的,所述步骤(1)得到等效的梅尔频谱的运算过程包括以下步骤:

a)对信号样本x使用倍频程分辨率为q1的小波ψλ1做小波变换,其中,所述小波变换使用的基函数是一组q值为q1的带通滤波器;经过测试验证,q1设为8时具有很好的效果;

b)对所述小波变换的输出进行模运算,在模运算过程中用一阶模“||”代替平方运算,由公式(2)替代公式(1),

公式(1)为:

公式(2)为:

mx(t,λ)≈∫|∫x(u)ψλ(v-u)du||φ(v-t)|dv

=|x*ψλ|*|φ|(t);

因较大的小波系数会被平方运算符放大,为了避免被放大到异常值,所述运算过程中用一阶模“||”代替平方运算;

c)所述模运算的结果再经过大小为t的低通滤波器φ(t)平均化,确保与时间偏移的局部不变性,得到等效的梅尔频谱,其等效的梅尔频谱系数,即一阶散射系数为:

其中,所述x表示为原始信号的样本,λ表示为带通滤波器的中心频率,t表示为时间,ψ是小波变化的基,其基函数是一组带通滤波器,以下公式中x、λ、t、ψ表示的含义相同。

φ(t)是一个归一化的低通滤波器,而且满足在0~t时间内对φ(t)积分的结果等于1,t为样本的时长,本发明中时长为2s或3s。

进一步的,所述步骤(2)中继续做小波变换包括以下步骤:

a)将得到的一阶散射系数做第二次小波变换,并求模和进行时间平稳后得到二阶散射系数,公式如下:

此步可以恢复部分信号的高频信息;

b)重复步骤a)的处理数次,计算m个小波卷积和模数的级联,得到m阶散射系数,公式如下:

高频信息每经过一次步骤a)的小波变换,就可多恢复一部分,但其恢复的量逐次减少,经过数次步骤a)的小波变换后信号的高频信息基本可完全恢复。

虽然等效梅尔频谱获得了时间的平稳性,但是高频信息被压缩,因此将步骤a)得到的一阶散射系数做第二次小波变换,并求模和做时间平稳后的计算,可以恢复信号的高频的信息,这也是小波变换获得的等效梅尔频谱的优点,正常的梅尔频谱运算中高频信息会丢失,不可恢复。

进一步的,所述步骤b)中重复步骤a)的处理6次,所述m等于6。经过6次小波变换后每一段样本数据得到7347维的特征量,此时高频信息可恢复到原来的98%,再继续进行小波变换其恢复的高频信息量太少,因此选择进行6级小波变换最合适。

进一步的,所述每一阶的散射系数是基于上一阶的一阶模计算得到:

|w|x=(x*φ(t),|x*ψλ(t)|)t∈r,λ∈λ。

进一步的,所述小波变换满足以下条件:

一,为q值恒定的带通滤波器;

二,

三,为解析小波,且解析小波的中心频率归一化到1。解析小波是具有正交相位的复小波,其满足:其中ω<0,将解析小波系数的模数解释为子带希尔伯特包络解调。解调用于分离载波,并且得到包络。虽然小波模运算符去除了复相,但是它不会丢失信息,因为保留了多尺度包络的时间变化。信号不能从其傅立叶变换的模数中重建,但可以从其小波变换的模数中恢复。由于时间变量t不被二次采样,所以小波变换具有比原始信号更多的系数。当滤波器具有显着的频率重叠时,这些系数是高度冗余的。

进一步的,所述步骤四中featuregeneratingmachine算法分为:最坏情况分析和子难题优化两步,算法中的特征数、惩罚因子、损失函数、以及迭代次数均自由设置,均可调。

更进一步的,算法中的特征数b=7,惩罚因子c=12,损失函数loss_type=′squred_hinge′,以及迭代次数max_iter=20。

进一步的,所述步骤五中将训练数据的特征值作为算法的输入数据送入作为分类器的支持向量机后,采用10-fold交叉验证方法训练得到算法模型,且经过不断地调整参数优化,再次输入新数据后,支持向量机可自动分类识别。

进一步的,所述步骤三中deepscatteringspectrum算法的具体步骤如下:

首先,获得一个时间上平均的局部转换不变的描述符x,x的高频信息通过小波模数变换来恢复,公式如下:

用具有八度音频分辨率q1的小波计算。对于声音振动类的信号,设置q1=8,它定义与频率滤波器具有相同频率分辨率的小波。旋转机械设备上采集到的声音振动信号在低频下能量很小,所以s0x(t)约等于0。通过平均小波模量系数,获得等效的梅尔频谱系数:

所述系数亦称为一阶散射系数,其应用于每个|x*ψλ1|的第二小波模变换|w2|的计算,其也提供互补的高频小波系数:

小波ψλ2具有与q1不同的八度分辨率q2,该小波选择获得稀疏表达,这意味着将信号信息集中在尽可能少的小波系数上。这些系数由大小为t的低通滤波器φ(t)平均化,确保与时间偏移的局部不变性,与一阶系数一样,其定义二阶散射系数:

通过对每个||x*ψλ1|*ψλ2|应用第三小波模变换|w3|来计算这些平均值。它通过卷积具有八度分辨率q3的新的一组小波ψλ3来计算它们的小波系数。迭代该过程定义任何阶数m的散射系数。

对于任何m≥1,迭代的小波模数卷积被写成:

其中m阶小波ψλm具有八度分辨率qm,并且满足稳定性条件。用φ(t)表示平均umx,得到m阶散射系数:

在umx上应用|wm+1|计算smx和umm+1x:

|wm+1|umx=(smx,um+1x)

因此,通过初始化umx=x并在0≤m≤1区间内递归计算来定义最大阶数1的散射分解。该散射变换如图2所示,散射变换迭代小波模运算符|wm|来计算存储在umx中的m个小波卷积和模数的级联,并输出平均散射系数smx。最终在0≤m≤1上散射矢量聚集所有散射系数:

sx=(smx)0≤m≤l

卷积和非线性的散射级联也可以解释为卷积网络,其中umx是第m个内部网络层的系数集合。这些网络已被证明对声音和振动类信号的分类非常有效。然而,与标准卷积网络不同,每个这样的层具有输出smx=um,而不仅仅是最后一层。此外,所有滤波器都是预定义的小波,并且不从训练数据中学习。散射变换就像mfcc一样,无需学习,表达了信号的一种不变性。它依赖于需要计算的这种类型不变性的先前信息,在这里信号相对于时移和时间扭曲变形存在一种不变性。当没有这样的信息可用时,或者如果变异的来源复杂得多时,就需要从示例中学习,这是一个非常适合深层神经网络的任务。

小波倍频程分辨率在每个层m进行优化,以在下一层产生稀疏小波系数。这更好地保留信号信息。稀疏性似乎也对分类起着重要作用。对于声音振动类的信号x,选择q1=8的八度音阶的小波已经显示出采集到的振动信号稀疏表示。它几乎对应于梅尔级别频率细分。

在第二个阶段,选择q2=1定义了更小时间支持的小波,更适合于表征瞬态和追踪。恢复出信号的高频信息可能需要具有更好频率分辨率的小波,因此q2>1。在较高的阶数m≥3,均设置qm=1,但是这些系数经常被忽略。

散射级联与目标在于更多的恢复出信号的高频信息,其中包含恒定q滤波器组的级联,随后是非线性。q1=8的第一个滤波器组得到了等效于梅尔谱的特性,而第二个滤波器组对应于具有q2=1的滤波器的模型中的后续处理。

进一步的,所述步骤五分类识别中有多重分类器用于分析特征值数据,识别样本数据对应不同的机器运行状态;

其中,各模型算法对比见表1,

浅层算法分为:

svm:支持向量机,效果很好,并且具有对未知数据很好的泛化推广能力;

elm:训练很快,结果也比较高,但是,对系统计算资源要求比较高,同时,结果不太稳定;

深度学习算法:

sae:非监督学习,效果尚可,但不如直接用sif特征,训练比较快;

dnn:效果比较差,可能是数据样本比较少,模型训练不够完备。

表1各模型算法对比(10-foldcv)

比较后,使用svm作为模型分类器,其算法比较成熟,并且在这里有很强的适应性,效果很好,具有对未知数据很好的泛化推广能力。使用中把新的采集样本数据经过处理,得到140维的特征量,送入训练好的支持向量机,即可获得分类的结果。

重新采集了10组数据,属于6种不同的工况,经过算法测试结果见表2:

表26种不同的工况经过算法测试后的结果

其中,准确率:正确分类的样本数/总样本数;

tp:实际类别为1,预测类别为1;fp:实际类别为1,预测类别为0;

fn:实际类别为0,预测类别为1;tn:实际类别为0,预测类别为0。

由以上结果可知,svm有较高的分类准确率,并且对未知的剩余正常数据也有非常好的推广泛化能力。其中,真正类(tp)和真负类(tf)较大,表示分类正确的数据样本数,假负类(fp)较大,表示有些故障被预测为正常数据,这是应该尽力减少的,原因可能是由于故障的数据样本不够全面多样,使故障数据不能正确的被预测。同时,真负类(fp)较小,这是所希望的,表明模型对正常数据具有很好的预测识别能力。

表3为10组在训练好的支持向量机的实验结果,在可自动分类识别常规干扰环境下,即信噪比较好的情况下,探测率至少保证92%以上,虚警率在8%以下,而在恶劣环境即有电磁干扰和强振动实验条件下,进一步降低探测率和虚警率指标。

表310组在训练好的支持向量机的实验结果

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1