一种基于MFCC-CNN的矿井提升机故障声学分析方法

文档序号:26091203发布日期:2021-07-30 17:59阅读:326来源:国知局
一种基于MFCC-CNN的矿井提升机故障声学分析方法

本发明涉及提升机音频信号分析领域,具体是一种基于mfcc-cnn的矿井提升机故障声学分析方法。



背景技术:

矿井提升机是煤矿运输过程中的关键技术设备,其稳定性和安全性是煤矿企业生产和井下工作人员安全的重要保障。传统的提升机故障诊断方法有:基于模型的参数估计法和状态估计法,以及基于先验知识的图论方法和专家系统。但基于模型的参数估计和状态估计存在从模型到设备元件映射复杂,模型建立难度高的问题,而专家系统等方法的知识获取难度较高,只适合于在一定规程限制下的机器故障诊断。信号处理结合神经网络分析等新型故障诊断方法正逐步应用在提升机等机械设备的健康分析中。

目前,较为广泛的是通过对提升机电机轴承、天轮等关键部件振动信号的分析来对提升机的运行状态进行判断,结合神经网络方法,可以实现提升机故障诊断的智能化。振动信号和声学信号都是对机器振动状态的一种反映,两者在本质上是相同的,但采集的方式不同。声学信号虽然往往相较于振动信号其信噪比较低,但是它的优点也十分显著,利用声学信号来对提升机进行故障诊断时,其信号采集速度比较快,同时采集设备简单,成本低,能够实现提升机状态实时的在线监测与分析。

mel频率倒谱系数(melfrequencycepstralcoefficient,mfcc)是一种声音信号的频域分析方法,其对于输入的音频信号的种类没有限制,不易受音频信号中干扰信息的影响,具有较高的音频信号识别分析能力;而卷积神经网络(convolutionalneuralnetworks,cnn)是全连接神经网络的一种拓展,能够准确提取数据深层信息的同时减少了数据量,在人脸识别、语音识别等领域应用广泛。



技术实现要素:

本发明的目的是提出一种基于mfcc-cnn的矿井提升机故障声学分析方法,该方法能够有效识别出提升机运行过程中异常的音频信号,从而对提升机的状态进行诊断。

本发明为实现发明目的采用如下技术方案:

一种基于mfcc-cnn的矿井提升机故障声学分析方法,包括以下步骤:

步骤1、利用麦克风阵列采集矿井提升机一次完整运行过程的音频信号,并以.wav的格式对音频信号进行存储,读取存储的音频信号进行预处理,预处理包括:预加重、分帧、门限端点检测和加窗;

步骤2、对预处理后的音频信号进行mfcc特征参数提取,包括:短时傅里叶变换、mel滤波器滤波和离散余弦变换;

步骤3、构建cnn模型:包括输入层,第一卷积层,第一池化层,第二卷积层,第二池化层,第一全连接层,第二全连接层和输出层,第一卷积层和第二卷积层的卷积核大小均为4×4,第一池化层和第二池化层的池化域的大小均为3×3;将步骤2中得到的mfcc随帧数变化的特征曲线作为输入与第一卷积层连接,第一卷积层的输出通过第一池化层降维再输入到第二卷积层,第二卷积层的输入经第二池化层降维输入到第一全连接层,第一全连接层和第二全连接层连接,由第二全连接层将数据传递给输出层;第一卷积层和第二卷积层中的激活函数选取的均是sigmoid函数,输出层中的回归算法选取的是softmax函数;

步骤4、cnn模型训练,提升机故障诊断:将步骤2中得到的mfcc随帧数变化的特征曲线作为步骤3中cnn模型的输入,重复步骤1、2采集1000组故障时提升机运行音频信号和正常运行的提升机音频信号200组,并分别得出每一组故障样本和正常样本的mfcc随帧数变化的特征曲线,将这些故障样本和正常样本的mfcc随帧数变化的特征曲线输入到cnn模型中,得到训练后的模型modelx;进行提升机故障诊断时,将所采集和分析得出的音频信号mfcc随帧数变化的特征曲线输入到模型modelx中,判断其是故障样本还是正常样本。

进一步的,步骤1中的预加重、分帧、门限端点检测和加窗具体包括:

步骤1-1、预加重:通过对音频信号的不同分段加上权值,来使信号的频谱变得平坦,提升高频成分的同时减小随机噪声对音频信号的影响,预加重处理函数y表达式为:

其中:x(i)表示第i个采样点出的音频信号,m为采样点个数,t为矩阵的转置;

步骤1-2、分帧:采用重叠分段的形式对采集的音频信号进行处理,依据音频信号的采样率,设置每一帧的帧长为采样率与0.025的乘积结果,相邻帧之间重叠区域的长度即帧移为采样率与0.015的乘积结果,音频信号的采样率设置为16000hz,即每一帧的帧长为400,相邻帧之间的帧移为240;

步骤1-3、门限端点检测:计算音频信号中的时域特征中的短时能量参数,得出音频信号的起始点与终止点,第x帧的短时能量en计算公式为:

其中:a表示帧长;

步骤1-4、加窗:使用汉明窗对音频信号进行加窗,减小信号的截断效应,增加每一帧左右两侧的连续性,汉明窗的表达式为:

w=0.54-0.46cos(2πn/a)(3)

其中:n表示常数,1≤n≤400。

进一步的,步骤2中的短时傅里叶变换、mel滤波器滤波和离散余弦变换具体包括:

步骤2-1、短时傅里叶变换:对加窗后的每一帧音频信号都进行快速傅里叶变换,将时域的音频信号转换到频域:

d(z,m)=fft(x(z),s)(4)

其中:z表示分帧后的第z帧,m表示频域中的第m条谱线,s表示对音频信号的每一帧都进行s维的快速傅里叶变换,s的值设置为4096;

步骤2-2、mel滤波器滤波:计算经快速傅里叶变换得到的d(z,m)中每一帧的谱线能量,即为每一帧信号频谱幅度d(z,m)的平方;将每一帧的谱线能量经过mel滤波器,变换为mel刻度下的值,第p个mel滤波器的频率响应传递函数为:

其中:第p个mel滤波器的中心频率f[p]为:

mel(f[p+1])-mel(f[p])=mel(f[p])-mel(f[p-1])(6);

再计算mel滤波器的频率响应hp(k)与d(z,m)的每一帧谱线能量的乘积之和,得到mel滤波器能量:

其中:p为整数,2≤p≤27;

步骤2-3、离散余弦变换:利用离散余弦变换将步骤2-2中的结果l(z,p)从频域再变换到时域,得到最终的mfcc数值:

其中:m′为离散余弦变换后每一帧的谱线,p表示mel滤波器的总个数,p的值设置为26。

本发明现有技术相比,其有益效果体现在:

1.利用提升机运行时的声学信号的来对提升机的故障进行分析判断,声音采集和分析设备的成本较低、操作简单、信号采集较为灵活,进行故障诊断的实时性高。

2.将音频信号的频域中的mfcc特征与cnn模型相结合,随着cnn模型中训练样本的增大,提升机故障诊断的准确性也会随之提升。

附图说明

图1为本发明的一种基于mfcc-cnn的矿井提升机故障声学分析方法的流程示意图。

图2为本发明中汉明窗的示意图。

图3为本发明中音频信号中第7帧的原始信号图。

图4为本发明中音频信号中第7帧加了汉明窗的信号图。

图5为本发明中音频信号的原始信号波形图。

图6为本发明中26个mel滤波器的谱线示意图。

图7为本发明中一组正常音频信号样本的mfcc随帧数变化的特征曲线图。

图8为本发明中cnn模型结构示意图。

具体实施方式

以下通过具体实施例来对本发明做进一步解释说明。

如图1所示,本发明的一种基于mfcc-cnn的矿井提升机故障声学分析方法,具体包括如下步骤:

步骤1、利用麦克风阵列对矿井提升机一次完整运行过程的音频信号进行采集,并以.wav的格式对音频信号进行存储,读取存储的音频信号进行预处理,预处理包括:预加重、分帧、门限端点检测和加窗。

步骤1-1、预加重:通过对音频信号的不同分段加上权值,来使信号的频谱变得平坦,提升高频成分的同时减小随机噪声对音频信号的影响,预加重处理函数y表达式为:

其中:x(i)表示第i个采样点出的音频信号,m为采样点个数,t为矩阵的转置。

步骤1-2、分帧:采用重叠分段的形式对采集的音频信号进行处理,依据音频信号的采样率,设置每一帧的帧长为采样率与0.025的乘积结果,相邻帧之间重叠区域的长度即帧移为采样率与0.015的乘积结果。

步骤1-3、门限端点检测:计算音频信号中的时域特征中的短时能量参数,得出音频信号的起始点与终止点,第x帧的短时能量en计算公式为:

其中:a表示帧长。

步骤1-4、加窗:使用汉明窗对音频信号进行加窗,减小信号的截断效应,增加每一帧左右两侧的连续性,如图2所示的汉明窗示意图,汉明窗的表达式为:

w=0.54-0.46cos(2πn/a)(3)

其中:n表示常数,1≤n≤400。

步骤2、对预处理后的音频信号进行mfcc特征参数提取,包括:短时傅里叶变换、mel滤波器滤波和离散余弦变换。

步骤2-1、短时傅里叶变换:对加窗后的每一帧音频信号都进行快速傅里叶变换,将时域的音频信号转换到频域:

d(z,m)=fft(x(z),s)(4)

其中:z表示分帧后的第z帧,m表示频域中的第m条谱线,s表示对音频信号的每一帧都进行s维的快速傅里叶变换。

步骤2-2、mel滤波器滤波:计算经快速傅里叶变换得到的d(z,m)中每一帧的谱线能量,即为每一帧信号频谱幅度d(z,m)的平方;将每一帧的谱线能量经过mel滤波器,变换为mel刻度下的值,第p个mel滤波器的频率响应传递函数为:

其中:第p个mel滤波器的中心频率f[p]为:

mel(f[p+1])-mel(f[p])=mel(f[p])-mel(f[p-1])(6);

再计算mel滤波器的频率响应hp(k)与d(z,m)的每一帧谱线能量的乘积之和,得到mel滤波器能量:

其中:p为整数,2≤p≤27。

步骤2-3、离散余弦变换:利用离散余弦变换将步骤2-2中的结果l(z,p)从频域再变换到时域,得到最终的mfcc数值:

其中:m′为离散余弦变换后每一帧的谱线,p表示mel滤波器的总个数。

步骤3、构建cnn模型:包括输入层,第一卷积层,第一池化层,第二卷积层,第二池化层,第一全连接层,第二全连接层和输出层,第一卷积层和第二卷积层的卷积核大小均为4×4,第一池化层和第二池化层的池化域的大小均为3×3;将步骤2中得到的如图7所示的mfcc随帧数变化的特征曲线作为输入与第一卷积层连接,第一卷积层的输出通过第一池化层降维再输入到第二卷积层,第二卷积层的输入经第二池化层降维输入到第一全连接层,第一全连接层和第二全连接层连接,由第二全连接层将数据传递给输出层;第一卷积层和第二卷积层中的激活函数选取的均是sigmoid函数,输出层中的回归算法选取的是softmax函数,cnn的模型结构如图8所示。

步骤4、cnn模型训练,提升机故障诊断:重复步骤1、2采集1000组故障时提升机运行音频信号和正常运行的提升机音频信号200组,并分别得出每一组故障样本和正常样本的mfcc随帧数变化的特征曲线,将这些故障样本和正常样本的mfcc随帧数变化的特征曲线输入到cnn模型中,得到训练后的模型modelx;进行提升机故障诊断时,将所采集和分析得出的音频信号mfcc随帧数变化的特征曲线输入到模型modelx中,判断其是故障样本还是正常样本。

进一步的,步骤1-2中,音频信号的采样率为16000hz,每一帧的帧长为400,相邻帧之间的帧移为240。

进一步的,步骤2-1中,s=4096。

进一步的,步骤2-3中,p=26。

需要说明的是,以上公开的仅为本发明的具体实例,根据本发明提供的思想,本领域的技术人员能思及的变化,都应落入本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1