一种基于多感受域GCN的水电机组故障诊断方法和系统

文档序号:31932605发布日期:2022-10-26 00:52阅读:72来源:国知局
一种基于多感受域GCN的水电机组故障诊断方法和系统
一种基于多感受域gcn的水电机组故障诊断方法和系统
技术领域
1.本发明属于水电机组故障诊断技术领域,更具体地,涉及一种基于多感受域gcn的水电机组故障诊断方法和系统。


背景技术:

2.水电机组的安全运行保障能源安全和电网安全的关键。水电机组是发挥水电站能源供给功能和经济效益的核心,担负着电网调峰填谷、调频调相、旋转备用等多重任务。机组启停和工况转换频繁,水力冲击、机械失效和电磁不平衡等因素可能诱发水电机组异常振动、结构疲劳、电气故障、运行方式破坏等各种故障与事故,危害性极其严重。水电机组故障数据具有可用的标记样本较少、人工标记难度较大等问题。在深度学习模型飞速发展的今天,需要采用一种高效的、能适应少样本的模型方法对机组故障进行精确诊断。
3.水电机组故障诊断使用的信号主要是机组在运行过程中利用传感器监测到的振动信号。针对一维信号,常用的特征提取方法是采用时域分析、频域分析以及时频域方法对信号进行处理。这一类特征提取方法虽然简单,但是提取的特征具有实际意义,能够一定程度上表征轴承各种运行状态的特点。常用的时频域分析方法包括短时傅里叶变换(short-time fourier transform,stft)、小波变换(wavelet transform,wt),变分模态分解(variational mode decomposition,vmd)等。利用时频域方法提取各种特征后,一般难以直接区分每种运行状态,因此常常需要利用机器学习方法对提取的特征进行进一步学习。在故障诊断领域常用的机器学习算法包括随机森林(random forest,rf)、支持向量机(support vector machines,svm)、朴素贝叶斯(naive bayes,nb)分类器等模型。这种方法具有构造简单、分类速度较快等特点,因此在故障诊断发展早期被大量的应用。但是这种方法难以拟合复杂的故障情况,当需要识别的类别较多时,难以得到满意的结果。
4.深度学习模型具有端到端的特性,可以直接对信号特征进行提取从而省略利用专业知识提取特征这一步骤,具有较强的模型泛化能力,同时能够拟合较为复杂的数据分布,具有较高的精确度。其中,卷积神经网络(convolutional neural network,cnn)、深度置信网络(deep belief network,dbn)、自编码器(autoencoder,ae)等深度网络在故障诊断领域被广泛使用。但是这类基于深度学习的故障诊断模型通常需要大量的标签数据进行训练才能得到较为满意的结果,而现实情况中带标签的数据比较稀少,从而导致一般的深度学习方法在实际场景下表现较差。
5.专利cn113324754a公开了一种基于多感受野图卷积的齿轮传动系统故障识别方法,构建由两层多感受野图卷积层和两层全连接层构成的多感受野图卷积网络,通过第一关联图数据对多感受野图卷积网络进行训练;将第二关联图数据输入训练后的多感受野图卷积网络,实现对未知故障的齿轮传动系统的故障识别。然而,该方法存在以下不足和缺陷:
6.1、该方法直接将振动样本的时序数据作为节点特征,由于为了较好地表征振动信号的完整特征,样本的原始时序数据点较多,因此在进行图卷积网络训练时,占用大量的计
算内存空间,不利于满足现场使用中故障识别实时性的要求。
7.2该方法构建的关联图数据样本中边的权值均为1,而不同样本特征并不是完全一致的,各个样本之间的相关关系并不相同,简单的把边的权值定义为1不能很好地表现样本之间的关系,会对诊断结果产生消极的影响。
8.3、该方法所构建的多感受野图卷积网络包含两个多感受野图卷积层,每一层包括3个感受野的图卷积网络模块。在这样的模型结构下,模型训练所需的时间将会增加,不利于满足现场使用中故障识别实时性的要求。


技术实现要素:

9.针对现有技术的缺陷,本发明的目的在于提供一种基于多感受域gcn的水电机组故障诊断方法和系统,旨在解决现有诊断方法无法满足实时性和精度的问题。
10.为实现上述目的,第一方面,本发明提供了一种基于多感受域gcn的水电机组故障诊断方法,包括:
11.(1)获取水电机组待诊断期间的振动数据,按照振动周期划分为多个待测振动样本,得到待诊断振动样本集;
12.(2)构建待诊断振动样本集对应的图结构数据,具体过程为:
13.(2.1)将每个振动样本抽象为节点;(2.2)计算每个振动样本的时域特征和频域特征,作为该节点的属性;(2.3)计算两两振动样本之间的相关度,若相关度低于失效阈值,则这两个振动样本之间不存在边,否则,这两个振动样本之间存在边,且相关度作为边的权重;
14.(3)将待诊断振动样本集对应的图结构数据输入至训练好的多感受域图卷积网络模型,得到每个待测振动样本的故障诊断结果;
15.所述多感受域图卷积网络模型的训练过程为:
16.获取水电机组历史振动数据,按照振动周期划分为多个振动样本,标注各振动样本的故障类型,得到训练振动样本集;
17.构建训练振动样本集对应的图结构数据;
18.采用训练振动样本集对应的图结构数据训练多感受域图卷积网络模型,得到训练好的多感受域图卷积网络模型。
19.优选地,所述计算每个振动样本的时域特征具体如下:
[0020][0021][0022][0023]
[0024]
p5=max(x(n))
[0025][0026][0027][0028][0029][0030][0031]
其中,x(n)表示时序信号,即水电机组振动的原始数据,n表示该振动样本内数据点的数量。
[0032]
需要说明的是,本发明提出11种时域特征,其中一部分特征(p1与p3~p5)反映了信号在时间域内的幅值与能量的特征,另一部分特征(p2与p6~p
11
)反映了信号在时间序列的分布情况,因此该时域特征集合能较为完整的反应信号的时域特征,有助于后续故障识别的精度提升。
[0033]
优选地,所述计算每个振动样本的频域特征具体如下:
[0034][0035][0036][0037][0038][0039][0040]
[0041][0042][0043][0044][0045][0046]
其中,s(k)表示振动样本fft变换后频谱的第k个值,k表示频谱线的数量,f(k)表示第k条谱线的频率值。
[0047]
需要说明的是,本发明提出12种频域特征,其中一部分特征(p
12
~p
15
、p
17
和p
21
~p
23
)反映了信号频谱的收敛性,另一部分特征(p
16
与p
18
~p
20
)反映了信号频率成分中主要频率的分布情况,该频域特征集合能较好地反映信号在频域中的特征,有助于提升后续故障诊断的精度。
[0048]
优选地,计算两两振动样本之间的相关度具体如下:
[0049][0050]
其中,a
ij
表示第i个振动样本与第j个振动样本之间的相关度,fi表示第i个振动样本的频谱,cos()表示余弦值计算函数,ε表示边失效阈值。
[0051]
需要说明的是,本发明优选余弦值衡量相关度,当计算得到的相关性小于该阈值时,将其置为0,可有效降低生成的图结构数据复杂度,进一步提升故障检测实时性。
[0052]
优选地,所述多感受域图卷积网络模型包括:
[0053]
第一图卷积层,用于从图结构数据中提取第一感受域图卷积特征;
[0054]
第二图卷积层,用于从经过relu的第一感受域图卷积特征中提取第二感受域图卷积特征;
[0055]
拼接层,用于拼接图结构数据节点特征、第一感受域图卷积特征、第二感受域图卷积特征,得到拼接特征;
[0056]
dense全连接层,用于接收经过relu的拼接特征,进行全连接;
[0057]
softmax分类器,用于接收relu后的全连接特征,输出每种故障可能出现的概率。
[0058]
需要说明的是,本发明优选上述结构的多感受域图卷积网络模型,该模型具有较为简单的结构,对比传统的图卷积网络,几乎没有增加额外的计算空间与时间,同时能实现多感受域特征的聚合,能在有效提升故障诊断精度的同时保证模型的实时性要求。
[0059]
优选地,第一图卷积层的输出为第二图卷积层的输出为
[0060]
其中,
[0061]
其中,x1表示第一图卷积层的输出向量,x0表示第一图卷积层的输入向量,w0表示第一图卷积层的权重,表示中间变量,x2表示第二图卷积层的输出向量,w1表示第二图卷积层的权重,表示附加节点自连接的邻接矩阵,表示附加自连接的度矩阵,a表示图结构数据的邻接矩阵,in表示单位矩阵。
[0062]
为实现上述目的,第二方面,本发明提供了一种基于多感受域gcn的水电机组故障诊断系统,包括:处理器和存储器;
[0063]
所述存储器用于存储计算机程序或指令;
[0064]
所述处理器用于执行存储器中的所述计算机程序或指令,使得第一方面所述的方法被执行。
[0065]
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
[0066]
本发明提出一种基于多感受域gcn的水电机组故障诊断方法和系统,通过构建图结构数据,将振动样本抽象为节点,振动样本的时域特征和频域特征作为节点的属性,将相关度高的振动样本之间抽象为边,相关度作为边的权重,最大程度上利用有限振动样本中的信息。提出一种多感受域图卷积网络模型,能有效处理图结构数据,利用样本之间的相关信息,将不同感受域的特征结合起来,进一步提升了样本特征的质量,从而有效地提升水电机组故障诊断精度和实时性。
附图说明
[0067]
图1是本发明提供的一种基于多感受域gcn深度学习模型的水电机组故障诊断方法流程图;
[0068]
图2为本发明提供的一种图结构数据示例;
[0069]
图3是本发明提供的多感受域gcn模型结构示意图;
[0070]
图4是本发明提供的一种基于多感受域gcn深度学习模型的水电机组故障诊断系统结构图。
具体实施方式
[0071]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0072]
图1是本发明提供的一种基于多感受域gcn深度学习模型的水电机组故障诊断方法流程图。如图1所示,该方法包括:
[0073]
步骤1:原始数据预处理。
[0074]
以水电机组振动的原始数据作为输入样本集s,将样本集s分为m组数据块,为了包含原始振动信号中的周期性信息,按照一个周期为准进行分组。对水电机组振动信号进行特征提取,具体地,从时域与频域两个方面对原始信号进行特征提取。并按照比例划分模型
训练集、验证集与测试集。
[0075]
其中,时域特征包括:
[0076][0077][0078][0079][0080]
p5=max(x(n))
[0081][0082][0083][0084][0085][0086][0087]
其中,x(n)是时序信号,即水电机组振动的原始数据,n是该样本内数据点的个数。
[0088]
其中,频域特征包括:
[0089][0090][0091][0092]
[0093][0094][0095][0096][0097][0098][0099][0100][0101]
其中,s(k)是频谱的第k个值,是原始数据通过fft变换得到的频域数据。k是频谱线的数量,f(k)是第k条谱线的频率值。
[0102]
步骤2:图结构数据的构建。
[0103]
对样本数据做fft变换得到相应的频谱,然后计算样本频谱的余弦值作为边的属性值。将步骤1中提取的特征作为节点属性,结合步骤2中边的属性值,可以构建得到机组振动图结构数据。相关度也可采用其他方式衡量。
[0104]
图2为本发明提供的一种图结构数据示例。如图2所示,每一个样本就是一个节点,节点的属性就是样本的特征,即,提取到的时域与频域特征。边是两个样本之间的相关关系,边的属性就是利用步骤2.2中这个式子计算得到的值,用于表示不同样本之间的相似度。具体的步骤如下:
[0105]
步骤2.1、对振动信号做快速傅里叶变换,得到信号的频谱值f。
[0106]
步骤2.2、计算任意两个样本之间的相关关系,构造图结构数据的邻接矩阵a,具体的计算公式如下:
[0107][0108]
其中,a
ij
表示第i和样本与第j个样本之间的相关关系,fi代表第i个样本的频谱,cos()表示余弦值计算函数,ε为定义的边失效阈值,取值范围为[0,1]。当计算得到的相关性小于该阈值时,将其置为0,从而有效降低生成的图结构数据复杂度。
[0109]
步骤2.3、构造图结构数据g={n,e},其中,n表示图中的节点,e表示两个样本之间
的关系。
[0110]
步骤3:基于多感受域图卷积网络的水电机组故障诊断。
[0111]
建立多感受域图卷积网络模型,对步骤2得到的图结构数据进行进一步的特征提取。记录每一层标准图卷积层的输出,将每一层的输出和输入的数据进行拼接,得到多个感受域的特征集合。
[0112]
本实施例中构建的多感受域图卷积网络结构参数如表1所示。
[0113]
表1
[0114]
模型输入维度输出维度第一图卷积层2316第二图卷积层1616全连接层55(23+16+16)28
[0115]
图3是本发明提供的多感受域gcn模型结构示意图。多感受域图卷积网络的前向计算过程如图3所示,训练样本就是构造得到的图结构数据的节点,标签就是样本的类别。多感受域图卷积网络使用就是把图结构数据的样本特征和处理后的邻接矩阵输入到网络中进行训练与测试。具体步骤如下:
[0116]
步骤3.1、第一层图卷积网络的输出为其中,x1为第一图卷积层的输出向量,x0为第一图卷积层的输入向量,w0为第一图卷积层的权重,表示中间变量。
[0117]
步骤3.2、第k图卷积层的输出为其中,xk为第k图卷积层的输出向量,x
k-1
为第k图卷积层的输入向量,w
k-1
为第k图卷积层的权重。
[0118]
步骤3.3、多层图卷积网络输出的多感受域特征为x
con
=[x0,x1,...,xk],其中,x
con
为多感受图卷积网络输出的拼接特征,x0为网络的输入向量,xk为第k图卷积层的输出向量。本发明中k取值为2。
[0119]
对拼接特征进行非线性化处理,得到x
rcon
=relu(x
con
)。
[0120]
步骤3.4、此前步骤计算所用到的计算公式为其中,为附加节点自连接的邻接矩阵(adjacency matrix with added self-connections),为附加自连接的度矩阵。
[0121]
的计算公式为其中,a为图结构数据的邻接矩阵,由步骤2.2可以计算得到,in为单位矩阵。
[0122]
的计算公式为其中,为上一步骤计算得到的重整化邻接矩阵。
[0123]
步骤3.5、此前步骤计算所用到的relu激活函数公式为:
[0124][0125]
步骤4:基于softmax分类器与训练过程。
[0126]
经过第3步网络模型的特征提取,可以得到一组特征向量,选择softmax分类器作为水电机组故障的分类方法,处理水电机组在多种故障下的多分类问题。重构出的特征向
量经过一层全连接的组合网络,得到特征的一种线性组合作为softmax分类器的输入,计算出表示每一种故障的出现可能性的概率。
[0127]
步骤4.1、使用全连接层dense层连接在图卷积层后面,将前面各个图卷积层的输出拼接得到特征向量作为其输入向量来进行进一步的特征提取,dense层的激活函数仍然选择relu来减小梯度弥散问题,其计算公式如下:
[0128]
dense(x)=relu(ω
·
x
rcon
+b)
[0129]
其中,ω为权重,b为偏置,x
rcon
为输入,对应多感受域图卷积网络输出的拼接特征向量。
[0130]
步骤4.2、通过softmax分类器对dense层的输出特征向量进行特征分类得到概率输出向量,softmax是当前神经网络学习中广泛使用的分类器。其具体公式为:
[0131][0132]
其中,x为softmax分类器的输入向量,在模型中为dense层的输出,θ为softmax分类器的权重矩阵,c为需要区分的类别数,p(y=c|x;θ)表示输出的预测标签为c的概率,最终组成一个概率输出向量。
[0133]
步骤4.3、利用交叉熵损失函数作为整个模型的损失函数.
[0134]
交叉熵函数作为分类问题中常用的损失函数,能有效地度量期望输出与实际输出的差别,具体公式为:
[0135][0136]
其中,l(f(x(i);θ),y(i))为损失函数,n为样本数量,y(i)表示第i个样本的真实标签向量,f(x(i);θ)表示的是第i个样本实际预测向量。
[0137]
步骤5:基于adam优化器的模型训练过程。
[0138]
通过最小化误差函数来修正特征组合网络的连接权重,用adam和反向传播算法对整个网络的连接权重进行训练。将训练好的模型对待测样本进行诊断,得到最终的诊断结果。
[0139]
adam优化器对超参数的选择具有较强的鲁棒性,在当前的深度学习中被普遍的应用。本发明中的adam算法是通过结合交叉熵l(f(x(i);θ),y(i))对各个权重θ进行梯度求导,得到权重变化值,引入一阶矩变量s、二阶矩变量r与时间步t=0,具体的梯度更新步骤如下:
[0140]
步骤5.1、计算梯度大小,公式如下:
[0141][0142]
步骤5.2、更新时间步:
[0143]
t

t+1。
[0144]
步骤5.3、更新有偏一阶矩估计:
[0145]s←
ρ1s+(1-ρ1)g
[0146]
其中,ρ1是一阶矩估计的指数衰减速率。
[0147]
步骤5.4、更新有偏二阶矩估计:
[0148]r←
ρ2r+(1-ρ2)g
⊙g[0149]
其中,ρ2是二阶矩估计的指数衰减速率。
[0150]
步骤5.5、修正一阶矩的偏差:
[0151][0152]
步骤5.6、修正二阶矩的偏差:
[0153][0154]
步骤5.7、计算权重更新增量,具体公式如下:
[0155][0156]
其中,ε是全局学习率,δ是用于数值稳定的小常数。
[0157]
步骤5.8、通过δθ更新权重θ的值
[0158]
θ

θ+δθ。
[0159]
进行训练优化后的多感受域图卷积网络模型即可用于诊断集进行故障诊断,具体为将图结构数据输入到网络中,对得到的训练集样本的概率向量进行分析,若对应某一故障的概率值最大并接近于1,表明样本属于该故障的可能性最大。
[0160]
图4是本发明提供的一种基于多感受域gcn深度学习模型的水电机组故障诊断系统结构图。如图4所示,所述系统包括:训练数据处理模块、图结构数据生成模块、神经网络模型训练模块、重构特征向量生成模块和故障概率计算模块,上述各模块依次相连,具体地:
[0161]
训练数据处理模块,用于获取数据集,并从数据集中抽取m组数据块,提取数据特征,划分模型训练集、验证集与测试集;
[0162]
图结构数据生成模块,用于计算样本之间的相关性,结合数据特征构建图结构数据,作为多感受域图卷积网络模型的训练数据;
[0163]
神经网络模型训练模块,用于建立多感受域图卷积网络模型,并利用所述训练数据对多感受域图卷积网络模型进行训练,得到多感受域图卷积网络模型的连接权重;
[0164]
重构特征向量生成模块,用于根据由所述连接权重构成的多感受域图卷据网络模型,获取一组重构特征向量;
[0165]
故障概率计算模块,用于重构特征向量经过一层全连接的组合网络,得到特征的线性组合,并作为softmax分类器的输入,计算出表示每一种故障的出现可能性的概率。
[0166]
因水电机组故障实例较少,本发明采用同为旋转机械的滚动轴承振动数据进行实验,以佐证本发明的有效性。本发明进行10次重复性轴承故障诊断实验,本发明的方法与卷积神经网络、标准图卷积网络(gcn)、切比雪夫图卷积网络(chebgcn)与其他多感受域图卷积方法(mrf-gcn)进行比较,多次实验结果取平均值作为最终结果,如表2所示。
[0167]
表2
[0168][0169]
由表2中的结果可以看出,本发明所提的方法具有最高的精度,同时训练所花费的时间较少,比现有的多感受域图卷积方法耗时更短,具有明显的优势。
[0170]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1