基于深度子域适配迁移网络的风力发电机系统故障诊断方法

文档序号:25607419发布日期:2021-06-25 14:08阅读:165来源:国知局
基于深度子域适配迁移网络的风力发电机系统故障诊断方法

1.本发明应用于风力发电机系统的故障诊断,涉及不同风力发电机系统故障诊断之间的迁移学习方法。


背景技术:

2.随着全球能源危机与环境污染等问题的日益加剧,新能源的开发和利用受到世界各国的广泛关注。风力资源作为一种清洁无污染的可再生新能源,自然受到了国内外的重视。
3.风力发电机系统往往安装在偏远山区、海滨、居民分散的无电或少电地区,那里风力资源往往比较丰富。风力发电机系统的安装地点环境通常十分恶劣,经常会遇到如:狂风、暴雨、海水侵蚀等情况,因此风力发电机系统很容易遭受故障。受这些安装位置恶劣环境的制约,单纯的靠人力去定期检修维护是不现实的。一个明智的方法是设计一个实时监控系统,通过大量传感器对风力发电机当前的状态进行监控,使用算法自动分析风力发电机运行是否异常,等到风力发电机出现异常或者故障时自动停止风力发电机运行,同时派出人工检修。
4.通过大量地采集传感器数据并进行标注,用标注的数据进行深度神经网络的训练来对风力发电机系统进行故障诊断是一个可行的方法。然而这种方法需要大量的标记数据,现实中常常遇到的通常是少标签、或无标签的情况。因此有必要从已知系统中学习有用知识并进行迁移。


技术实现要素:

5.为了克服风力发电机系统故障诊断时少标签、无标签问题,本发明提出一种基于深度子域适配迁移的风力发电机系统的故障诊断方法。通过学习已知风力发电机系统的知识来对待迁移的风力发电机系统进行故障诊断。
6.本发明解决其技术问题所采用的技术方案是:
7.一种基于深度子域适配迁移的风力发电机系统的故障诊断方法,所述方法包括以下步骤:
8.1)对源系统和目标系统的原始多通道振动数据进行采样,以便于深度神经网络的输入;
9.2)搭建深度神经网络,包括由卷积网络组成的特征提取器,由全连接网络组成的分类器,以及域适应网络;
10.3)把源系统的数据和标签以及目标系统的数据同时喂入神经网络中进行训练,训练过程中保证源系统的分类错误减小的同时也让源系统数据和目标系统数据每一个子域的距离减小;
11.4)用训练好的神经网络来进行故障诊断。
12.进一步,所述步骤2)中,卷积网络依次为
13.卷积层一、批归一化层一、dropout层、池化层一、激活层一、
14.卷积层二、批归一化层二、dropout层、池化层二、激活层二、
15.卷积层三、批归一化层三、dropout层、池化层三、激活层三、
16.卷积层四、批归一化层四、dropout层、池化层四、激活层四;
17.卷积层可以用数学公式表述为:
[0018][0019]
式中,x

表示卷积操作输出值,n表示输入数据的通道数,

表示一维卷积运算,k
j
表示卷积核参数,表示卷积操作的区域,i表是卷积的起点,h表示是卷积区域的长度,b是偏差;
[0020]
批归一化层可由以下数学公式表示
[0021][0022][0023][0024][0025]
其中x
n
和y
n
分别代表小批量的输入和输出特征;h是批次大小;∈是一个极小值,其作用是防止分母为零。γ和β是两个可训练的参数,用于缩放和移动分布;
[0026]
dropout层通过在神经网络训练时,以一定概率移除神经元来防止神经网络出现过拟合;
[0027]
池化层通过下采样来降低特征维度,去除冗余信息,对特征进行进一步压缩,简化网络复杂度。池化层可由下面式子表示:
[0028][0029]
其中,x
i
表示区域中指定神经元的活动值,是池化层输出值;
[0030]
激活层:
[0031][0032]
其作用是增强神经网络的非线性能力;
[0033]
分类器和域适应网络都是由全连接层组成的;
[0034]
再进一步,所述步骤3)中,总体损失函数为分类损失和子域距离损失只和:
[0035]
loss=l
c
+λl
d
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0036]
其中λ是可调参数,用于控制域损失的权重。l
c
为分类损失,l
d
为子域距离损失;
[0037]
分类损失可以由交叉熵函数计算:
[0038][0039]
其中y
*
是真实标签,是softmax层输出的概率;
[0040]
源域和目标域之间的距离可以由下面式子表示:
[0041][0042]
其中φ(
·
)是映射,用于将原始变量映射到再生核希尔伯特空间中;
[0043]
使用真实值来估计两个分布的距离,可以将上述公式的平方简化为:
[0044][0045]
其中是的无偏估计量,k(
·

·
)=<φ(
·
),φ(
·
)>表示向量的内积;
[0046]
考虑到整体的分布会影响局部类的判别,因此可以计算每个子域的距离,通过减少每个子域的距离来减小域分布之间的距离:
[0047][0048]
其中p
(c)
是子类的分布。经过神经网络预测后,假设每个样本根据权重w
c
属于每个类别,则上述公式的无偏估计表示为:
[0049][0050]
其中和分别表示和属于类别c的概率权重并且
[0051]
可以计算为:
[0052][0053]
在源域中,可以直接使用实标签的onehot向量来计算但是目标域中没有标签,权重无法直接计算,但是我们可以使用神经网络的输出来计算权重这样我们就可以计算每个样本的权重。距离可以进一步计算为:
[0054][0055]
其中z
l
是第l层激活函数输出;
[0056]
仅使用单个内核空间来计算lmmd距离将使最终的训练效果不佳。在这种情况下,可以使用多个内核空间(mk

lmmd)来计算lmmd距离;
[0057][0058]
其中β为每个核函数取的权值。
[0059]
与现有技术相比,本发明的有益效果在于:针对风力发电机系统故障诊断时少标签或无标签问题,设计了一种基于深度子域适配迁移网络的风力发电机系统的故障诊断方法,利用已知系统的知识迁移到待诊断的系统上进行学习。具体而言,把源域带标签数据和目标域无标签的数据同时进行神经网络训练,在减小源域分类损失的同时减小源域和目标域子域距离损失,这样源域和目标域经过特征转换后的域距离将会拉近,从而实现迁移的目的。
附图说明
[0060]
图1为信号采样示意图。
[0061]
图2为深度神经网络结构图。
[0062]
图3为实验风机参数。
[0063]
图4为原始振动数据。
[0064]
图5为迁移学习效果对比图。
[0065]
具体实施方式是
[0066]
为使本发明的实施例的目的、设计思路、技术方案更加清晰,下面结合附图对本发明做进一步说明。
[0067]
参照图1~图5,一种基于深度子域适配迁移网络的风力发电机系统的故障诊断方法,所述方法包括以下步骤:
[0068]
1)原始信号如图1所示,对源系统和目标系统的原始多通道振动数据进行采样,以便于深度神经网络的输入;
[0069]
2)搭建神经网络结构如图2所示:包括由卷积网络组成的特征提取器,有全连接网络组成的分类器,以及域适应网络;
[0070]
卷积网络依次为:
[0071]
卷积层一、批归一化层一、dropout层、池化层一、激活层一、
[0072]
卷积层二、批归一化层二、dropout层、池化层二、激活层二、
[0073]
卷积层三、批归一化层三、dropout层、池化层三、激活层三、
[0074]
卷积层四、批归一化层四、dropout层、池化层四、激活层四;
[0075]
卷积层用数学公式表述为:
[0076][0077]
式中,x

表示卷积操作输出值,n表示输入数据的通道数,

表示一维卷积运算,k
j
表示卷积核参数,表示卷积操作的区域,i表是卷积的起点,h表示是卷积区域的长度,b是偏差;
[0078]
批归一化层由以下数学公式表示:
[0079][0080][0081][0082][0083]
其中x
n
和y
n
分别代表小批量的输入和输出特征,h是批次大小,∈是一个极小值,其作用是防止分母为零,γ和β是两个可训练的参数,用于缩放和移动分布;
[0084]
dropout层通过在神经网络训练时,以一定概率移除神经元来防止神经网络出现过拟合;
[0085]
池化层通过下采样来降低特征维度,去除冗余信息,对特征进行进一步压缩,简化网络复杂度;池化层由下面式子表示:
[0086][0087]
其中,x
i
表示区域中指定神经元的活动值,是池化层输出值;
[0088]
激活层:
[0089][0090]
其作用是增强神经网络的非线性能力;
[0091]
分类器和域适应网络都是由全连接层组成的;
[0092]
3)把源系统的数据和标签以及目标系统的数据同时喂入神经网络中进行训练,训练过程中保证源系统的分类错误减小的同时也让源系统数据和目标系统数据每一个子域的距离减小;
[0093]
总体损失函数为分类损失和子域距离损失之和:
[0094]
loss=l
c
+λl
d
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0095]
其中λ是可调参数,用于控制域损失的权重。l
c
为分类损失,l
d
为子域距离损失;
[0096]
分类损失由交叉熵函数计算:
[0097][0098]
其中y
*
是真实标签,是softmax层输出的概率;
[0099]
源域和目标域之间的距离由下面式子表示:
[0100][0101]
其中φ(
·
)是映射,用于将原始变量映射到再生核希尔伯特空间中;
[0102]
使用真实值来估计两个分布的距离,将上述公式的平方简化为:
[0103][0104]
其中是的无偏估计量,k(
·

·
)=<φ(
·
),φ(
·
)>表示向量的内积;
[0105]
考虑到整体的分布会影响局部类的判别,因此可以计算每个子域的距离,通过减少每个子域的距离来减小域分布之间的距离:
[0106][0107]
其中p
(c)
是子类的分布,经过神经网络预测后,假设每个样本根据权重w
c
属于每个类别,则上述公式的无偏估计表示为:
[0108][0109]
其中和分别表示和属于类别c的概率权重并且
[0110]
计算为:
[0111][0112]
在源域中,可以直接使用实标签的onehot向量来计算但是目标域中没有标签,权重无法直接计算,但是可以使用神经网络的输出来计算权重这样就可以计算每个样本的权重;距离以进一步计算为:
[0113][0114]
其中z
l
是第l层激活函数输出;
[0115]
仅使用单个内核空间来计算lmmd距离将使最终的训练效果不佳,在这种情况下,使用多个内核空间(mk

lmmd)来计算lmmd距离。
[0116][0117]
其中β为每个核函数取的权值;
[0118]
4)用训练好的神经网络来进行故障诊断。
[0119]
为验证所提方法的有效性,本发明在真实风力发电机系统数据上进行验证。实验所用数据来自四个不同的风力发电机系统a、b、c、d,风力发电机系统的具体参数如图3所示,四个风力发电机系统比较相似,但是参数各不相同。实验采用的数据包含正常运行信号和13种故障信号,部分信号如图4所示:a,正常;b,高速轴窜轴;c,高速轴轴承的点蚀;d,行星齿轮点蚀;e,中间齿轮磨损;f,中间齿轮点蚀;g,行星齿轮磨损;h,高速轴齿轮点蚀;i,双重故障;j,高速轴齿轮磨损;k,太阳轮磨损。
[0120]
搭建如图2所示神经网络,卷积核大小分别为16
×3×1×
33,32
×
16
×1×
17,64
×
32
×1×
9,50
×
64
×1×
5,池化层大小都为1
×
2步距为2。特征提取器输出为50
×
64,展平后为大小1
×
3200.全连接层神经元依次为100、14,最后softmax输出。
[0121]
对信号进行采样后喂给神经网络进行训练,两两系统之间进行迁移训练,最后对精确率曲线对比如图5所示,虚线为单独训练已知系统网络在待迁移数据集上对精确率,实线为所提方法正确率,可以看出迁移之后的正确率普遍比迁移前的高,算法的有效性得以验证。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1