本发明属于汽轮机故障诊断领域,具体涉及一种基于深度迁移模型的跨领域汽轮机故障诊断方法。
背景技术:
1、汽轮机是一种以高温高压蒸汽作为动力,将蒸汽内能转换为机械能的动力装置,被广泛应用于电站、船舶、工业等领域。近年来,随着科技的进步与发展,汽轮机也向着大型化、高速化、新型化、自动化等方向发展,与此同时汽轮机的复杂程度也越来越高,故障频发,给企业带来严重安全隐患和巨大经济损失。
2、随着大数据概念的不断发展,很多汽轮机故障诊断模型应运而生,但大部分模型都只适用于拥有充分标注数据的领域,而对于大型船舶领域、新研汽轮机应用领域等历史数据较少、不易获得标注样本的情况,一直亟待解决,因此寻找到有效的跨领域汽轮机故障诊断方法,提高准确率,具有非常重要的理论意义与研究价值。
3、目前汽轮机故障诊断方法大多针对标注数据充分的情况,不能有效解决标注数据稀缺甚至没有标注数据的问题,传统浅层模型不能很好拟合数据,深层模型虽然能提取抽象特征提高分类精度,但对于某些特定领域构建的汽轮机故障诊断模型不具有泛化性,没有考虑跨领域数据间分布差异,不能很好迁移到与之相关但不完全相同的领域。
技术实现思路
1、本发明的目的在于提供一种基于深度迁移模型的跨领域汽轮机故障诊断方法,首先通过计算领域间分布差异权重合理选取大量标注数据作为训练样本集,然后构建深度网络模型以获取抽象特征,同时在特征层匹配数据分布提高模型的迁移能力,最后通过梯度下降法迭代更新模型参数,获得最终的深度迁移模型用于完成跨领域汽轮机故障诊断问题。
2、一种基于深度迁移模型的跨领域汽轮机故障诊断方法,包括如下步骤:
3、步骤1:给定s个经过标准化处理的具有大量标签数据的源领域汽轮机故障样本集,1个经过标准化处理的具有少量标签数据或者无标签数据的目标领域汽轮机故障样本集;
4、步骤2:计算第s个源领域样本与目标领域间的分布差异;
5、步骤3:计算分布差异权重;
6、步骤4:对s个源领域与目标领域的分布差异权重按照降序排列,从中选取部分与目标领域分布相近的源领域数据作为最终源领域训练样本集;
7、步骤5:构建f+1层深度神经网络,第一层为输入层,中间层为特征层,最后一层为分类层;
8、步骤6:初始化神经网络的权重和偏置向量;
9、步骤7:获取源领域训练样本和目标领域样本每个特征层的特征;
10、步骤8:根据源领域训练样本和目标领域样本在第f层的特征构建分布差异匹配项;
11、步骤9:根据源领域训练样本真实标签和分类预测标签构建分类器的损失函数项;
12、步骤10:获得权重和偏置的衰减项;
13、步骤11:根据步骤8-10获得整体目标函数;
14、步骤12:使用梯度下降反向传播算法优化网络权重和偏置;
15、步骤13:重复步骤7-12至最大迭代次数;
16、步骤14:将模型用于目标领域故障诊断,分类层最大概率所属标签即为预测故障标签。
17、进一步地,所述步骤1中第s个源领域样本集表示为
18、
19、目标领域样本集表示为
20、
21、其中:s∈{1,2,...,s}表示共有s个源领域,ns和nt分别表示第s个源领域和目标领域的样本数量,d(1)表示样本特征维度,分别表示第s个源领域的第i个样本及目标领域第j个样本,y={1,2,...,k}表示故障类别标签,每个样本的标签ysi,ytj∈y。
22、进一步地,所述步骤2中计算第s个源领域样本与目标领域间的分布差异方式如下:
23、
24、式中:h表示希尔伯特空间,φ(x)表示映射到希尔伯特空间函数,k(·,·)为核函数,本发明采用高斯核函数,即k(u,v)=exp(-||u-v||2)。
25、进一步地,所述步骤4中对s个源领域与目标领域的分布权重按照降序排列,如果s为偶数,则选取前s/2个源领域数据作为最终源领域训练样本集,如果s为奇数,则选取前(s+1)/2个源领域数据构建最终源领域训练样本集。最终源领域训练样本集表示为
26、
27、其中:nc表示源领域训练样本数量,d(1)表示源领域训练样本特征维度,表示源领域训练样本集中的第i个样本,每个样本的标签yci∈y。
28、进一步地,所述步骤7中获取源领域训练样本和目标领域样本第l+1特征层的特征
29、
30、式中:r∈{c,t},表示第l层和第l+1层的特征维数分别为d(l)和d(l+1),和b(l)∈rd(l+1)×1分别表示权重矩阵和偏置向量,f(·)为sigmoid激活函数,即
31、进一步地,所述步骤8中根据源领域训练样本和目标领域样本在第f层的特征构建分布差异匹配项如下
32、
33、进一步地,所述步骤9中根据源领域训练样本真实标签和分类预测标签构建softmax分类器损失函数项方法如下
34、步骤9.1:预估源领域训练样本所属各标签类别概率
35、
36、步骤9.2,根据源领域训练样实际标签和预估类别概率得到损失函数项
37、
38、式中:表示w(f)的第q行,q∈{1,2,...,k}表示第q个类别标签。
39、进一步地,所述步骤10权重衰减项为
40、
41、进一步地,所述步骤11获得的目标函数如下
42、
43、式中:γ和λ为常量系数。
44、进一步地,所述步骤12中使用梯度下降反向传播算法优化网络权重和偏置方法如下
45、
46、
47、
48、式中:η为常量学习速率。
49、本发明的有益效果在于:
50、(1)本发明对于有充分标注数据的源领域,通过计算源领域与目标领域的分布差异,选取与目标领域分布相近的源领域数据作为训练样本集训练模型,使训练数据更有效。
51、(2)本发明采用深度神经网络,能够有效挖掘数据抽象特征有助于提高分类效果,同时在特征层进一步匹配源领域训练样本与目标领域样本间的分布有助于提迁移能力。
52、(3)本发明充分利用拥有大量标注数据且与目标领域相关但不相同的源领域训练模型,得到的模型能够有效迁移到拥有少量标注数据或无标注数据的目标领域完成故障诊断,模型具有较好的泛化性。
1.一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤1中第s个源领域样本集表示为
3.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤2中计算第s个源领域样本与目标领域间的分布差异方式如下:
4.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤4中对s个源领域与目标领域的分布权重按照降序排列,如果s为偶数,则选取前s/2个源领域数据作为最终源领域训练样本集,如果s为奇数,则选取前(s+1)/2个源领域数据构建最终源领域训练样本集。最终源领域训练样本集表示为
5.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤7中获取源领域训练样本和目标领域样本第l+1特征层的特征
6.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤8中根据源领域训练样本和目标领域样本在第f层的特征构建分布差异匹配项如下
7.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤9中根据源领域训练样本真实标签和分类预测标签构建softmax分类器损失函数项方法如下
8.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤10权重衰减项为
9.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤11获得的目标函数如下
10.根据权利要求1所述的一种基于深度迁移模型的跨领域汽轮机故障诊断方法,其特征在于,所述步骤12中使用梯度下降反向传播算法优化网络权重和偏置方法如下