本发明涉及数据中心冷水机组故障诊断,具体为基于半监督对抗变分自动编码的冷水机组未知故障诊断方法。
背景技术:
1、冷水机组是数据中心主要的能耗来源之一,冷水机组发生故障,将导致数据中心能耗增加,无法保障数据中心安全可靠的运行,因此,解决冷水机组的故障诊断问题是提高数据中心能效的重要挑战之一。
2、在实际应用中,冷水机组各个特征数据通过多个传感器收集,包含大量未标记数据和少量的标记数据,然而,标记数据的成本很高,数目较少,给冷水机组的故障诊断带来极大挑战。
3、因此,已有文献提出采用生成对抗网络(gan)训练样本从而增大故障数据,但生成合成数据样本分布与训练集中样本的分布相同,只能分出数据的真假,不能给出样本所属的类别,目前制冷机故障诊断领域最新关于gan的文献提出利用半监督gan从海量无标记数据中获得更多信息从而进行冷水机组故障诊断方法,然而,该方法不能诊断冷水机组的未知故障,即未包含在训练数据集中的故障。
4、所以,本发明提出一种基于半监督对抗变分自动编码的冷水机组故障诊断方法,采用高斯混合变分自动编码器和生成对抗网络,充分利用标记数据和未标记数据中隐含的故障信息,能够诊断冷水机组的已知故障和可能的未知故障。
技术实现思路
1、针对现有技术的不足,本发明提供了基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,具备能够诊断冷水机组的已知故障和可能的未知故障等优点,解决了不能诊断冷水机组的未知故障的问题。
2、为实现上述能够诊断冷水机组的已知故障和可能的未知故障的目的,本发明提供如下技术方案:
3、基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,包括以下步骤:
4、s1:准备冷水机组真实数据的训练集,包含少量标记数据集、大量未标记数据集和gan生成器生成的假类样本数据集,其中,标记数据集包含多个已知故障标签,每个数据的故障类别标签唯一,未标记数据集中每个数据都没有标签;
5、s2:针对标记数据集,最小化其损失函数,即
6、;
7、其中,是第个标记的样本数据,是第个标记的样本数据的真实标签,是标记样本的数目。
8、s3:针对虚假生成的假类样本数据集,最小化假类数据集的损失函数:
9、;
10、其中,表示生成器;是虚假样本的数目,表示虚假生成的样本被鉴别器分配给第类的概率。
11、s4:针对未标记数据集的处理是本专利的核心部分。未标记数据集包含大量正常数据、少量属于已知故障但未标记数据和少量属于未知故障但未检测出的数据。由于冷水机组的数据不一定都是服从高斯分布,有可能是非高斯分布的,而基于高斯分布的标准变分自动编码器很难识别异常状态。因此,本专利采用高斯混合变分自动编码算法,在没有故障样本或先验知识的情况下,对冷水机组未标记的数据进行异常检测,并标记其中可能存在的未知故障,提高整体冷水机组故障诊断性能。将未标记数据集作为高斯混合变分自编码器的输入,输出异常数据集。将高斯混合变分自动编码器得到的异常数据集作为故障分类模型1的输入,并输出数据集;
12、(1)首先,编码器将输入映射到潜在空间中的高斯混合分布,假设高斯混合模型有个高斯分量,即
13、;
14、其中表示编码器,是编码器的参数,分别是第个高斯分量的权值、均值和方差,表示经过稠密层、扁平层和卷积层生成高斯分量的的转换过程。
15、采用重参数化方法生成一个服从第个高斯分量的随机变量,
16、;
17、其中,服从标准正态分布;由此可得到高斯混合后的潜在变量,后验分布可以写成
18、;
19、其中,是第个高斯分量的概率密度函数,是的后验分布。
20、(2)然后,将householder流应用于潜在变量以捕获更丰富的特征,分别计算householder向量、householder矩阵和随机变量
21、;
22、其中,是最终潜变量,作为解码器的输入,重构的似然函数,是第个householder向量,是householder矩阵,是一个单位矩阵。
23、(3)最后,将威布尔分布用作解码器输出的重构信号的似然函数,并作为异常判别的基础,并对异常数据进行标记,得到解码后形状参数;重建误差,其中是的数据长度,表示的第个点,是与相关的形状参数,是一个人为设置的常数,是的似然函数。
24、重建误差表示测量真实分布和重构分布之间的差异,也是异常数据的得分值。当样本的异常得分越高,说明模型不能很好地重构样本分布,异常的概率越高,对异常数据进行不同数值的标记,表示不确定的故障标签,其中包含已知故障标签和可能存在的未知故障标签。
25、最终,高斯混合变分自动编码器的最小化损失函数为
26、;
27、(4)将高斯混合变分自动编码器得到的异常数据集作为故障分类模型1的输入,并输出数据集。故障分类模型1能够鉴别出异常数据集中属于已知故障的数据,并更新已知故障的标签;此外,故障分类模型1能够鉴别出异常数据集中可能存在的未知故障数据,并标记表示不同故障的标签;
28、s5:将、和虚假生成的数据集作为鉴别器的输入,训练一个精准的冷水机组故障诊断的鉴别器,鉴别器将样本分配给第类的概率可以表示为,其中是预测标签,是第类的标签,鉴别器的参数根据相应的损失函数通过梯度下降来更新;
29、;
30、其中,是鉴别器的参数,表示根据各个部分(标记、虚假、高斯混合变分自动编码)的损失函数,通过梯度下降来更新鉴别器的参数;
31、s6:将训练好的鉴别器作为冷水机组故障分类模型,实时输入冷水机组数据,进行样本分类。
32、优选的,所述步骤s4未标记数据集包含大量未标记正常数据和少量未标记故障数据,未标记正常数据数目远远超过未标记故障数据的数目,而未标记故障数据通常包含真正诊断意义的类别信息。这种少量的未标记的故障数据更值得关注和研究,因此,通过高斯混合变分自动编码器检测未标记数据集中的异常数据,并通过一个故障分类模型1鉴别出异常数据集中属于已知故障的数据,并更新已知故障的标签,同时鉴别出异常数据集中可能存在的未知故障数据,并给出表示不同故障的标签。
33、与现有技术相比,本发明提供了基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,具备以下有益效果:
34、1、该基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,通过利用生成对抗网络联合训练标记数据、未标记数据和假生成样本数据,有效利用未标记数据集的未知故障分布信息;
35、2、该基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,通过高斯混合变分自编码器,从未标记数据中检测得到可能属于未知故障的异常数据,增大冷水机组故障种类数目,从而增强鉴别器的分类能力,识别更多可能的未知故障。
1.基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,其特征在于:所述步骤s4未标记数据集
3.根据权利要求1所述的基于半监督对抗变分自动编码的冷水机组未知故障诊断方法,其特征在于:未标记数据集包含大量正常数据、少量属于已知故障但未标记数据和少量属于未知故障但未检测出的数据,由于冷水机组的数据不一定都是服从高斯分布,有可能是非高斯分布的,而基于高斯分布的标准变分自动编码器很难识别异常状态,因此,将未标记数据集作为高斯混合变分自动编码器的输入,得到k个高斯分量的均值和方差,同时引入服从正态分布的随机值,从而得到一个高斯混合后的潜在变量;然后将householder流应用于潜在变量以捕获更丰富的特征,将威布尔分布用作解码器输出的重构信号的似然函数,作为异常判别的基础,并对异常数据进行标记。