一种冷水机组故障诊断方法与流程

文档序号:17243776发布日期:2019-03-30 08:42阅读:261来源:国知局
一种冷水机组故障诊断方法与流程

本发明属于制冷领域,具体涉及一种基于pca-smote-svm算法的冷水机组故障诊断方法。



背景技术:

在现有的冷水机组故障诊断研究中,冷水机组与其故障诊断模型一一对应,一个故障模型只能诊断一台冷水机组,当诊断不同种类的冷水机组时,需要重新对新机组进行大量的故障模拟实验,训练新的诊断模型,皆耗费大量的资源与时间,不利于冷水机组故障诊断技术在实际应用中的推广。

当有一种高效的冷水机组某类机型的故障诊断模型时,在得到较少其他种类冷水机组故障实验样本,当新样本与原始样本混合组成新的训练样本集,此时原始模型的训练集和新型冷水机组故障样本集数量相差较大,形成了不平衡样本,会使得原始诊断模型对新型冷水机组故障诊断性能下降。



技术实现要素:

为了解决不平衡样本集问题,本发明采用合成少数类过采样技术,提供了一种基于pca-smote-svm算法的冷水机组故障诊断方法用于对不同种类的冷水机组进行故障诊断。

本发明提供了一种冷水机组故障诊断方法,具有这样的特征,包括以下步骤:

s1,对螺杆式冷水机组进行故障模拟实验并采集螺杆式冷水机组故障模拟实验数据,螺杆式冷水机组故障模拟实验数据包括正常数据与故障模拟数据,对离心式冷水机组进行故障模拟实验,采集离心式冷水机组故障模拟实验数据后组成第一训练集数据,离心式冷水机组故障模拟实验数据包括正常数据与故障模拟数据;

s2,对螺杆式冷水机组故障模拟实验数据经过稳态处理以及去除噪声处理后随机选择组成第二训练集数据和测试集数据;

s3,建立原始训练集数据,该原始训练集数据包括第一训练集数据和第二训练集数据;

s4,对原始训练集数据进行过采样处理后,得到不同过采样倍率的过采样训练样本集数据;

s5,采用svm模型对过采样训练样本集数据进行训练,得到诊断模型;

s6,把测试集放入诊断模型进行测试,得到不同冷水机组故障模型的诊断结果。

在本发明提供的冷水机组故障诊断方法中,其特征在于,还包括以下步骤:

s7,采用不同的评价方法对诊断模型进行评估,得到最佳的冷水机组不平衡采样时的最佳诊断模型。

另外,在本发明提供的冷水机组故障诊断方法中,还可以具有这样的特征:其中,螺杆式冷水机正常数据包括组蒸发器出水温度数据、冷凝器进水温度数据、滑阀位置数据和频率数据,螺杆式冷水机组故障模拟数据包括制冷剂泄漏数据、冷凝器水流量不足数据和制冷剂过充数据。

另外,在本发明提供的冷水机组故障诊断方法中,还可以具有这样的特征:其中,第一训练集数据包含正常状态、制冷剂泄露、冷凝器结垢、冷凝器水流量不足、冷凝器含不凝性气体、蒸发器水流量不足、制冷剂过充和润滑油过量各1000个样本数据。

另外,在本发明提供的冷水机组故障诊断方法中,还可以具有这样的特征:其中,svm模型的表达式为:

式中,sgn()为符号函数,k(x,xi)为选用rbf函数,即

式中:σ为径向基函数的宽度,σ越小,径向基函数的宽度越小,越有选择性,是径向基核参数,g越大,径向基函数越有选择性。x为判别样本;xi为训练样本,i为样本数目,为对偶问题的解,b*为阈值,n为样本总量。

发明的作用与效果

根据本发明所涉及的冷水机组故障诊断方法,采用合成少数类过采样技术,提供了一种基于pca-smote-svm算法的冷水机组故障诊断方法,能够对不同种类的冷水机组进行故障诊断,在冷水机组故障诊断技术的实际应用中具有广阔的应用前景。

附图说明

图1是本发明的实施例中采用smote过采样技术应用在冷水机组训练中的示意照片;

图2是本发明的实施例中归一化后的离心式冷水机组与螺杆式冷水机组训练样本集的三维示意图;

图3是本发明的实施例中过采样100%的离心式冷水机组与螺杆式冷水机组训练样本集三维示意图;

图4是本发明的实施例中不同过采样倍率时诊断模型整体诊断性能变化示意图;

图5是本发明的实施例中不同过采样倍率下各类故障sensitivity(查全率)值;

图6是本发明的实施例中不同过采样倍率下各类故障precision(查准率)值;以及

图7是本发明的实施例中不同过采样倍率下各类故障f-measure值。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本发明的冷水机组故障诊断方法作具体阐述。

实施例

本发明采用合成少数类过采样技术,提供了一种基于pca-smote-svm算法的冷水机组故障诊断方法用于对不同种类的冷水机组进行故障诊断。

对螺杆式冷水机组进行故障模拟实验并采集螺杆式冷水机组故障模拟实验数据,螺杆式冷水机组故障模拟实验数据包括正常数据与故障模拟数据。

对离心式冷水机组进行故障模拟实验,采集离心式冷水机组故障模拟实验数据后组成第一训练集数据,离心式冷水机组故障模拟实验数据包括正常数据与故障模拟数据。

故障模拟实验。螺杆式冷水机组故障模拟实验采用的是一台200冷吨的变频螺杆冷水机组,故障模拟实验分为正常数据的采集与故障模拟数据的采集,采用的工况参数为蒸发器出水温度、冷凝器进水温度、滑阀位置和频率。主要模拟故障为制冷剂泄漏、冷凝器水流量不足和制冷剂过充三种故障。离心式冷水机组故障数据为ashrae1043-rp数据,组成训练集1,包含正常状态、制冷剂泄露、冷凝器结垢、冷凝器水流量不足、冷凝器含不凝性气体、蒸发器水流量不足、制冷剂过充和润滑油过量各1000个样本数据。

1)故障类型

本实验数据由离心式冷水机组-1043rp和变频螺杆冷水机组故障模拟实验数据组成。诊断故障类型和缩略词见表1所示,螺杆冷水机组只模拟了冷凝器水流量不足、制冷剂泄漏/充注量不足、制冷剂充注过量三类故障,表格中带*显示。

表1七种典型故障

对螺杆式冷水机组故障模拟实验数据经过稳态处理以及去除噪声处理后随机选择组成第二训练集数据和测试集数据。

数据预处理。螺杆式冷水机组故障模拟实验数据需经过稳态处理、去除噪声处理后随机选择组成训练集2和测试集。训练集2中包含100个normal样本数据、100个refleak样本数据、100个reducf样本数据和100个refover样本数据;测试集包含1000个normal样本数据、1000个refleak样本数据、1000个reducf样本数据和1000个refover样本数据。

建立原始训练集数据,该原始训练集数据包括第一训练集数据和第二训练集数据。

对原始训练集数据进行过采样处理后,得到不同过采样倍率的过采样训练样本集数据。

采用pca-smote技术处理原始训练集数据。原始训练集数据由8000个离心式冷水机组样本和400个螺杆式冷水机组样本组成,样本不平衡率为5%。

2)过采样技术:pca-smote

smote对于由非启发式随机过采样方法引起的过拟合情况有显著的改善。smote方法的核心思想就是在少数类样本及其近邻样本之间插入随机生成的新样本,这样做可以增加少数类样本的个数进而改善数据集的类不平衡分布。实施例中pca-smote技术的主要步骤如下:

①首先利用主元分析法(pca)对所选17个特征参数(见表1)进行降维处理,主元贡献率选择为99%。

表1特征参数表

②计算离心式冷水机组样本集和螺杆式冷水机组样本集的不平衡率为5%,设计过采样倍率为10%、15%、20%和25%,给螺杆式冷水机组样本集找出n个同类的另邻近样本(n=100个、800个、1200个和1600个)。

表2原始训练集样本组成

③对螺杆式冷水机组样本集参照公式(1)合成新的样本。

s2osi=s2i+rand(s2ij-si)(1)

其中,s2i为螺杆式冷水机组原始样本集;s2ij表示s2i的第j个邻近样本,j=1,…,n;s2osi表示过采样后的螺杆式冷水机组样本集;rand表示0到1之间的一个随机数。将新生成的螺杆式冷水机组故障样本合并到离心式冷水机组样本集中,组成新的平衡后的冷水机组训练集。

为了能够在二维平面上表现pca-smote处理后的样本集,pca主元贡献率为99%。离心式冷水机组样本集和螺杆式冷水机组样本集经过pca处理后,进行smote过采样400%的处理,然后利用minmaxscaler进行归一化,通过公式(2)处理进行作图。

其中,si为原始样本;smin为样本集中最小样本;smax为样本集中最大样本;sstd为经过归一化后的样本。

计算离心式冷水机组和螺杆式冷水机组的不平衡比为5%(8000:400),设计过采样率为100%、200%、300%和400%(见表3)。对于螺杆式冷水机组的样本组,发现了n个类似的相邻样本(n=400、800、1200和1600)。

表3不同过采样倍率下的样本组成。

如图1所示,原始训练集og由8000个离心式冷水机组样本和400个螺杆冷水机组样本组成,不平衡率为5%。采用pca-smote过采样技术对s2样本集进行过采样,每次过采样100%,采样400个。使得s2样本集增大,s2-os100样本数为800个、s2-os200样本数为1200个、s2-os300样本数为1600个、s2-os400样本数为2000个。不平衡率分别为10%、15%、20%和25%。

进入pca-smote过采样技术,当过采样倍率为100%时,训练集1样本数不变;训练集2中每类样本各增加100个,总共增加400个,组成oversampling100%时的训练样本集,此时训练集样本不平衡率为10%。按照此规则采用pca-smote技术对训练样本进行过采样处理,过采样本倍率为200~400%。

图2是本发明的实施例中归一化后的离心式冷水机组与螺杆式冷水机组训练样本集的三维示意图,图中centrifugal为离心式冷水机组,screw为螺杆式冷水机组,normal为正常状态,refleak为制冷剂泄露故障,reducf冷凝器水流量不足故障,refover为制冷剂过充故障。

图3是本发明的实施例中过采样100%的离心式冷水机组与螺杆式冷水机组训练样本集三维示意图,图中centrifugal为离心式冷水机组,screw为螺杆式冷水机组,normal为正常状态,refleak为制冷剂泄露故障,reducf冷凝器水流量不足故障,refover为制冷剂过充故障。

如图2、3所示,离心式冷水机组样本都较为集中,螺杆式冷水机组样本分布较宽;经过pca-smote处理后可以看出,normal样本集过采样后都较为集中,样本重叠性高;refleak和refover样本集在部分区域过采样较多;reducf原始样本集广阔的分布在三维区域,进行pca-smote过采样技术后,在多个区域样本集增多。

采用svm模型对过采样训练样本集数据进行训练,利用交叉验证与网格搜索方法寻找svm模型中最优径向基核参数g,得到诊断模型。

训练svm模型。svm是一种建立在统计学习理论和结构风险最小化原则基础上的新型学习机器,它根据有限样本信息在模型的复杂性与学习能力之间寻求最佳折中,以获得最好的推广能力。svm模型采用最优决策函数式(3)

式中,sgn()为符号函数,k(x,xi)为选用rbf函数,即

式中:σ为径向基函数的宽度,σ越小,径向基函数的宽度越小,越有选择性。是径向基核参数,g越大,径向基函数越有选择性,x为判别样本;xi为训练样本,i为样本数目,为对偶问题的解,b*为阈值,n为样本总量。

被pca-smote过采样技术处理好的的训练集采用svm模型进行训练,svm模型利用交叉验证与网格搜索方法寻找径向基核参数g,以训练出最佳诊断模型。

冷水机组故障诊断,把测试集放入诊断模型进行测试,得到不同冷水机组故障模型的诊断结果。

采用不同的评价方法对诊断模型进行评估,得到最佳的冷水机组不平衡采样时的最佳诊断模型。

冷水机组故障诊断。把测试集放入训练好的模型进行测试,得到不同模型的诊断结果,采用不同的评价方法对诊断模型进行评估。整体正确率、g-mean值评价诊断模型的整体性能;precision值、sensitivity值和f-measure值评价冷水机组各类故障的诊断情况。对比不同过采样模型的性能,得到最佳的冷水机组不平衡采样时的诊断模型,用于在实际中进行推广。

评价标准

根据二分类混淆矩阵建立冷水机组多分类诊断的混淆矩阵,多分类混淆矩阵包含关于模型所做的实际和预测分类的信息。通常使用矩阵中的数据来评估这种诊断模型的性能。表4显示了多分类混淆矩阵信息。ta、tb、tc、td为诊断模型正确分类样本;fba为正常状态诊断为制冷剂泄漏故障,属于虚警;fab为制冷剂泄漏故障被诊断为正常状态,属于漏报;fcb为制冷剂泄漏故障诊断为冷凝器水流量不足故障,属于误报。混淆矩阵其他信息以此类推。

表4多分类混淆矩阵

本实施例采用正确率(accuracy)、g-mean值、查准率(precision)、查全率(sensitivity)、和f-measure值来评价各类模型的诊断性能。表5显示各评价标准公式。precision-a、sensitivity-a和f-measure-a分别代表正常状态的查准率、查全率和f-measure值。g-mean值表示的是少数类分类精度多数类分类精度的集合平均值,来衡量数据集整体的分类性能;而f-measure指标是一种综合考虑查全率和查准率的分类评价指标。

表5各评价方法公式

3)整体诊断标准

在评价整体性能中引入二分类中的马修斯相关系数(thematthewscorrelationcoefficientmcc),mcc在[-1,+1]范围内返回一个值,越靠近+1代表模型分类越佳,其计算公式如下:

从表6可以得出,五种模型的训练正确率都在94%左右,与测试正确率的差值较小,最小的为pca-smote300%-svm模型,差值为1.39%。最大为pca-smote100%-svm模型,仅为2.48%,可证明经过pca-smote过采样技术处理的svm模型的泛化能力依旧较佳。

测试正确率最高的为pca-smote100%-svm模型,从svm模型正确率95.90%提升到96.70%;过采样200%、300%、400%的3种模型的测试正确率均有提升,可见过采样技术能够使训练样本平衡率较低的情况下,保持较高的诊断正确率。

对于g-mean值,pca-smote100%-svm模型表现最佳,值为93.47%,较svm模型提升1.57%。g-mean值表示的是少数类分类精度多数类分类精度的集合平均值,来衡量数据集整体的分类性能。可见pca-smote-svm模型的整体诊断性能较佳,与svm模型相比,性能提升。

在mcc表现最佳的为pca-smote100%-svm模型,为0.8776,是所有模型中最接近1的,可见pca-smote100%-svm具有最佳的诊断性能。

综上,利用pca-smote过采样技术的svm诊断模型对两种类冷水机组进行故障诊断时,仍然保持较高性能,且在原始svm诊断模型上,性能均有所提升,pca-smote-svm模型泛化能力较强,模型推广性较佳,smote过采样技术能够很好的利用到冷水机组的故障诊断上来。

表6五种模型的整体诊断性能详表

如图4所示,原始svm模型的训练正确率、测试正确率、g-mean和mcc分别为93.62%、95.90%、91.90%和0.8505。经过pca-smote过采样技术后的svm诊断模型,诊断性能都有所提升。

训练正确率随着螺杆式冷水机组样本集过采样比例升高而升高,当螺杆式冷水机组样本集过采样达到300%时,训练正确率到达最高,为94.84%,但当过采样400%时,训练正确率略有下降。测试正确率在在过采样100%时达到最高,为96.70%,在过采样200%、300%和400%时,测试正确率略有下降,但都保持在96%以上,经过smote过采样技术后的svm诊断模型的鲁棒性较佳。

g-mean值在经过smote过采样技术后得到了较大改善,过采样100%时g-mean值提升最大,较svm模型提升1.57%,在过采样100%,g-mean值大幅下降,随着过采样提升到200%时,g-mean值又有所上升,并依然优于svm模型,过采样400%时,g-mean值又有所下降;mcc值变化趋势和g-mean值相同,过采样100%时,mcc值达到最佳,然后随着过采样本样本数的增加,明显降低,在过采样300%%时,再次提升,但是都优于svm模型。

综上,分析评价诊断模型整体性能的各项指标变化情况,得出pca-smote100%-svm模型为最佳诊断模型,泛化能力和鲁棒性较强,适合冷水机组的故障诊断,能够推广到其他同系类机组和不同机型的冷水机组上,均能够达到较佳的诊断性能。

各类故障诊断性能

图5、6、7中,normal为正常状态数据,refleak为制冷剂泄露,reducf冷凝器水流量不足,refover为制冷剂过充,oversamplingratio为过采样倍率,sensitivity为查全率,precision为查准率,f-measure值为一种统计量,是查准率(precision)和查全率(sensitivity)加权调和平均。

如图5、6、7所示,采用pca-smote过采样技术的诊断模型在各类故障上的查全率、查准率和f-measure值都较优于原始svm模型。

其中,sensitivity-normal最佳为pca-smote200%-svm模型,为95.30%,比svm模型增长2.8%;sensitivity-refleak和sensitivity-reducf五类模型表现性能相同;sensitivity-refover最佳为pca-smote100%-svm模型,值为96.20%较原始模型提升1.3%。

pca-smote100%-svm模型在precision-normal和precision-reducf表现较佳,尤其是precision-reducf,较svm模型提升2.34%;precision-refover表现最佳的为pca-smote200%-svm模型,从svm模型的98.75%提升至99.47%。refleak故障五种模型性能相同。

对于f-measure值,f-measure-reducf和f-measure-refover分别从svm模型的93.02%、96.79%提升至pca-smote100%-svm的94.33%和97.52%,是五种模型表现性能最佳模型;而f-measure-normal表现最佳的为pca-smote400%-svm模型,为97.29%,较svm模型提升1.34%。

综上,五种模型中,pca-smote100%-svm较佳,对normal、reducf和refover故障均有提升。在不平衡率达10%的情况下,螺杆式冷水机组样本数量极小的情况下依然具有较佳诊断性能,可见基于pca-smote-svm的故障诊断方法是切实可行的。由于训练集占主体部分的数据集为离心式冷水机组,小部分数据集为螺杆式冷水机组,pca-smote-svm模型依旧保持较高的诊断性能,可以证明该诊断模型能够用于不同类型的冷水机组,诊断模型的推广性得到了提升。

实施例的作用与效果

根据本实施例所涉及的冷水机组故障诊断方法,采用合成少数类过采样技术,提供了一种基于pca-smote-svm算法的冷水机组故障诊断方法,能够对不同种类的冷水机组进行故障诊断,在冷水机组故障诊断技术的实际应用中具有广阔的应用前景。

上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1