一种基于Stacking模型的滤芯更换周期预测方法及系统

文档序号:36812483发布日期:2024-01-26 16:15阅读:15来源:国知局
一种基于Stacking模型的滤芯更换周期预测方法及系统

本发明涉及锅炉给水装置的滤芯更换周期预测,尤指基于stacking集成模型的滤芯更换周期预测方法及系统,能够根据水质数据和装置工况实现滤芯更换周期的精准预测,从而提高滤芯更换契机的准确性。


背景技术:

1、工业用水的安全、稳定和可靠性是众多企业所关注的—项重要问题,而水质过滤装置则是有效的解决方法。现有工业给水装置多采用过滤介质(滤芯)实现水中的污染物、杂质和悬浮物等物质的去除。工业给水装置需要持续更换滤芯才能保证良好的运行状态。水质状况越差,滤芯损耗速度越大,滤芯寿命越短。滤芯的性能随其使用情况变化,如果得不到及时的清理和更换,会严重地影响水的通过效率和过滤效果。

2、尤其是对于锅炉系统来说,滤芯是维护频次最多的产品,维护方式有两种:一是清洗滤芯元件,二是更换滤芯元件。其中更换滤芯元件一直为主流方向。在实际生产中,如帕莱顿公司采用的工业给水装置即为一体式滤芯,结构简单,更换方便。市面上滤芯寿命多以月为单位,如pp棉滤芯、活性炭滤芯和离子交换树脂滤芯,周期都在6个月左右,何时更换滤芯主要依靠经验估计,这也往往会导致滤芯未能及时更换,形成水垢影响设备效率,提前更换浪费滤芯寿命等问题。


技术实现思路

1、针对上述问题,本文设计了一种基于stacking模型的滤芯更换周期预测方法及系统,可实现滤芯更换周期的精准预测,节约成本,提高效率,避免人为产生的诸多问题。虽然国内关于滤芯寿命的预测研究较多,如姚猛的一种滤芯寿命的预测方法、系统、电子设备及介质,根据实际流阻值、实际的原始流阻值与实际的终了流阻值,计算车载滤芯剩余寿命;黄洁仪的一种滤芯更换检测方法、装置、净水设备及存储介质,根据滤芯的制水参数判断是否更换滤芯;蒋敏的一种净水机滤芯寿命检测的系统及方法,通过对比滤芯制水流量得到精确的滤芯寿命,但大多都集中于净水器,对于工业给水装置滤芯的探索较少,尤其是利用改进樽海鞘issa算法和stacking模型进行滤芯更换周期预测。

2、发明目的:针对滤芯更换周期难以精准确定的问题,提出了一种基于stacking模型的滤芯更换周期预测方法及系统,相比于传统机器学习方法精度不足、深度学习方法训练速度慢等问题,该方法采用了基于stacking的模型融合策略,吸收了rf、xgboost、lstm各自的优点,并在传统stacking策略的基础上对模型融合过程进行优化,采用了8折交叉验证的方法在提高模型预测精度的同时,加快了模型的训练速度。

3、技术方案:本发明公开了一种基于stacking模型的滤芯更换周期预测方法及系统,包括以下步骤:

4、s1、获取锅炉给水装置的水质数据、工作时间、历史给水量数据;

5、s2、对数据进行预处理,按设定比例划分训练集(train_data)和测试集(test_data);

6、s3、建立滤芯更换周期软测量集成模型,选取随机森林rf、极限梯度提升xgboost、长短期记忆网络lstm作stacking集成模型中第一层的基学习器,将预处理后的数据作基学习器原始输入,并通过8折交叉验证方法获得输出;

7、s4、第二层的元学习器选用极限学习机elm,将第一层基学习器的结果作第二层元学习器的输入;

8、s5、采用改进的樽海鞘算法issa对学习器的模型参数进行全局寻优,所述改进的樽海鞘算法包括:采用tent混沌映射方法进行种群初始化;在樽海鞘领导者位置更新中,引入logistic映射策略和自适应惯性权重;在追随者位置更新中,根据适应度值引入新权重;

9、s6、利用优化后的极限学习机elm进行预测,得到最终预测结果。

10、进一步地,所述步骤s1中的数据主要包括:锅炉给水装置的水质数据、工作时间、历史给水量数据,其中水质数据包括tds值、悬浮物浓度ss、水质硬度,分别通过tds传感器、ss传感器和水质硬度传感器测得,给水量通过流量传感器检测。

11、进一步地,所述步骤s2中对数据的预处理,具体步骤为:

12、s2.1根据公式(1)将采集的数据规范到[0,1]区间,即归一化处理:

13、

14、其中,xi为历史数据,xmin为历史数据样本中最小值,xmax为历史数据样本中的最大值,x为处理过后的数据样本,归一化范围为[0,1];

15、s2.2按4:1的设定比例划分训练集(train_data)和测试集(test_data),即前80%归一化后的样本数据作训练集(train_data),剩余20%归一化后的样本数据作测试集(test_data)。

16、进一步地,所述步骤s3中,建立滤芯更换周期软测量集成模型,选取第一层的三个基学习器,将预处理后的数据作基学习器原始输入,并通过8折交叉验证方法获得输出,具体步骤如为:

17、s3.1分别创建随机森林rf、极限梯度提升xgboost、长短期记忆网络lstm共三个基学习器,采用8折交叉验证的方法,将训练集(train_data)集随机打乱并均分成8等份(train_data_i,i=1,2,3,…,8),即train_data_1、train_data_2、train_data_3、train_data_4、…、train_data_8,其中7份作为基学习器的训练集(train_data),1份作为基学习器的验证集(train_val);

18、s3.2分别对三个基学习器进行8轮迭代训练。当进行第i轮训练时,使用train_data_i之外的训练集数据对三个基学习器进行学习训练,并利用训练好的三个基学习器分别对train_data_i进行预测,得到预测结果yi;8轮迭代后,将每轮迭代获得的y1、y2、y3、y4、…、yi、…、y8结合作为新训练集(new_train_data),测试集(test_data)进行和训练集相同的8折交叉验证得到新测试集(new_test_data);

19、s3.3确定随机森林模型的输入和输出,建立随机森林rf预测模型作为第一个基学习器;

20、s3.4建立极限梯度提升xgboost预测模型,具体步骤如下:

21、s3.4.1设训练集train={(x1,y1),(x2,y2),…,(xn,yn)},损失函数正则化项ω(fk),则目标函数可记为:

22、

23、式中,l(φ)是线性空间上的表示,i表示第i个样本,k是第k棵树,是第i个样本xi的预测值;

24、s3.4.2在现有树的基础上,不断的添加树,进行特征分裂来生长一棵树,利用每一棵树的预测结果去拟合上一棵树的预测结果与真实值之间的残差:

25、

26、

27、

28、......

29、

30、s3.4.3在数值上,第t棵树的预测结果等于前面t-1棵树的预测结果与第t棵树的表现之和,则对于第t棵树,目标函数可更新为:

31、

32、s3.4.4将上式用泰勒展开式来近似原来的目标函数,将ft(xi)看作δx,令则上式可化为:

33、

34、s3.4.5令ij={i|q(xi)=j}表示第j个叶子节点上的样本,求得目标函数的最优解:

35、

36、s3.4.6算出增益值gain,更新最大增益gain_max,更新分隔点,最终得到最优的分隔点,重复上述过程递归简述直到满足终止条件。

37、s3.5根据以下公式建立长短期记忆网络lstm预测模型:

38、ft=σ(wfxxt+wfhht-1+bf)  (7)

39、it=σ(wixxt+wihht-1+bi)  (8)

40、ot=σ(woxxt+wohht-1+bo)  (9)

41、

42、其中,xt表示时刻输入数据,ht-1表示上一时刻lstm单元输出值,ct-1表示上一时刻记忆单元值,ct表示t时刻记忆单元值;w*为权重系数(例如wix表示对应输入数据和输入门之间的权值);b*为偏置向量(例如bi为输入门的偏置向量)。σ为sigmoid函数,取值为[0,1],当取0值时表示门控关闭,取1值时表示门控打开,其公式如式:

43、c't=tanh(wxcxt+whcht+bc)  (11)

44、ct=ftct-1+itc't  (12)

45、

46、其中,c't表示当前候选记忆单元值,计算当前时刻记忆单元状态值ct的迭代公式如式(6)所示,tanh为双曲正切激活函数;wxc为对应输入数据和记忆单元之间的权值,whc为隐藏层和记忆单元之间的权值。

47、设有n(n>0)维输入x1,x2,…,xn;m(m>0)维网络的隐层状态序列h1,h2,...,hm;k(k>0)维输出序列y1,y2,…,yk;yk是t时刻lstm单元的输出,计算公式如下所示:

48、yt=ottanh(ct)  (14)

49、进一步地,所述步骤s4中,建立滤芯更换周期软测量集成模型,确定极限学习机elm为元学习器,并将s3.2中的新训练集(new_train_data)和新测试集(new_test_data)作为元学习器的输入。

50、进一步地,所述步骤s5中,采用改进的樽海鞘算法issa对学习器的模型参数进行全局寻优,所述改进的樽海鞘算法具体改进如下:

51、s5.1樽海鞘算法原理:ssa算法模拟了樽海鞘链的链式群体行为,与其他生物种群算法对比,樽海鞘群体中领导者对群体的影响力不高,受其“链”式结构的影响,领导者只直接影响紧挨着自己之后的跟随者位置的更新,对于后面跟随者的影响力则逐层递减,这也促使靠后的跟随者在运动过程中拥有了一定的多样性。该算法的数学模型为:

52、s5.1.1随机初始化樽海鞘群体在不同维度空间位置为:

53、

54、式中,n为樽海鞘群体个数,d为搜索空间的维度,i=1,2,...,n,j=1,2,...,d;表示樽海鞘i在第j维搜索空间中的位置;ubj、lbj分别为搜索空间j的上、下边界;

55、s5.1.2在樽海鞘搜索食物的过程中,最终的食物源位置为樽海鞘群体所搜寻的最优位置,其中领导者的位置更新表达式为:

56、

57、式中,表示第一个樽海鞘(领导者)在j维空间中的位置,fj为食物在j维空间的位置;c2、c3是在[0,1]区间内均匀分布的随机数,用来增强的随机性,提高链群的全局搜索和个体多样性,c1是ssa算法中重要的收敛因子,用于平衡全局探索和局部开发,其表达公式如下:

58、

59、式中,t是当前迭代次数;t是最大的迭代次数;

60、s5.1.3在樽海鞘链移动和觅食的过程中,追随者通过前后个体间的彼此影响,呈链状依次前进;跟随者樽海鞘的位置更新公式为:

61、

62、式中,i≥2,分别表示是第j维中更新后的第i个追随者的位置和更新前追随者的位置。

63、s5.2虽然樽海鞘算法能够做到全局探索和局部开发相对程度的平衡,但依旧存在估计精度不够高、易早熟收敛速度慢、容易陷入局部最优等问题。为了改进樽海鞘算法,提高其寻优性能,采用tent混沌映射方法进行种群初始化,丰富初始种群的多样性;在樽海鞘领导者位置更新中,引入logistic映射策略和自适应惯性权重,提高全局探索的能力,从而提高算法的寻优精度;在追随者位置更新中,根据适应度值引入新权重,提高局部开发的能力、加快算法的收敛速度。

64、s5.3采用tent混沌映射进行初始化。智能算法在生成初始种群时,通常使用随机初始化。这种随机初始化使得种群在搜索空间中随机分布,提高了算法寻找最优解的难度。相比于随机初始化,tent混沌映射则具有遍历性和规律性等特点,能够使算法的初始种群均匀分布在搜索空间中,提高算法的寻优精度。tent映射的数学表达式如下:

65、

66、式中,r表示[0,1]之间的随机数;k表示混沌迭代次数,k∈[0,k];表示混沌迭代开始前樽海鞘个体i在第j维空间对应的位置,混沌迭代结束后的位置为故而可模拟出樽海鞘群的运动轨迹,具体如下式所示:

67、

68、s5.4在领导者位置处采用logistic映射策略与自适应惯性权重策略,增强算法跳出局部最优的能力,提高全局探索的能力和寻优精度,故领导者位置公式的更新过程如下:

69、s5.4.1先引入logistic混沌映射策略,生成混沌序列:

70、ch(t+1)=β·ch(t)·(1-ch(t))  (21)

71、式中,ch为[0,1]间的混沌值,迭代初始时的混沌初值ch0在每次独立运行过程中随机生成,但不可取值为0、0.25、0.5、0.75和1;β作为控制参数,控制混沌值的行为;

72、s5.4.2再引入自适应惯性权重,权重w1可以描述为:

73、

74、式中,t表示当前迭代次数;t是设置的种群最大迭代次数;wmax为权值的最大值,wmin为权值的最小值;

75、s5.4.3基于logistic混沌映射策略与自适应惯性权重策略,领导者位置的最新公式如下:

76、

77、logistic混沌映射策略与自适应惯性权重的引入,可解决ssa仅根据食物位置进行更新、全局探索能力差的问题;其中,自适应惯性权重在搜索前期较大,可增强全局搜索能力,搜索后期较小,可增强局部寻优能力。

78、s5.5在追随者位置更新中,根据适应度值引入新权重w2,提高局部开发的能力、加快算法的收敛速度,故追随者位置公式的更新过程如下:

79、

80、式中,faverage为当前迭代下所有粒子的平均适应度,fmin为当前迭代下所有粒子的最小适应度。如果适应度越小,则距离越近,对于局部搜索的需求更强,反之亦然。故而追随者位置的更新公式如下:

81、

82、s5.6使用改进樽海鞘issa算法优化模型的参数包括:随机森林rf的最大深度和最大叶子节点数,极限梯度提升xgboost的权重和学习率,长短期记忆网络lstm的学习率和隐藏层节点数,极限学习机elm的权重和偏置。

83、进一步地,步骤s6的具体操作为,利用优化后的极限学习机elm对新测试集(new_test_data)进行预测,得到最终预测结果。

84、一种基于stacking模型的滤芯更换周期预测方法及系统,包括数据采集模块、数据处理模块、参数优化模块、结果预测模块和线上监测模块。

85、数据采集模块:由流量传感器、tds传感器、ss传感器、水质硬度传感器、控制器plc200和通信接口构成,用于采集给水量、工作时间和水质数据(如tds值、悬浮物浓度ss、水质硬度),并通过4g路由器实现设备与上位机的通信,传输存储数据信息。

86、数据处理模块:对采集的数据进行清洗和归一化处理,即将残缺数据、错误数据、异常数据转化为满足数据质量要求的数据,并规范到[0,1]区间。

87、参数优化模块:使用改进樽海鞘issa算法对学习器的参数进行全局寻优。优化参数包含元学习器elm的权重和偏置,基学习器rf的最大深度和最大叶子节点数、基学习器xgboost的权重和学习率以及基学习器lstm的学习率和隐藏层节点数。

88、结果预测模块:用于输入归一化后的新样本上,采用改进樽海鞘issa算法优化stacking融合模型对输入数据进行预测。

89、线上监测模块:包括用户登录界面、水质数据监测、滤芯更换周期监测,实现系统可视化的目标。

90、与现有技术相比,本发明具有以下有益效果:

91、本发明提出的基于stacking模型的滤芯更换周期预测方法及系统,吸收了rf、xgboost、lstm各自的优点。基学习器的学习能力越强,相互之间的关联程度越小,最终的预测效果就越好。针对传统ssa全局勘探不够充分,遍历性不足,且受初始种群影响较大,易于陷入局部最优,采用tent混沌映射方法进行种群初始化,丰富初始种群的多样性;同时,在樽海鞘领导者位置更新中,引入logistic映射策略和自适应惯性权重,提升导者搜索的有效性,扩展ssa搜索过程的随机性以及遍历性,提高全局探索的能力,从而提高算法的寻优精度;在追随者位置更新中,根据适应度值引入权重,提高局部开发的能力、加快算法的收敛速度,降低陷入局部最优的风险。最后采用了8折交叉验证的方法在提高模型预测精度的同时,加快了模型的训练速度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1