基于混合搜索进化优化的工业过程软测量建模方法、系统

文档序号：35668650发布日期：2023-10-07 13:21阅读：20来源：国知局

本发明涉及一种基于混合搜索进化优化的工业过程软测量建模方法、系统，属于工业过程控制领域。

背景技术：

1、随着现代信息技术的迅猛突破，化工、石油、医药和冶金等过程工业领域已向规模扩大化、工艺复杂化和节能环保化方向快速发展，受限于技术或经济方面的因素，诸如仪表检测和离线分析等常规的检测手段已经无法实现对关键过程变量的在线测量来满足生产的需求。软测量技术作为一种重要的间接测量手段，近年来，以构建辅助变量和主导变量之间数学关系模型为核心的软测量技术已经成为各种先进自动化技术成功实施的基础和关键。

2、传统的软测量模型的构建需要的过程数据应同时包含输入和输出的有标签数据，但在实际过程工业中，相对于容易获取的无标签数据，有标签数据往往需花费较大代价才能获取，传统软测量模型在标记样本不足时预测精度不高。于是，如何能够利用这些仅有的标记数据来提升软测量模型性能的软测量建模方法在工业过程中日益受到关注和重视。

3、现存的监督软测量模型存在着预测变量估计严重依赖初始模型性能，不足的有标签样本预测大规模无标签数据时存在着决策变量维度高、收敛速度慢、搜索空间大、易陷入局部最优等问题。为了避免这些问题，有必要提出新的工业过程软测量建模方法。

技术实现思路

1、本发明提供了一种基于混合搜索进化优化的工业过程软测量建模方法、系统，以用于结合了离散优化和连续优化的优势，实现工业过程预测变量预测。

2、本发明的技术方案是：根据本发明的一方面，提供了一种基于混合搜索进化优化的工业过程软测量建模方法，包括：s1、依据收集的工业过程数据，确定辅助变量x和预测变量y，并建立工业过程数据库；数据库中的数据为有标签数据集，有标签数据集包含辅助变量x＝{x1，x2，...，xn}和预测变量y＝{y1，y2，...，yn}；其中，n表示数据库中样本总数，xn表示第n个样本的辅助变量，yn表示第n个样本的预测变量，每个辅助变量包括多个特征；s2、对有标签数据集进行归一化处理，得到归一化有标签数据集；将有标签数据划分为训练集dtrain和测试集dtest；s3、建立预测模型；s4、依据训练集中预测变量的样本集，建立伪标记离散区间中值集合，将这些离散取值区间中值进行实数编码{1，2，3，...，m}；s5、对测试集dtest聚类为n个类，其中n＜m，并对每个类进行实数编码{1，2，3，...，n}；s6、确定目标函数；s7、依据预测模型、目标函数，通过离散搜索，获得最优个体；s8、依据最优个体进行局部搜索，获得目标函数值最优的个体，将其作为高置信度伪标记。

3、所述s4，具体步骤如下：s4.1、取出训练集dtrain中预测变量的样本集ytrain，作为训练标签样本集；s4.2、从训练标签样本集中找到最大值ymax和最小值ymin，依据最大值ymax和最小值ymin建立伪标记取值范围[ymin，ymax]；s4.3、将伪标记取值范围[ymin，ymax]等距划分为m个离散区间；依据各离散区间的中值，获得全部的中值集合{median1，median2，...，mediank，...，medianm}，并将这些离散取值区间中值进行实数编码{1，2，3，...，m}；其中，medianm表示第m个离散区间的中值，k＝1，2，...，m。

4、所述s5，具体步骤如下：s5.1、从测试集dtest中分别得到只包含辅助变量的样本集xtest作为测试输入样本集、得到只包含预测变量的样本集ytest作为测试标签样本集；s5.2、采用k-means聚类算法对测试输入样本集xtest进行聚类，得到不同的聚类{c1，c2，...，cn}；其中n为聚类个数，对聚类的不同类进行实数编码{1，2，3，...，n}。

5、将第一子目标函数和第二子目标函数相加作为目标函数；其中，第一子目标函数、第二子目标函数同时选用取值越小性能越优的性能指标，或者同时选用取值越大性能越优的性能指标。

6、所述s7，具体步骤如下：s7.1、将聚类的实数编码{1，2，3，...，n}作为位置信息，从伪标记m个离散区间中随机不重复的抽取n个实数编码放入n个聚类位置之中；重复r次得到初始化的取值区间编码种群并最终得到各聚类位置取值区间；依据各个聚类位置取值区间的中值，建立初始伪标记个体；将所有个体的目标函数值按照从低到高进行排序，将对应目标函数值取值较优的前s个精英个体选出来；通过锦标赛，不断重复上述步骤，直至得到初始化的精英种群及初始化的精英种群的中值实数编码；s7.2、建立二维离散概率模型；s7.3、依据二维离散概率模型生成新的种群，依据新的种群生成新的精英种群用于更新二维离散概率模型，直至达到终止条件，获得种群中的最优个体。

7、所述s7.2，包括：依据精英种群的中值实数编码，统计精英种群中每一列的实数编码次数，建立一个实数编码统计表nrepeat；在nrepeat基础上，将nrepeat每行的编码出现次数进行累加得到每行编码出现的总次数，并最终得到全部行编码出现的总次数，然后计算每一行的实数编码的概率；根据每行的实数编码的概率，得到二维离散概率模型。

8、所述s7.3，包括：依据二维离散概率模型，然后从第一行开始，随机生成一个(0，1)间的数randnumber1，采用赌轮盘方式生成新的实数编码，且每一行的实数编码不同；重复r次，最终得到新的种群的实数编码，并最终得到新的伪标记个体将所有个体的目标函数值按照从低到高进行排序，将对应目标函数值取值较优的前s个精英个体选出来；通过锦标赛，不断重复上述步骤，直至得到新的精英种群，用于更新二维离散概率模型，直至达到终止条件，从最后得到的种群中将所有个体的目标函数值按照从低到高进行排序，将对应目标函数值取值最优的个体选出来作为最优个体。

9、所述s8，包括：s8.1、依据最优个体，得到初始化连续搜索种群；s8.2、计算初始化连续搜索种群中全部个体的目标函数值，将所有个体得到的目标函数值从低到高进行排序，将目标函数值较优的前d个精英个体选出来，最终得到初始化的连续搜索精英种群；s8.3、建立高斯分布概率模型；s8.4、依据高斯分布概率模型生成新的连续搜索种群，依据新的连续搜索种群生成新的连续搜索精英种群用于更新二维离散概率模型，直至达到终止条件，获得连续搜索种群中的最优个体作为高置信度伪标记。

10、所述建立高斯分布概率模型，包括：统计连续搜索精英种群中每一列的均值和方差；依据均值和方差对每一列建立一个一元高斯分布概率模型，得到每个个体的高斯分布概率模型，最终得到整个连续搜索种群的高斯分布概率模型。

11、根据本发明的另一方面，提供了一种基于混合搜索进化优化的工业过程软测量建模系统，包括上述中任意一项所述方法的模块。

12、本发明的有益效果是：本发明结合了离散优化和连续优化的优势，能显著提升工业过程软测量建模的预测精度，具体而言：首先，将预测变量预测转化为一个优化问题，其次，将预测变量值的范围设计为离散区间，采用k-means无监督聚类对工业数据聚类，每个类中的数据具有近似的变量取值区间。然后，对各个类及取值区间进行实数编码，采用基于二维分布估计算法的离散搜索策略为每个类寻找最适合的取值区间。经过离散优化，每个预测变量得到初步的取值区间。最后，使用基于高斯分布估计的连续搜索策略在得到的取值区间内对预测变量进行精细化估计。经过以上混合搜索优化后即可得到预测变量的预测值。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金怀平刘光坤陶海波王彬杨彪钱斌
技术所有人：昆明理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。