一种基于GA-NLP方法的软测量建模辅助变量选择方法与流程

文档序号:17952140发布日期:2019-06-19 00:07阅读:515来源:国知局
一种基于GA-NLP方法的软测量建模辅助变量选择方法与流程
本发明涉及工业建模领域,尤其涉及工业过程中难以在线测量的关键过程变量的预测模型建立。
背景技术
:近年来,在现代生产过程中,对产品质量的要求越来越高,必须对与产品质量密切相关的关键变量进行实时检测。但是,在线分析仪表价格昂贵、维护保养复杂;而通过离线实验室分析结果存在滞后大等原因,将导致控制质量的性能下降,难以满足生产要求。软测量技术正是为了解决这类质量指标的实时测量和控制问题而逐渐发展起来的。软测量技术源于世纪年代提出的推断控制。推断控制的基本思想是采集过程中比较容易测量的辅助变量,通过构造推断估计器来估计并克服扰动和测量噪声对过程主导变量的影响。推断控制包括推断估计器和控制器的设计,两者可以独立进行,其中推断估计器是推断控制系统设计的关键,如果主导变量的估计值足够精确,那么就为控制器的设计提供了良好的支持。软测量技术正是围绕如何构造一个高精度的估计器这一核心内容展开的。而辅助变量选择正是软测量建模中关键的一步,近年来,国内外对辅助变量选择进行了大量的研究。06年,emet等人提出直接优化aic准则,将变量选择描述成一个混合整数非线性,并且通过分支界定法对其进行求解(mixedintegernonlinearprogramming,minlp)[emets.amodelidentificationapproachusingminlptechniques[j].wseastransactionsonmathe-matics,2006,5(7):939.];17年,jian等人在minlp优化问题的基础上,进一步简化,提出了一种嵌套式miqp的变量选择方法,并且通过分枝切割法对其进行求解[jianw,zhul,xuz,chenx.avariableselectionmethodforsoftsensordevelopmentthroughmixedintegerquadraticprogramming.chemometricsandintelligentlaboratorysystems,2017,167:85–95]。上述两种方法都能够找到较优的辅助变量子集,从而建立预测性能良好的预测模型,不过当处理候选变量数量过大的数据集时,两种方法都需要大量的求解时间,前者甚至将难以找到最优解,且在研究过程中发现,bic准则虽然能够较好的拟合预测误差,但是并不能完全代替预测误差。技术实现要素:本发明的目的在于针对现有技术的不足,提供了一种基于ga-nlp方法的软测量建模辅助变量选择方法。本发明的目的是通过以下技术方案来实现的:一种基于ga-nlp方法的软测量建模辅助变量选择方法,包括以下步骤:步骤一:数据预处理,对数据集进行归一化处理,并将数据集按照5:2:3的比例分为训练集、验证集和测试集,训练集、验证集用于辅助变量选择,测试集用于验证所选子集效果;步骤二:通过引入验证集的均方误差,将原minlp优化重新描述为以训练集bic准则和验证集mse准则结合作为目标函数的minlp优化;步骤三:随机生成种群,即等概率0、1编码的标准化矩阵,矩阵中行向量代表候选变量个数m,列向量代表遗传算法种群大小n。并指定遗传算法最大迭代次数500;步骤四:对于一组给定的有m个候选辅助变量的训练集,通过遗传算法种群个体固定了一个有p个辅助变量的子集时,将minlp进一步简化为一个nlp问题:步骤五:通过求解nlp问题建立子集模型,计算个体适应度值fval;步骤六:计算出种群中所有个体的适应度,并保留适应度最优个体,共r个;其余个体进行交叉和变异操作;步骤七:本轮遗传迭代结束后,求出最佳个体,并与上一轮求得的最佳个体比较,较优个体留下。转到步骤二,开始新一轮的迭代;步骤八:达到ga设定迭代次数,则迭代结束。进一步地,所述步骤二通过以下子步骤来实现:(2.1)bic准则:一种常用的变量选择准则,其定义如下:bic=-2lnl+plnn其中,l为似然函数,p为辅助变量数。(2.2)变量选择一般在线性回归下进行,本发明使用mlr模型用于变量选择,似然函数l定义如下:其中,n为样本个数,εi为模型预测误差,c为常数。从而可以将bic准则描述为:(2.3)变量选择:等人为了实现这个目的,引入一组0-1决策变量zj,j=1,2,...,m用于选择辅助变量,若第j个变量被选中,则zj=1,否则zj=0。然后,通过引入大m约束可以实现变量选择的目的:-mzj≤bj≤mzj(j=1,2,...,m)其中,m为一个足够大的正数,-m和m分别为回归系数bj的上下界。(2.4)综上,通过最小化bic准则,可以将变量选择问题表示为如下minlp问题:-mzj≤bj≤mzj(j=1,2,...,m)zj∈{0,1}(j=1,2,...,m)。(2.5)通过引入验证集的均方误差,将原minlp问题描述为新的minlp问题:minj=bictrain+msever-mzj≤bj≤mzj(j=1,2,...,m)zj∈{0,1}(j=1,2,...,m)。其中验证集的均方误差表达如下:(2.6)综上所述,minlp优化表达如下:-mzj≤bj≤mzj(j=1,2,...,m)zj∈{0,1}(j=1,2,...,m)式中,n1,n2分别为训练集和验证集的样本数,ε1,ε2分别为训练集和验证集的模型预测误差。本发明的有益效果是,本发明的方法是在混合整数非线性规划(mixedintegernonlinearprogramming,minlp)变量选择方法基础上,通过加入验证集的均方误差,从而得到一个新的minlp优化问题,并将其分成内外两层结构,外层采用遗传算法(geneticalgorithm,ga))对二元整数变量进行寻优,内层在整数变量固定之后退化成了较易于求解的非线性规划问题(nonlinearprogramming,nlp)。与传统的基于bic准则的方法进行比较,本发明能找到更优辅助变量子集,提高模型的预测性能,降低模型的复杂度附图说明图1是基于ga-nlp方法的软测量建模辅助变量选择方法流程图。具体实施方式下面根据附图详细说明本发明。本发明可以以其他不同形式进行实施,因此不应认为它局限于说明书所列出的实施例。说明书提供这种实施例是为了向本领域的技术人员描述本发明的具体实施过程。图1是ga-ls方法的具体实现流程图。如图1所示,首先通过ga生成种群,然后通过求解模型以及适应度计算得到每个个体适应度值,接着通过所得适应度值,保留最佳个体,剩余个体进行交叉和变异,得到新的种群,如果满足算法的终止条件,则结束算法,否则进行下一轮迭代。步骤一:数据预处理,对数据集进行归一化处理,并将数据集按照5:2:3的比例分为训练集、验证集和测试集,训练集、验证集用于辅助变量选择,测试集用于验证所选子集效果;步骤二:通过引入验证集的均方误差,将原minlp优化重新描述为以训练集bic准则和验证集mse准则结合作为目标函数的minlp优化;步骤三:随机生成种群,即等概率0、1编码的标准化矩阵,矩阵中行向量代表候选变量个数m,列向量代表遗传算法种群大小n。并指定遗传算法最大迭代次数500;步骤四:对于一组给定的有m个候选辅助变量的训练集,通过遗传算法种群个体固定了一个有p个辅助变量的子集时,将minlp进一步简化为一个nlp问题:步骤五:通过求解nlp问题建立子集模型,计算个体适应度值fval;步骤六:计算出种群中所有个体的适应度,并保留适应度最优个体,共r个;其余个体进行交叉和变异操作;步骤七:本轮遗传迭代结束后,求出最佳个体,并与上一轮求得的最佳个体比较,较优个体留下。转到步骤二,开始新一轮的迭代;步骤八:达到ga设定迭代次数,则迭代结束。实施例:在本实施例中,wwtp数据集有34个辅助变量,379组过程数据,设置参数m=34,n=200,n1=379*0.4=151,n2=379*0.3=114。步骤一:数据预处理,对数据集进行归一化处理,并将数据集按照5:2:3的比例分为训练集、验证集和测试集,训练集、验证集用于辅助变量选择,测试集用于验证所选子集效果;步骤二:通过引入验证集的均方误差,将原minlp优化重新描述为以训练集bic准则和验证集mse准则结合作为目标函数的minlp优化;步骤三:随机生成种群,即等概率0、1编码的标准化矩阵,矩阵中行向量代表候选变量个数m,列向量代表遗传算法种群大小n。并指定遗传算法最大迭代次数500;步骤四:对于一组给定的有m个候选辅助变量的训练集,通过遗传算法种群个体固定了一个有p个辅助变量的子集时,将minlp进一步简化为一个nlp问题:步骤五:通过求解nlp问题建立子集模型,计算个体适应度值;步骤六:计算出种群中所有个体的适应度,并保留适应度最优个体,共r个;其余个体进行交叉和变异操作;步骤七:本轮遗传迭代结束后,求出最佳个体,并与上一轮求得的最佳个体比较,较优个体留下。转到步骤二,开始新一轮的迭代;步骤八:达到ga设定迭代次数,则迭代结束。ga-ls方法在wwtp数据集的实施例中,效果如下表1所示:casemnmodelkrmsermsepr2prd-dqo-g37934minlp-mlr(bic)40.1580.2930.953miqp-mlr(bic)70.1700.2800.951ga-nlp60.600.2790.954rd-sed-g37934minlp-mlr(bic)100.23160.2590.612miqp-mlr(bic)100.2190.2580.654ga-nlp90.1950.2650.724上述实施例表明本发明能够获得更优的目标值,能够获得规模较小的辅助变量子集,且能达到最好的预测效果。本发明可以以其他不同形式进行实施,因此不应认为它局限于说明书所列出的实施例。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1