面向高维非线性软测量模型的辅助变量约简方法

文档序号:6588246阅读:262来源:国知局
专利名称:面向高维非线性软测量模型的辅助变量约简方法
技术领域
本发明属于软测量技术领域,具体涉及一种面向高维非线性软测量模型的辅助变量约简方法,用于指导生产过程辅助变量的精简。
背景技术
当前,在工业过程、生物信息、环境保护、食品安全等领域出现大量非线性、复杂关联、不可测度对象参数的检测问题,基于软计算实现的软测量技术正是在这种强烈的工业需求下蓬勃发展起来,并成为解决这类问题的有效方法,有广阔的发展前景。例如中国专利(专利号:200410017533.7)就提出了一种基于支持向量机的软测量建模方法。在软测量过程中,首先面对的问题就是辅助变量的选择,一方面希望尽可能不遗漏重要的解释因素;另一方面,又要遵循参数节省原则,使辅助变量的个数尽可能少。在实际工作中,为了较完备地描述和分析系统,分析人员往往倾向于较周到地选取所能得到的一切辅助变量。而这样构成的辅助变量之间常常存在多重相关性,造成建模中协方差矩阵的病态,降低建模的精度,破坏模型的稳定性,影响着软测量的精度和泛化能力。因此,必须去除这种相关性,实现高维非线性软测量模型的辅助变量约简。

发明内容
本发明的目的在于提供一种面向高维非线性软测量模型的辅助变量约简方法,能够在建模效果最佳的准则上找出含辅助变量个数最少的辅助变量集对主导变量进行预测,实现对主导变量精简化的软测量。本发明的技术方案如下:一种面向高维非线性软测量模型的辅助变量约简方法,其关键在于按如下步骤进行:步骤一:确定与主导变量可能相关的η个原始辅助变量,采集η个原始辅助变量和主导变量的取值,组成样本集,样本集大小为m ;将η个原始辅助变量数据写成矩阵X= [Xl,…,Xi,…xm]T形式,主导变量数据写成矩阵 Y =[y1; -,Yi,...ym]T,其中,Xi e RxxSyi e R,i = 1,2,…,m,并将 X,Y 进行标准化处理;所述标准化处理就是:若η个原始辅助变量数据写成矩阵
权利要求
1.一种面向高维非线性软测量模型的辅助变量约简方法,其特征在于按如下步骤进行: 步骤一:确定与主导变量可能相关的η个原始辅助变量,采集η个原始轴助变量和主导变量的取值,组成样本集,样本集大小为m ;将η个原始辅助变量数据写成矩阵X= [Xl,..., Xi,…xm]T形式,主导变量数据写成矩阵 γ=[7ι,…,7i,...yjT,其中,Xi e Rnxi,yi e R,i = 1,2,…,m,并将 χ,γ 进行标准化处理; 步骤二:融合核独立成分分析KICA(Kernel Independent Components Analysis)与虚假最近邻点FNN(False Nearest Neighbors)方法,分别计算n个原始辅助变量的权重值;步骤三:按照权重值,将η个原始辅助变量组成原始辅助变量序列; 步骤四:确定最佳辅助变量集,包括以下步骤: 第一步,设定循环次数N = η ; 第二步,随机从样本集中选择P个样本作为训练样本,剩下的m-p个样本作为检验样本; 第三步,根据所述训练样本,利用BP神经网络建立当前的辅助变量序列中所包含变量的非线性模型; 第四步,将所述检验样本的当前辅助变量值输入至所述非线性模型,得到m-p个检验样本对应的主导变量预测值;` 第五步,计算m-p个检验样本预测值的均方误差MSE ; 第六步,删除当前的辅助变量序列中权重值最小的原始辅助变量,组成新的原始辅助变量序列,并设定N = N-1,判断此时N是否为O: 如果N古0,则回到第三步; 如果N = 0,则最小的检验样本预测值的均方误差MSE对应当前的辅助变量序列即为最佳辅助变量集; 步骤五:最佳辅助变量集在步骤四中对应的非线性模型即为软测量的约简模型。
2.根据权利要求1所述的面向高维非线性软测量模型的辅助变量约简方法,其特征在于步骤二中的虚假最近邻点方法,步骤如下: 步骤一:将由所有原始辅助变量组成的η维数据看成是A= (Xl,X2,…,,…,xn); 步骤二:将剔除的辅助变量Xi设为零,重新得到A的投影向量B= (χ1; χ2, -χ^,Ο,Xi+i,…,Xn); 步骤三:计算高维相空间中相点A与其投影向量B之间的相似性测度COSab,其中, _ Α.ΒΤ⑴ -關0) 步骤四:依次考察原始辅助变量X1, X2,…,Xn,通过比较相应 变化情况,确定输 /=1入变量对原始数据结构的影响大小,按变化由大到小的顺序进行变量选择;相似性测度COSab越大,说明剔除该变量对原始数据结构影响越小,可被剔除,相似性测度COSab越小,说明剔除该变量对原始数据结构影响越大,为了保持原有数据结构,该变量应被保留。
3.根据权利要求1所述的面向高维非线性软测量模型的辅助变量约简方法,其特征在于步骤二中的融合核独立成分分析与虚假最近邻点方法,如下: (一)、利用KICA算法计算样本集的k个KICA主元得分向量ti;i = 1,2,..., k,组成主元得分矩阵T=[t1;...,&,…,tk],按如下步骤进行:(1)输入:辅助变量X= [X1,…,Xi,…xm]T,输出为Y = Iiy1,…,yi7…ym]T; (2)定义辅助变量矩阵χ的核矩阵:计算核矩阵1(,其中,1(的第1_位元素为1^= 1^0^,Xj),i,j = 1,2,…,m,其中k(.)为核函数;(3)中心化核矩阵
4.根据权利要求1所述的面向高维非线性软测量模型的辅助变量约简方法,其特征在于在利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型的过程中,输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数,隐含层的节点个数通过交互验证法确定,输出层的节点个数为1,其中,隐含层的传递函数为:
全文摘要
本发明公开了一种面向高维非线性软测量模型的辅助变量约简方法,其特征在于按如下步骤进行一、确定与主导变量可能相关的n个原始辅助变量,采集n个原始辅助变量和主导变量取值数据并组成样本集;二、融合KICA和FNN方法分别计算n个原始辅助变量的权重值;三、组成原始辅助变量序列;四、建模并根据最小均方误差MSE确定最佳辅助变量;五、得到软测量的约简模型。本发明能够在建模效果最佳的基础上找出含辅助变量个数最少的辅助变量集对主导变量进行建模,实现对辅助变量的约简。
文档编号G06F17/50GK103186696SQ20131006850
公开日2013年7月3日 申请日期2013年3月5日 优先权日2013年3月5日
发明者苏盈盈, 李太福, 颜克胜, 姚力忠, 曾诚 申请人:重庆科技学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1