基于模糊高斯混合模型的多阶段间歇过程软测量方法

文档序号:6640118阅读:217来源:国知局
基于模糊高斯混合模型的多阶段间歇过程软测量方法
【专利摘要】本发明公开了一种基于模糊高斯混合模型的多阶段间歇过程软测量方法,该方法首先将三维的过程测量数据按变量方向展开成二维矩阵;其次定义新的不相似度函数,建立模糊高斯混合模型,刻画间歇过程的多阶段特性,将过程与质量变量划分到对应不同阶段的多个高斯成分区域;然后计算待预测样本属于各高斯成分的模糊隶属度,识别出相应的高斯成分;再次计算出测量数据在相邻两个阶段的后验概率作为自适应权重,用于过渡区域的质量预测;最后根据识别出的局部高斯成分进行质量预测。本发明不仅能有效地提取间歇过程的多阶段特性,而且较好地抓取了相邻阶段之间过渡区域的动态变化,建立较为合理、准确的模型,从而提高了模型的预测精度。
【专利说明】基于模糊高斯混合模型的多阶段间歇过程软测量方法

【技术领域】
[0001] 本发明属于生化过程软测量领域,尤其涉及一种基于模糊高斯混合模型的多阶段 间歇过程软测量方法。

【背景技术】
[0002] 间歇过程已经广泛应用于精细化工、材料、生物技术、聚合物反应等领域。产品关 键变量的测量对工厂的先进过程控制和优化、过程效率的提高及产品质量的改善具有十分 重要的作用。由于工艺和条件的限制,关键变量常难以进行精确和实时测量,使得间歇操作 过程面临巨大挑战。相比于硬件仪器测量或离线实验分析,目前软测量技术引起了广泛关 注。基于软测量的预测模型具有强大的推理能力,对产品关键变量提供了可靠的实时预测。 软测量技术主要通过对容易测量的过程变量进行建模,以便预测出难以测量的关键变量。 常用的软测量方法有主元回归(PCR)、偏最小二乘回归(PLS)、人工神经网络(ANN)等。
[0003] 这些用于间歇过程中关键变量预测的软测量技术,通常是基于间歇过程处于同一 操作阶段和同一模态假说的单一回归模型。在实际应用中,间歇过程随反应进程或操作条 件的变化呈现多阶段特性,不同阶段的数据会动态变化,导致质量变量预测的准确性和可 靠性由于过程阶段的迀移而发生退化。研宄者设计出了一些模型更新策略或多模态方法用 于操作阶段的迀移,这些方法在不同阶段的数据分布处于明显不同的区域时,可获得较高 的预测精度。然而,阶段之间的数据常出现交叉重叠分布,难以进行清晰划分。"硬"划分方 法难以分割处于不同阶段之间过渡区域的数据,从而影响预测精度。


【发明内容】

[0004] 鉴于现有方法存在的不足,提供了一种基于模糊高斯混合模型的多阶段间歇过程 软测量方法。
[0005] 本发明通过以下技术方案实现:一种基于模糊高斯混合模型的多阶段间歇过程软 测量方法,包括以下步骤:
[0006] S1、数据预处理:选择间歇过程多阶段运行的数据I (其中I是批次数,J 是测量变量数,K是采样点数),组成训练样本集。将三维矩阵f按照变量方向展开成二维 矩阵X可表示为:^=[却=1>碎=2>…七LiO Γ,对应的输出质量变量以同样的方式 表示成:y=[ 拉=2>…U T。
[0007] S2、建立高斯混合模型:利用训练样本训练高斯混合模型,通过期望最大化算法迭 代计算模型参数? = (α,μ, Σ),其中α为混合系数,μ、Σ为高斯成分的均值及协方 差。
[0008] S3、建立模糊高斯混合模型:定义新的不相似度函数,最小化模糊C均值算法的目 标函数,得到新的聚类中心及样本的模糊隶属度,不断更新模型,并决策出最佳的聚类数目 对应不同的操作阶段。
[0009] S4、鉴别出过渡区域:预设统计显著性水平作为阈值,如果测量样本的最大模糊隶 属度大于阈值,说明该样本可划分到独立的操作阶段;如果测量样本的最大模糊隶属度小 于阈值,表明其位于两个相邻阶段之间的过渡区域;进一步判断出连接过渡区域的两个相 邻阶段;
[0010] S5、建立多个局部预测模型:利用划分到多个局部阶段的测量子集建立多个局部 偏最小二乘回归模型,同时,将连接过渡区域的两个相邻阶段的后验概率作为自适应权重, 进一步预测过渡区域的样本。
[0011] 本发明的有益效果是:本发明引入新的不相似度函数,建立模糊高斯混合模型,用 多个模糊高斯成分近似刻画间歇过程的多阶段特性,获得间歇过程的各个模糊高斯成分参 数,形成多个高斯成分区域。然后,计算待预测样本属于各高斯成分的模糊隶属度,识别出 相应的高斯成分;同时,统计出测量数据在相邻两个阶段的后验概率,作为自适应权重,用 于过渡区域的质量预测。根据识别出的高斯成分建立局部偏最小二乘回归模型。与传统硬 划分的模型相比,本发明不仅有效的提取间歇过程的多阶段特性,而且较好地抓取了相邻 阶段过渡区域的动态变化,建立较为合理、准确的模型,提高了模型的预测精度。

【专利附图】

【附图说明】
[0012] 图1是青霉素发酵过程示意图;
[0013] 图2是本发明方法的算法流程图;
[0014] 图3是传统基于k均值聚类的偏最小二乘回归方法对青霉素浓度输出预测效果 图;
[0015] 图4是本发明方法对青霉素浓度输出预测效果图。

【具体实施方式】
[0016] 下面结合附图和实施案例对本发明作进一步的说明。本发明引入新的不相似度函 数,建立模糊高斯混合模型,用多个模糊高斯成分近似刻画间歇过程的多阶段特性,获得间 歇过程的各个模糊高斯成分参数,形成多个高斯成分区域。然后,计算待预测样本属于各高 斯成分的模糊隶属度,识别出相应的高斯成分;同时,统计出测量数据在相邻两个阶段的后 验概率,作为自适应权重,用于过渡区域的质量预测。根据识别出的高斯成分建立局部PLS 模型。本发明不仅有效的处理间歇过程的多阶段特性,而且较好地抓取了相邻阶段过渡区 域的动态性,提高了模型的预测精度。
[0017] 本发明解决技术问题所采取的技术方案是:
[0018] 参考图2, 一种基于模糊高斯混合模型的多阶段间歇过程软测量方法,包括以下步 骤:
[0019] S1、数据预处理:选择间歇过程多阶段运行的数据1 (其中I是批次数,J 是测量变量数,K是采样点数),组成训练样本集。将三维矩阵尤按照变量方向展开成二维 矩阵Zegihx75X可表不为:Ι=[χ?=υ ... AU7。对应的输出质量变量以同样的方式表 示成:
[0020] S2、建立高斯混合模型:利用训练样本训练高斯混合模型,通过EM算法迭代计算 模型参数? = (α,μ, Σ),其中α为混合系数,μ、Σ为高斯成分的均值及协方差;
[0021] S3、建立模糊高斯混合模型:定义新的不相似度函数,最小化模糊C均值算法 (FCM)的目标函数,得到新的聚类中心及样本的模糊隶属度,不断更新模型,决策出最佳的 聚类数目对应不同的操作阶段;
[0022] S4、鉴别出过渡区域:预设统计显著性水平作为阈值,如果测量样本的最大模糊隶 属度大于阈值,说明该样本可划分到独立的操作阶段;如果测量样本的最大模糊隶属度小 于阈值,表明其位于两个相邻阶段之间的过渡区域;进一步判断出连接过渡区域的两个相 邻阶段;
[0023] S5、建立多个局部预测模型:利用划分到多个局部阶段的测量子集建立多个局部 PLS模型,同时,将连接过渡区域的两个相邻阶段的后验概率作为自适应权重,进一步预测 过渡区域的样本。
[0024] 步骤S2中,"建立高斯混合模型"的具体步骤如下:
[0025] S21 :假设间歇过程具有Q个不同的阶段,每个阶段表示为Cq(q=l,2,…,Q),Nq代 表每个阶段内的样本数给定展开的训练集,第i批次第k个样本X (i,k)的后验概率为:

【权利要求】
1. 一种基于模糊高斯混合模型的多阶段间歇过程软测量方法,其特征在于,包括以下 步骤: 51、 数据预处理:选择间歇过程多阶段运行的数据^组成训练样本集,其中I是批次数,J是测量变量数,K是采样点数;将三维矩阵f按照变量方向展开成二维矩阵 作X可表示为:^=[4=υXfU...f;对应的输出质量变量也按照变量方向展 开成:r=[y(【=i)Γ(Ι=2)…7(!=幻]Γ; 52、 建立高斯混合模型:利用训练样本训练高斯混合模型,通过期望最大化算法迭代计 算模型参数Θ= (α,μ,Σ),其中α为混合系数,μ、Σ为高斯成分的均值及协方差; 53、 建立模糊高斯混合模型:引入新的不相似度函数,最小化模糊C均值算法的目标函 数,多次迭代更新模型参数,得到新的聚类中心及样本的模糊隶属度,决策出最佳的聚类数 目对应不同的操作阶段; 54、 鉴别出过渡区域:预设统计显著性水平作为阈值,如果测量样本的最大模糊隶属度 大于阈值,表明该样本可划分到独立的操作阶段;如果测量样本的最大模糊隶属度小于阈 值,表明该样本位于两个相邻阶段之间的过渡区域;进一步判断出连接过渡区域的两个相 邻阶段; 55、 建立多个局部预测模型:利用划分到多个局部阶段的测量子集建立多个局部PLS 模型,同时,将连接过渡区域的两个相邻阶段的后验概率作为自适应权重,进一步预测过渡 区域的样本。
2. 根据权利要求1所述基于模糊高斯混合模型的多阶段间歇过程软测量方法,其特征 在于,所述步骤S2具体为: 521 :假设间歇过程具有Q个不同的阶段,每个阶段表示为Cq(q= 1,2,…,Q),Nq代表 每个阶段内的样本数给定展开的训练集,第i批次第k个样本X(i,k)的后验概率为:
式中,q为高斯成分对应第q阶段,为模型的混合系数,Θq=(μq,Σ(?)为模型参 数包括均值和协方差,P(X(i,k)IΘ。)
为第q高斯成分的概率密度函数,表示为: 522 :高斯混合模型的目标函数定义为log似然函数:
523 :最大化似然函数,利用期望最大化算法估计参数,当前参数为Θω,更新模型参数 0 (t+ι):
3.根据权利要求1所述基于模糊高斯混合模型的多阶段间歇过程软测量方法,其特征 在于,所述步骤S3具体为: 531 :新的不相似度函数定义为:
532 :基于上式的不相似度函数,构造模糊C均值模型的目标函数为:
式中,m为权里指数,U= {u^aiOhu^ak)是测量值x(i,k)对第q个聚类的模糊隶 属度,且 0 彡uq(i,k)彡 1,ΣΙ?,Ο= 1; 533 :最小化FCM的目标函数,隶属度和聚类中心更新为:
更新后的模型混合系数及协方差分别表示为:
执行EM算法,不断迭代直至获得模型的最优解,识别出不同的过程操作阶段,输入、输 出数据分别产生Q个子集为:

S34 :根据模糊隶属度,识别测试样本所属的局部操作阶段,根据其最大隶属度,划分到 第qt个操作阶段: Cjt = argmaxUj(IJi)〇 1华β'
4. 根据权利要求1所述基于模糊高斯混合模型的多阶段间歇过程软测量方法,其特征 在于,所述步骤S4具体为: S41:预设统计显著度水平δ,假如隶属度满足Uq(i,k)多δ,则将该样本划分到独立 的单个阶段中;假如uq(i,k)〈δ,则将该样本划分相邻两个阶段的过渡区域qt:
式中,qt {1}、qt⑵连接过渡区域的第1和第2个阶段,分别对应:
5. 根据权利要求1所述基于模糊高斯混合模型的多阶段间歇过程软测量方法,其特征 在于,所述步骤S5具体为: 551 :根据输入输出数据集{X,Y},建立偏最小二乘回归模型: X=ATR+E Y=ATB+F 式中,A为得分矩阵,R、B为负载矩阵,E、F分别为输入、输出残差; 552 :对于预处理后的待预测的数据Xm,假如划分到第q个局部阶段,则输出为:
式中,W为权值矩阵; 553 :假如该测试样本划分到过渡区域,对应为相邻两个阶段C1Q= 1或2)之间,预测 值的局部后验概率表示为:
式中,户(仏|?)为高斯密度概率,p(C1)为局部模型C1的系数,正则化后的后验概率为 作为局部模型的自适应权重; 554 :过渡区域的样本对应的预测估计表示为:
【文档编号】G06F19/00GK104462850SQ201410822983
【公开日】2015年3月25日 申请日期:2014年12月25日 优先权日:2014年12月25日
【发明者】卢春红, 顾晓峰 申请人:江南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1