基于半监督回归学习的多模型软测量方法

文档序号：6369584阅读：124来源：国知局

专利名称：基于半监督回归学习的多模型软测量方法
技术领域：
本发明涉及的是ー种软测量仪表技术领域的方法，具体是ー种基于半监瞀回归学习的多模型软测量方法。
背景技术：
在目前的エ业生产中，一般采用两种手段实现控制变量的測量在线仪表的方法和离线测量分析的方法。但是这两种方法都存在一定的缺点和劣势在线仪表进行测量的方法往往投入成本高，维护难度大，而离线测量分析的方法则由于人工因素的加入，容易测量过失误差变大，且测量滞后性严重，难以满足对实时性要求较高的系统。随着计算机技术的发展，软测量技术成为解决这ー问题的有效方法，软测量技术是ー种使用计算机建模技术对ー些难以測量或者无法测量的变量进行预测的方法，这种难以测量的变量一般称为主导变量，与之相対，作为模型输入的另外ー些相对容易测量的变量则一般称为辅助变量。软測量技术的输入是辅助变量，输出是主导变量，这种方法一般具有投入成本低、维护方便、可以实时测量的优点。在传统的软测量技术中，往往仅仅使用少量的标记数据来进行建模，浪费了大量可以轻易获得的未标记数据的价值，而半监瞀学习是ー种研究如何利用未标记样本来获得较好性能和推广能力的学习机器。近些年来，随着机器学习的不断发展以及未标记数据的日渐增加，半监瞀学习正逐渐成为ー个研究热点。一般来说，标记数据的获取是比较“昂贵”的，在一个系统中，一般没有办法大量地获得标记数据来进行建立模型，而未标记数据因为并不需要人工地对数据进行标记，所以可以对其大量获取，并且研究发现，在未标记数据中存在能够表述数据结构特点的信息，如果能力对这些信息加以利用，在软测量技术中是可以有效地提闻预测精度的。随着现代社会经济和科技的迅猛发展，エ业生产环境变得越来越复杂，想要在这样复杂的エ业环境中做到系统控制准确，必然需要对系统有更加准确和多祥化的认识。在软测量领域，因为测量的主导变量一般是能够主导控制策略变化的主要因素，所以如果软測量模型不准确，将会带来非常严重的控制问题。目前软测量建模的方法有很多种，每种方法都可能有它自己相对应或者擅长的领域，而如今的控制系统也往往出现多变量、非线性、强耦合、多エ况、控制性能综合要求高等特点，是多种类型系统的组合或者耦合，对这种系统采用単一模型进行软測量建模，效果并不好。所以，对于复杂多エ况的系统，有必要建立多个软测量模型，同时利用多个模型对系统的主导变量进行测量，最后再根据多组测量结果进行优化，从而有助于提高软测量模型的鲁棒性、准确性和可靠性。

发明内容
本发明针对传统软测量技术中并没有利用未标记数据及对于多エ况、非线性强的复杂エ业过程単一模型预测效果不好的问题，提供一种基于半监瞀回归学习的多模型软测
量方法。
根据本发明的ー个方面，提供一种基于半监瞀回归学习的多模型软测量方法，包括如下步骤步骤ー对数据进行聚类；步骤ニ根据数据分类结果采用多个子模型预测方案共同进行子模型预测，获得子模型预测结果；步骤三将多个子模型预测结果进行合并，得到预测結果。优选地，所述步骤一，具体为以加权式多模型软测量建模方法采用G-K模糊聚类算法对数据进行聚类。优选地，所述步骤三，包括步骤将子模型预测结果进行基于加权的优化。优选地，所述步骤一，具体为以切换式多模型软测量建模方法采用最小距离分类算法对数据进行聚类。优选地，所述步骤三，包括步骤将子模型预测结果进行基于切换的优化。优选地，在软测量模型建模之前，首先通过数据聚类将作为模型输入的辅助变量数据根据它们之间的相似性进行分类，接着再根据分类结果采用不同的建模策略将ー个系统拆分为多个软测量子模型共同进行变量预测，最后再把多个子模型的预测结果进行合并，形成ー种多模型的软测量模型预测結果。优选地，所述对数据进行聚类包括模糊聚类以及硬聚类，其中，模糊聚类是指ー种不严格的聚类，即某ー个数据点并不完全属于ー个类别，数据点对各个类别的所述关系通过模糊隶属度来表现，模糊隶属度是ー个范围在O到I内的小数，该小数越大，代表数据点与某一类别中的数据越相似，此外，同一数据点对所有类别的模糊隶属度加和为I;硬聚类是指ー种严格的聚类，即某一个数据点是只能严格地属于某一个类别，这种方法不存在隶属度的概念，对某ー数据点的所属关系来说，是非此即彼的。优选地，加权式多模型软测量建模方法指的是首先利用G-K模糊聚类算法对输入数据点进行聚类分析，得到聚类中心和每个数据点的模糊隶属度，接着根据类别的特点建立与类别数相等的子模型进行软測量模型主导变量的预测，最后再以每个数据点的模糊隶属度为加权系数对该数据点的所有子模型预测结果进行加权计算，最終得到一个基于加权的多模型软测量模型预测結果。优选地，所述的切換式多模型软测量建模方法指的是首先对作为输入的辅助变量数据进行聚类分析，得到数据的聚类数和聚类中心；接着采用最小距离分类方法对输入数据进行分类，这里的最小聚类分类指的是通过计算某一数据点到各个聚类中心的距离来判定该数据点属于哪个类别，取距离最小的类别为该数据点的所属类别；然后再根据分类结果建立各个类别的软测量子模型对其中的数据进行预测；最后取所有类别中数据的预测结果的并集，直接作为这种多模型软测量方法的预测结果集。更为具体地，提供两种基于半监瞀回归学习的多模型软测量方法加权式多模型软测量建模方法和切換式多模型软测量建模方法。首先，这两种多模型软测量建模方法均以数据聚类算法为基础，所不同的是加权式多模型软测量建模方法采用G-K模糊聚类算法对数据进行聚类，切換式多模型软测量建模方法采用最小距离分类对数据进行聚类；接着再根据数据分类结果分别采用不同的子模型预测方案进行子模型预测，最后再根据两种建模方法的不同分别将子模型预测结果进行基于加权或基于切换的优化，从而得到不同多模型软测量建模方法下的预测結果。所述的基于半监瞀回归的学习方法指的是通过将半监瞀核引入一种监瞀回归学习算法目标方程中的方法，将其变为ー种基于半监瞀回归的学习算法，接着再通过对这种半监瞀学习方法的目标函数进行最小值求解，从而得到当目标函数取得最小值时某些未知变量的值，最后再通过这些未知变量的值来描述系统函数关系的一种学习方法。所述的以数据聚类算法为基础的多模型软测量模型指的是在软测量模型建模之前，首先通过数据聚类将作为模型输入的辅助变量数据根据它们之间的相似性进行分类，接着在根据分类结果采用不同的建模策略将ー个系统拆分为多个软测量子模型共同进行变量预测，最后再把多个子模型的预测结果进行合并，形成ー种多模型的软测量模型预测結果。这里的数据聚类算法可以分为模糊聚类和硬聚类，所谓模糊聚类是指一种不严格的聚类，即某ー个数据点并不完全属于ー个类别，数据点对各个类别的所述关系通过模糊隶属度来表现，模糊隶属度是ー个范围在O到I内的小数，该小数越大，代表数据点与某ー类别中的数据越相似，此外，同一数据点对所有类别的模糊隶属度加和为I;所谓硬聚类是指一种严格的聚类，即某一个数据点是只能严格地属于某一个类别，这种方法不存在隶属度的概念，对某ー数据点的所属关系来说，是非此即彼的。所述的加权式多模型软测量建模方法指的是首先利用G-K模糊聚类算法对输入数据点进行聚类分析，得到聚类中心和每个数据点的模糊隶属度，接着根据类别的特点建立与类别数相等的子模型进行软測量模型主导变量的预测，最后再以每个数据点的模糊隶属度为加权系数对该数据点的所有子模型预测结果进行加权计算，最終得到ー个基于加权的多模型软测量模型预测結果。如图I所示，它的步骤如下①分析事先获得的一部分数据，找出子エ况(类别)数C，其中c可以根据经验给定或者通过其他聚类算法进行分析。②分别为每个类别选择子模型建模方法，并优化參数，使得该模型对所属类别的数据预测效果最优。③读取输入数据Xp使用所有的子模型对进行预测，得到子模型预测结果
·Λ④预测结束，转⑤；预测未结束j=j+l，转③。⑤对输入数据集X进行G-K聚类分析，将X分为c个类别，得到隶属度矩阵U，根据式下式计算多模型输出F = Ui Yi
i~l其中Ui为第i个类别对X中所有数据的隶属度向量，ξ为X中所有数据在第i个子模型下的预测結果。⑥输出所有数据的多模型预测结果y。所述的切換式多模型软测量建模方法指的是首先对作为输入的辅助变量数据进行聚类分析，得到数据的聚类数和聚类中心；接着采用最小距离分类方法对输入数据进行分类，这里的最小聚类分类指的是通过计算某一数据点到各个聚类中心的距离来判定该数据点属于哪个类别，取距离最小的类别为该数据点的所属类别；然后再根据分类结果建立各个类别的软测量子模型对其中的数据进行预测；最后取所有类别中数据的预测结果的并集，直接作为这种多模型软测量方法的预测结果集。如图2所示，这种方法的步骤如下①获取全部输入数据并进行聚类分析，将所有的数据分为c个类别，并得到c个类别的聚类中心V= {vj ,1 = 1,2, ...，Co②获取一个输入数据点Xp利用下式计算其到每个聚类中心的欧氏距离。(Ii= I I Xj-Vi I
③得到d最小的类别P，并把归类为这ー类别，将其加入到Xp。④所有数据读取结束，转⑤；所有数据未读取结束，转②。⑤检查每个类别的标记样本数目是否少于n，若是，转⑥，否则转⑦。⑥对标记样本数目少于η的类别，从另外c-Ι个类别中各抽取一半的标记样本与其自身的标记样本集合并，共同作为该类别的标记样本集。⑦分别对c个类别的数据集选取子模型建模方法并优化參数，进行预测
Aγ, ==⑧合并所有子模型预测结果，得到多模型预测结果
ΛΓ = F1U F2U…U》:.，/■ = U2,.",C与现有技术相比，本发明具有如下有益效果I.在传统软测量方法中，一般仅仅对输入进行单ー模型的建立,本发明提供的两种基于半监瞀回归的多模型软测量建模方法可以有效降低因为过程复杂化带来的模型不准确问题。2.加权式多模型软测量建模方法是ー种基于模糊聚类的方法，这种方法不要求事先就对输入数据进行分类，所以只要子模型采取在线建模方法，就可以对数据进行实时分类而在线地得到预测結果。3.切換式多模型软测量建模方法子模型因为仅仅只对一部分相似的输入数据进行预测，所以它的模型预测准确度比较高，可以很好地根据エ况情况对数据进行区分预测。本发明在エ业软測量建模方法领域有着广泛的应用前景。

图I是加权式多模型软测量建模方法流程图。图2是切换式多模型软测量建模方法流程图。图3是多模型软测量建模方法子模型A对烟气含氧量的预测效果图。图4是多模型软测量建模方法多模型对烟气含氧量的预测效果图。
具体实施例方式本发明中所述的基于半监瞀回归的学习方法指的是通过将半监瞀核引入ー种监瞀回归学习算法目标方程中的方法，将其变为ー种基于半监瞀回归的学习算法，接着再通过对这种半监瞀学习方法的目标函数进行最小值求解，从而得到当目标函数取得最小值时某些未知变量的值，最后再通过这些未知变量的值来描述系统函数关系的一种学习方法。
下面对本发明的实施例作详细说明，本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。实施例本实施例利用某电厂1000MW实测数据进行基于加权式多模型软测量建模方法的烟气含氧量预测，包括以下步骤首先，了解研究对象，选取辅助变量和主导变量；其次，根据数据特点选取子模型并选取适应于该子模型数据的最优參数；再次，对输入数据进行多个子模型的预测，得到多组的预测结果；最后，利用G-K模糊聚类算法对输入数据进行聚类得到模糊隶属度矩阵，并利用模糊隶属度为加权系数对多组子模型预测结果进行加权计算。在评价建模方法的性能时使用了以下指标相对均方根误差(RMSE)，它的计算公式如下
权利要求
1.一种基于半监瞀回归学习的多模型软测量方法，其特征在于，包括如下步骤步骤ー对数据进行聚类；步骤ニ根据数据分类结果采用多个子模型预测方案共同进行子模型预测，获得子模型预测结果；步骤三将多个子模型预测结果进行合并，得到预测結果。
2.根据权利要求I所述的基于半监瞀回归学习的多模型软测量方法，其特征在于，所述步骤一，具体为以加权式多模型软测量建模方法采用G-K模糊聚类算法对数据进行聚类。
3.根据权利要求2所述的基于半监瞀回归学习的多模型软测量方法，其特征在于，所述步骤三，包括步骤将子模型预测结果进行基于加权的优化。
4.根据权利要求I至3中任一项所述的基于半监瞀回归学习的多模型软测量方法，其特征在于，所述步骤一，具体为以切换式多模型软测量建模方法采用最小距离分类算法对数据进行聚类。
5.根据权利要求4所述的基于半监瞀回归学习的多模型软测量方法，其特征在干，所述步骤三，包括步骤将子模型预测结果进行基于切换的优化。
6.根据权利要求I至5中任一项所述的基于半监瞀回归学习的多模型软测量方法，其特征在干，具体为在软测量模型建模之前，首先通过数据聚类将作为模型输入的辅助变量数据根据它们之间的相似性进行分类，接着再根据分类结果采用不同的建模策略将ー个系统拆分为多个软测量子模型共同进行变量预测，最后再把多个子模型的预测结果进行合并，形成ー种多模型的软测量模型预测結果。
7.根据权利要求I至6中任一项所述的基于半监瞀回归学习的多模型软测量方法，其特征在于，所述对数据进行聚类包括模糊聚类以及硬聚类，其中，模糊聚类是指一种不严格的聚类，即某ー个数据点并不完全属于ー个类别，数据点对各个类别的所述关系通过模糊隶属度来表现，模糊隶属度是ー个范围在O到I内的小数，该小数越大，代表数据点与某一类别中的数据越相似，此外，同一数据点对所有类别的模糊隶属度加和为I;硬聚类是指一种严格的聚类，即某一个数据点是只能严格地属于某一个类别，这种方法不存在隶属度的概念，对某ー数据点的所属关系来说，是非此即彼的。
8.根据权利要求2至7中任一项所述的基于半监瞀回归学习的多模型软测量方法，其特征在于，加权式多模型软测量建模方法指的是首先利用G-K模糊聚类算法对输入数据点进行聚类分析，得到聚类中心和每个数据点的模糊隶属度，接着根据类别的特点建立与类别数相等的子模型进行软測量模型主导变量的预测，最后再以每个数据点的模糊隶属度为加权系数对该数据点的所有子模型预测结果进行加权计算，最終得到一个基于加权的多模型软测量模型预测結果。
9.根据权利要求4至8中任一项所述的基于半监瞀回归学习的多模型软测量方法，其特征在于，所述的切換式多模型软测量建模方法指的是首先对作为输入的辅助变量数据进行聚类分析，得到数据的聚类数和聚类中心；接着采用最小距离分类方法对输入数据进行分类，这里的最小聚类分类指的是通过计算某一数据点到各个聚类中心的距离来判定该数据点属于哪个类别，取距离最小的类别为该数据点的所属类别；然后再根据分类结果建立各个类别的软测量子模型对其中的数据进行预测；最后取所有类别中数据的预测结果的并集，直接作为这种多模型软测量方法的预测结果集。
全文摘要
本发明提供一种基于半监督回归学习的多模型软测量方法，包括步骤步骤一对数据进行聚类；步骤二根据数据分类结果采用多个子模型预测方案共同进行子模型预测，获得子模型预测结果；步骤三将多个子模型预测结果进行合并，得到预测结果。本发明可以有效降低因为过程复杂化带来的模型不准确问题。加权式多模型软测量建模方法不要求事先就对输入数据进行分类，所以只要子模型采取在线建模方法，就可以对数据进行实时分类而在线地得到预测结果。切换式多模型软测量建模方法子模型因为仅仅只对一部分相似的输入数据进行预测，所以它的模型预测准确度比较高，可以很好地根据工况情况对数据进行区分预测。
文档编号G06N7/02GK102693452SQ201210148588
公开日2012年9月26日申请日期2012年5月11日优先权日2012年5月11日
发明者张曦, 李哲, 王国良, 阎威武, 陈世和申请人:上海交通大学, 广东电网公司电力科学研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：阎威武;李哲;王国良;陈世和;张曦
技术所有人：上海交通大学;广东电网公司电力科学研究院
我是此专利的发明人

上一篇：一种中文超短文本的水印嵌入和提取方法
上一篇：基于容器的处理方法、装置和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。