一种基于半监督极限学习机的铝电解过热度识别方法与流程

文档序号:17361059发布日期:2019-04-09 22:04阅读:212来源:国知局
一种基于半监督极限学习机的铝电解过热度识别方法与流程

本发明涉及工业控制领域,具体涉及一种基于半监督极限学习机的铝电解过热度识别方法。



背景技术:

现代工业中,如何保证生产安全,提高产品质量具有重要的研究价值,过程监测技术正是在这一背景下产生的。对于流程工业而言,精确的数学机理模型和完备的专家知识往往很难得到,造成了在线检测困难,成本高等局面。

基于数学模型和基于知识的过程监测方法通常难以实际应用的局面,随着集散控制系统(dcs)和各种智能化仪表在流程工业中的广泛使用,大量的过程数据被采集并存储起来,因此基于数据驱动的过程监测方法在过去的十几年中得到了长足的发展,该方法的主要思想是对过程的输入输出数据进行信息处理和特征提取,从而监控过程的状态变化,该方法回避了过程建模的问题,有效的减轻了对过程知识的依赖性,适用于大型工业监控,已经成为近年来的研究热点。其主要方法包括elm方法。

大多数elm方法主要应用在监督学习领域,监督学习需要获取大量的有标签数据进行训练,然而在铝电解生产过程中,大量的数据是无标签的,人工给数据打标签是一种繁琐,沉重而又昂贵的工作,并且随着有经验的工人日益缺乏及流失,人工判断过热度存在很大的局限性。

ss-elm方法是一种半监督的机器学习方法,与传统的数据挖掘方法相比,由于其优秀的泛化能力及训练速度,在工业系统故障检测中取得了一定的成果,但由于工业系统的多工况数据和标签的收集是十分困难和昂贵的,某些模式(特别是故障模式)在工业系统中式罕见的和多样的,因此对于工业过程的软测量识别方法是存在困难的。

利用ss-elm方法进行铝电解工业过程过热度在线检测需要解决的主要问题:人工标签困难问题和传统正则化问题。

1.人工观测火眼不足

人工观测火眼来辨识槽况有以下不足:1)工人观察火眼的水平参差不齐,导致不同工人在同一时刻对同一个电解槽的观测结果不一样;2)浪费大量的人力资源;3)人工观测火眼的经验知识很难得到传承;4)长期依赖人工观察火眼操作会造成的生产过程不稳定、产品质量一致性差、能源消耗大;5)人工观察不能实现连续观测,难以实现槽况变化的敏感决策。可见,当前铝电解企业依赖人工经验辨识槽况,无法满足我国铝电解行业的节能降耗减排和进一步提高生产效益的需求。

2.传统正则化问题

传统的laplacian正则化沿着数据分布流形的图laplacian在一定范围外是一个常数函数,这意味着超出样本点范围之外的解都是常数函数,因此模型的推断能力受到限制,且随着有标签样本数的减少,laplacian正则化模型的学习性能会急剧的下降。



技术实现要素:

本发明的目的在于克服现有技术中存在的缺陷,提供一种基于半监督极限学习机的铝电解过热度识别方法,该方法能够充分发掘无标签数据中隐含的信息,克服传统laplacian正则化的推断力弱的问题,且训练速度较传统方法快,能实现对工业系统的过热度状态的进行准确实时监测。

本发明采用以下技术方案:

一种基于半监督极限学习机的铝电解过热度识别方法,其特征在于,所述方法包括:

s1、收集铝电解实时生产数据,对收集到的数据进行归一化处理和标准化处理;

s2、构造hessian正则化算子;

s3、计算极限学习机elm模型的隐层输出;

s4、构造所述elm模型的损失函数,求解输出权值矩阵。

进一步,所述方法还包括:所述收集到的数据的样本属性为其中x1,x2...xu分别为:当前工作电流、槽电阻、al2o3设定下料间隔、al2o3实际下料间隔、铁含量、硅含量、电解质水平、铝水平、分子比、平均槽电压、alf3含量。

进一步,在对收集到的数据进行归一化处理和标准化处理之前还包括:根据专家经验给部分数据样本打上标签。

进一步,所述s2包括:

给定l个标记样本和u个未标记样本给定一个光滑流形对于样本点xi∈m,可以定义样本点的局部正切空间对于上xi点的映射函数定义为fi为预测标签,hessian能写成如下的实值函数:

其中,代表的二阶偏导数,dv(x)表示体积单元。

进一步,所述方法还包括:

在xi的正交坐标系xr中,可以得到:

即给定一个点xi,的二阶偏导数恰为在正交坐标系中的hessian的frobenius范数;

其中,α表示有标签样本的序列数,β为无标签样本的序列数。

进一步,所述方法还包括:

其中,是在点xt∈nk(xi)的正交坐标系xr下的xi的局部hessian算子,其中nk(xi)表示xi的一组k个最近邻,采用最小二乘法求解一个二阶多项式可以得到所述局部hessian算子;

xi点处的的hessian矩阵的frobenius范数可以近似表示为:

其中

hessian能的表达式如下:

其中n表示训练数据的大小;

最终得到hessian正则化tr(fthf),f为函数的frobenius算子。

进一步,所述s3包括:

假设含有输入变量x∈rn×m和输出变量y∈rn×r的n个训练样本,m和r分别代表维度;

通过sigmoid函数实现随机映射:

j(x;θ)=(1+exp(-(wtx+b)))-1

其中θ={w,b}是映射函数的参数,w为权值输入层到隐层的权值矩阵,b为偏置向量;

通过求解下面的非约束优化问题获得隐层的输出权值:

其中c表示惩罚系数。

进一步,所述s4包括:

引入hessian正则项到半监督极限学习机模型中得到:

yi=j(xi)β,i=1,...,l+u

其中,ei表示第i个样本的样本误差,h∈r(l+u)×(l+u)是有标签数据和无标签数据构造的hessian矩阵,h∈r(l+u)×n是与所有输入样本相关的隐层节点值;

对γlh-elm求微分并令结果等于0,得到输出权重的解如下:

其中表示nh×nh的单位矩阵;

当有标签数据少于隐层神经元节点时,输出权重的解为:

β*=jt(il+u+cjjt+λhjjt)-1cy

其中il+u表示(l+u)×(l+u)的单位矩阵。

本发明的优点和有益效果在于:

本发明提出一种基于半监督极限学习机的铝电解过热度识别方法,该方法能够充分发掘无标签数据中隐含的信息,克服传统laplacian正则化的推断力弱的问题,且训练速度较传统方法快,能实现对工业系统的过热度状态的进行准确实时监测。

附图说明

图1为本发明基于半监督极限学习机的铝电解过热度识别方法流程示意图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

实施例1

如图1所示,本发明提供一种基于半监督极限学习机的铝电解过热度识别方法,所述方法包括:

s1、收集铝电解实时生产数据,对收集到的数据进行归一化处理和标准化处理;

s2、构造hessian正则化算子;

s3、计算极限学习机elm模型的隐层输出;

s4、构造所述elm模型的损失函数,求解输出权值矩阵。

下面对本发明的方法做进一步详细阐述。

1.极限学习机

极限学习机是一种有效决定单隐层前馈神经网络参数的训练算法。当在进行层次极限学习机训练的时候,假设含有输入变量x∈rn×m和输出变量y∈rn×r的n个训练样本,m和r分别代表维度。极限学习机的目标是学习到输出的一个近似函数去估计y值。一般而言,极限学习机的训练方法包括两步:随机映射与参数求解。随机映射的步骤是用合适大小的随机产生的映射节点去构造隐层结构,映射通常通过sigmoid函数实现:

j(x;θ)=(1+exp(-(wtx+b)))-1(1)

其中θ={w,b}是映射函数的参数。

因为隐层函数的参数是随机产生的,其余的参数,隐层和输出层之间的输出权重参数能够通过求解一个正则化的最小二乘方法求得。将隐层的输出向量定义为j(x)∈rn×n,n是隐层节点的数目。得到了输出权重γ∈rn×r,网络的输出就可以用下面的公式给出:

在参数求解步骤中,输出权值的获得是通过求解下面的非约束优化问题:

对γelm求微分并令结果等于0,得到下面的式子:

如果隐层输出矩阵j是列满秩的,即通常是训练样本数比隐层节点数更大的情况,对公式(4)求解得到的结果为:

相反,如果隐层输出矩阵j是行满秩的,意味着隐层节点数比训练样本数少,这时得到的最优解可以表示为:

其中in是n维单位矩阵。

2.hessian正则化

在半监督学习中,假设给定l个标记样本和u个未标记样本给定一个光滑流形对于样本点xi∈m,可以定义样本点的局部正切空间对于上xi点的映射函数定义为fi为预测标签,hessian能写成如下的实值函数:

其中,代表的二阶偏导数,dv(x)表示体积单元。

在光滑流形m的正交坐标系中,上式中的hessian能可以通过一个简单的计算获得。在xi的正交坐标系xr中,可以得到:

即给定一个点xi,的二阶偏导数恰为在正交坐标系中的hessian的frobenius范数。

设nk(xi)表示xi的一组k个最近邻,在其k个最近邻上进行pca,其中l个最大特征值对应的特征向量表示为局部正切空间的正交偏移量。此时,根据该正切空间我们可以获得最近邻点xt∈nk(xi)(1≤t≤k)的正交坐标系xr。在xi点的hessian能可以表示为:

其中,是在点xt∈nk(xi)的正交坐标系xr下的xi的局部hessian算子,采用最小二乘法求解一个二阶多项式可以得到hessian算子。

的正交坐标系下求解二阶多项式q(x),则有:

上式中的零阶项即为当最近邻的个数趋近于0时,q(x)转换为在点xi处的二阶泰勒展开式:

其中nsr=nrs,为了求解二阶多项式,采用标准线性最小二乘法来实现:

上式中φ∈rk×p为设计矩阵,其中p=l+l(l+1)/2。对应的基函数φ是最近邻点xi∈nk(xi)的正交坐标系的单项式,其解v∈rp是ν=φ+f,其中f=(f1,..f.k,)t∈rkφ+为φ的伪逆矩阵。

xi点处的的hessian矩阵的frobenius范数可以近似表示为:

其中

hessian能的表达式如下:

其中n表示训练数据的大小;

最终得到hessian正则化tr(fthf)。

3.软测量模型

引入hessian正则项到半监督极限学习机模型中得到:

yi=j(xi)β,i=1,...,l+u(15)

其中,h∈r(l+u)×(l+u)是有标签数据和无标签数据构造的hessian矩阵,h∈r(l+u)×n是与所有输入样本相关的隐层节点值。对γlh-elm求微分并令结果等于0,得到输出权重的解如下:

当有标签数据少于隐层神经元节点时,输出权重的解为:

β*=jt(il+u+cjjt+λhjjt)-1cy(17)

其中il+u表示(l+u)×(l+u)的单位矩阵。

实施例2

高效铝电解工艺一直是一个具有挑战性的工业问题。但由于各种外部条件和人工操作的复杂的物理和化学反应和干扰,铝电解过程往往工作在许多不同的工况,这就增加了铝电解过程监测的难度。在铝电解过程中,主要通过人工观察电解质、火眼等识别过热度,电解槽过热度的在线识别方法目前还没能解决,因此,选取了12个过程变量进行软测量建模。数据集来自山东魏桥铝业公司400ka两台电解槽的实时生产数据,选取了两台电解槽各1200个日常数据样本作为训练数据,其中500为有标签数据用于训练模型,另外300用于获得最佳的模型参数,其余的400是测试样本,用以验证本专利所提方法的有效性。

1.训练数据预处理(归一化,标准化)

对收集到的数据进行归一化处理和标准化处理。归一化公式是通过原始数据进行线性变换把数据映射到[0,1]之间,变换公式如下:

常用的标准化方法是z-score标准化,经过处理后的数据均值为0,标准差为1,处理方法是:

按照专家经验将过热度分为三类,即“high”,“middle”,“low”。依据现场经验知识获得时基的取值范围,其中过热度状态为“high”时基取值范围为[0.6,1],过热度状态为“middle”时基取值范围为[0.4,0.6],过热度状态为“low”时基取值范围为[0,0.4]。

2.elm模型初始化参数设置

初始化elm隐含层节点个数及输入权值。根据训练样本的大小,隐层节点的个数设置为200,隐层权重矩阵由初始化函数产生,区间为[0,1]。

3.计算hessian正则化算子及隐层输出结果

依据上述公式(3)对所有训练样本计算hessian正则化算子。

4.计算输出权值矩阵

利用公式(5)或者公式(6)计算输出权值。

本发明提供的方法能充分利用无标签数据中的隐含信息提高精度,克服了传统laplacian正则化的推断力弱的问题,且训练速度较传统方法快,能实现对工业系统的过热度状态的进行准确实时监测。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1