一种高炉铁水硅含量的变量选择预报方法_2

文档序号:8922792阅读:来源:国知局
线性回归。在特征空 间中构建一个线性回归函数
,这里《是特征空间的向量。假如所有训练数 据都可以在精度e下用线性函数拟合,考虑到允许拟合的情况,引入松弛因子|,〇0, 根据结构风险最小化原则,我们可以得到:
[0056] e> 0,|i,| 0,i= 1,2,…N
[0057] 其中,参数vG[0, 1]用来控制支持向量的个数或者错误样本点的个数,〇0表 示惩罚因子,用来对超出拟合平面的点进行惩罚。我们可以得到上述最优化问题的对偶问 题为:
[0061] 其中
a,和 < 表示拉格朗日乘子。在解决这个问题的过程 中,非零的拉格朗日乘子对应的训练样本称为支持向量,拟合的超平明完全有支持向量决 定:
[0063] 其中
定义为核函数,满足莫斯条件的函数都可以被称为核函 数,这里,我们使用高斯核函数,定义如下:
[0065] 所述的采用粒子群算法对支持向量机的模型参数进行优化:
[0066] 模型中的参数v,惩罚因子C和核函数中的参数〇都对模型的预测精度有很大的 影响,采用具有全部搜索能力的粒子群算法来选择这三个参数。以回归模型的验证样本集 的均方根指标^
为适应度函数,其中验证集样本的真实值,另验 证样本根据训练好的模型得到的预测值,N为验证样本的个数。
[0067]实施例
[0068] 为验证本发明所提方法的有效性,采用某钢厂2500m3高炉的实际生产数据进行铁 水硅含量预报应用实验。选取包括炉顶压力、炉顶温度、料速、炉顶煤气中的co、co2和上一 炉的硅含量作为硅含量预测模型的输入变量。在模型训练和模型预测过程中使用的所有变 量的采样数据,均采用以铁水出炉炉次为单位的测量平均值作为采样和预报周期。
[0069] 实验中共采集了 1000炉的样本数据,其中连续900炉作为建模时的训练样本,时 间上较晚的另外100炉作为测试样本。
[0070] 接下来结合该具体过程对本发明的实施步骤进行详细的阐述:
[0071] 1)对获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据的归一化;
[0072] 2)使用多变量相关性分析方法和斯皮尔曼等级相关性分析方法对样本数据的变 量选择;
[0073] 3)确定高炉铁水硅含量预报的模型输入变量,输入变量包括炉顶压力、炉顶温度、 料速、炉顶煤气中的C0、C02和上一炉的硅含量;
[0074] 4)使用支持向量机算法建立高炉铁水硅含量预报的模型;
[0075] 5)采用粒子群算法对高炉硅含量预报的模型参数进行优化。
[0076] 所述的对于获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据 的归一化方法为:<=(Xi-minXi)/(maxXi-minXi),其中xjflXi"'分别表示归一化前后的 值,maxxJPminXi分别表示样本数据中的最大和最小值。
[0077] 所述的对于使用多变量相关性分析方法和斯皮尔曼等级相关性分析方法对样本 数据的变量选择,其中多变量相关性分析的方法为:
[0079] 其中x和y分别表示任意两个变量,cov(x,y)表示变量x和y的协方差矩阵。当x =7时,1'(1,7)=1表示具有完全线性相关性,1'(1,7)=0表示具有不完全相关性,1'(1,7) =-1表示具有完全负线性相关性。使用多变量相关性分析的方法能够很好的衡量高炉变 量之间的线性相关性。斯皮尔曼等级相关性系数方法为:
[0081] 其中N是变量样本的个数,d(Xi,yi)表示两个变量每一对样本的等级的差。
[0082] 所述的对于变量选择的方法结合多变量相关性分析方法和斯皮尔曼等级相关性 分析方法,选择多个变量平均相关性系数小于〇. 15的变量作为输入变量。
[0083] 所述的使用支持向量机算法建立高炉铁水硅含量预报的模型为:
[0084] 记模型输入变量数据样本为(Xi,yi),i=1,2,…N,XiGRn,其中Xi为输入变量, yi是对应的输出变量,N是变量样本的个数。#?)是一个将输入变量x映射到高维特征空间 的非线性映射,在特征空间进行线性回归就对应于低维输入空间的非线性回归。在特征空 间中构建一个线性回归函数= + ,这里《是特征空间的向量。假如所有训练数 据都可以在精度e下用线性函数拟合,考虑到允许拟合的情况,引入松弛因子|,〇0, 根据结构风险最小化原则,我们可以得到:
[0088] e彡 | " | 广彡 〇,i= 1,2,…N
[0089] 其中,参数vG[0, 1]用来控制支持向量的个数或者错误样本点的个数,〇0表 示惩罚因子,用来对超出拟合平面的点进行惩罚。我们可以得到上述最优化问题的对偶问 题为:
[0093] 其中
,a,和 <表示拉格朗日乘子。在解决这个问题的过程 中,非零的拉格朗日乘子对应的训练样本称为支持向量,拟合的超平明完全有支持向量决 定:
[0095] 其中
定义为核函数,满足莫斯条件的函数都可以被称为核函 数,这里,我们使用高斯核函数,定义如下:
[0097] 所述的采用粒子群算法对支持向量机的模型参数进行优化:
[0098] 模型中的参数v,惩罚因子C和核函数中的参数〇都对模型的预测精度有很大的 影响,采用具有全部搜索能力的粒子群算法来选择这三个参数。以回归模型的验证样本集 的均方根指标
为适应度函数,其中验证集样本的真实值,兑 验证样本根据训练好的模型得到的预测值,N为验证样本的个数。
[0099] 在用PS0优化参数得到y= 0. 44,C= 4. 90, 〇 = 0. 6。用连续100炉新的生产 数据对建立的模型进行铁水硅含量预报的测试情况如图1所示。图1给出了铁水硅含量预 报值对真实化验值的跟踪效果,从图2的预报误差曲线可以看出,100炉铁水的硅含量预报 的误差小于〇. 1的比例为86 %,高于其他变量选择方法,且其变化趋势很好的逼近了真实 情况。
【主权项】
1. 一种高炉铁水硅含量的变量选择预报方法,其特征在于,包括如下步骤: 1) 对获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据的归一化; 2) 使用多变量相关性分析和斯皮尔曼等级相关性分析的方法对样本数据变量进行相 关性分析; 3) 确定高炉铁水硅含量预报的模型输入变量,输入变量包括炉顶压力、炉顶温度、料 速、炉顶煤气中的CO、CO2和上一炉的硅含量; 4) 使用支持向量机算法建立高炉铁水硅含量预报的模型; 5) 采用粒子群算法对高炉硅含量预报的模型参数进行优化。2. 根据权利要求1所述的方法,其特征在于,步骤1)所述的对于获取的高炉铁水硅 含量预报模型的相关变量进行预处理,对样本数据的归一化方法为:Xi#= (Xi-Hiinxi)/ (maxxi-minxi),其中xJP X ^分别表示归一化前后的值,maxx JP minx冷别表示样本数据 中的最大和最小值。3. 根据权利要求1所述的方法,其特征在于,步骤2)所述的对于使用多变量相关性分 析方法和斯皮尔曼等级相关性分析方法对样本数据的变量选择,其中多变量相关性分析的 方法为:其中X和y分别表示任意两个变量,cov (X,y)表示变量X和y 的协方差矩阵,当X = y时,r(x, y) = 1表示具有完全线性相关性,r(x, y) = 0表示具有不 完全相关性,r(x,y) = -1表示具有完全负线性相关性;斯皮尔曼等级相关性分析方法为:其中N是变量样本的个数,d(Xi,yi)表示两个变量每一对样本的等级的差。4. 根据权利要求1所述的方法,其特征在于,步骤3)所述的输入变量选择平均相关性 系数小于〇. 15的变量。5. 根据权利要求1所述的方法,其特征在于,步骤4)使用支持向量机算法建立高炉铁 水硅含量预报的模型为:记模型输入变量数据样本为(Xi,yi),i = 1,2,…N,Xie Rn,其中 Xi为输入变量,y i是对应的输出变量,N是变量样本的个数。Ρ(·)是一个将输入变量X映射 到高维特征空间的非线性映射,在特征空间进行线性回归就对应于低维输入空间的非线性 回归,在特征空间中构建一个线性回归函数/(.v) = w>(x) + d,这里ω是特征空间的向量, 假如所有训练数据都可以在精度ε下用线性函数拟合,考虑到允许拟合的情况,引入松弛 因子ξ,O 〇,根据结构风险最小化原则,得到最优化问题:其中,参数〃 e [〇,1]用来控制支持向量的个数或者错误样本点的个数,C彡ο表示惩罚 因子,用来对超出拟合平面的点进行惩罚;上述最优化问题的对偶问题为:其中a Jp <表示拉格朗日乘子,在解决这个问题的过程中,非 零的拉格朗日乘子对应的训练样本称为支持向量,拟合的超平面完全由支持向量决定:其中(X ,,X) =;) ?河X)定义为核函数,所述的核函数为高斯核函数,定义如下:6.根据权利要求5所述的方法,其特征在于,步骤5)所述的采用粒子群算法对支 持向量机的模型参数进行优化:模型中的参数V,惩罚因子C和核函数中的参数σ采 用具有全部搜索能力的粒子群算法来选择,以回归模型的验证样本集的均方根指标:为适应度函数,其中Yi为验证集样本的真实值,J,,验证样本根据训 练好的模型得到的预测值,N为验证样本的个数。
【专利摘要】本发明公开了一种高炉铁水硅含量的变量选择预报方法。以高炉铁水硅含量预报模型的高炉工艺参数为输入变量,在对输入变量的样本数据进行归一化预处理后,采用多变量相关性分析方法和斯皮尔曼等级相关性分析方法对输入变量的样本数据进行变量选择,消除生产工艺参数之间的相关性,使用支持向量机算法建立高炉铁水硅含量预报模型,引入粒子群算法以优化模型参数。对高炉冶炼过程的铁水硅含量预报具有普遍的通用性,可获得较好的预报精度,提高高炉铁水硅含量的预报命中率。
【IPC分类】G06F19/00
【公开号】CN104899425
【申请号】CN201510230749
【发明人】马淑艳, 杨春节, 宋菁华
【申请人】浙江大学
【公开日】2015年9月9日
【申请日】2015年5月7日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1