一种高炉铁水硅含量的变量选择预报方法

文档序号:8922792阅读:527来源:国知局
一种高炉铁水硅含量的变量选择预报方法
【技术领域】
[0001] 本发明涉及高炉铁水硅含量的变量选择预报方法。
【背景技术】
[0002] 高炉生产是在封闭条件下进行复杂的化学、动力学、热力学变化过程,是一个复 杂、高度耦合的非线性系统。保持合理的炉温是高炉生产稳定的关键因素之一。在冶炼过 程中,炉温控制在正常范围,高炉就顺行。如果炉温控制发生异常波动,行程"过热"或"过 冷",则容易诱发炉况故障。炉温控制的好坏直接影响炉况的波动,而炉况状态又决定着炉 温的控制模式。所以高炉冶炼生产过程综合自动控制技术难度宄其原因在于建立精确合 理高炉炉温控制数学模型,由于过程的复杂性及测量上的困难,一般通过高炉铁水硅含量 (一般称为化学热)来间接的反映炉内的温度变化,判断高炉炉缸热状态。高炉铁水硅含量 成为反映炉内物理化学反应情况、热状况和生铁质量的一个很重要的指标,其变化的幅度 和频率直接反映了冶炼过程的稳定性。铁水硅含量是评定高炉炉况稳定性和生铁质量的重 要指标,也是表征高炉热状态及其变化的标志之一。为了有效的控制高炉炉况稳定性,获取 高炉内部热状态的变化情况,建立高炉铁水硅含量预报方法非常重要。
[0003] 长期以来,国内外研宄人员根据高炉炼铁内部所发生的化学反应和传递现象建立 了多种机理数学模型,这些模型在理论上对于揭示高炉内部现象和反应高炉炼铁机理起了 一定的积极作用,但是也存在着准确性低及计算耗时等缺点。鉴于此,数据驱动技术正在广 泛的研宄,以试图实现对高炉炼铁过程的实时模拟和控制,数据驱动建模技术是以描述数 据的特征作为建模的主要准则,在数据为自身说话的信念之下,分析系统变量间的相关关 系。目前,利用数据驱动的思想建立的高炉铁水硅含量预测的模型主要有自回归模型、神经 网络模型、非线性时间序列分析模型、模糊模型、贝叶斯网络模型、偏最小二乘模型、支持向 量机模型等,这些模型在预测高炉铁水硅含量时,大多都利用了高炉数据采集到的全部相 关变量作为自变量,但是由于高炉现场强噪声的环境和高炉数据本身的强相关性,引用全 部的变量值作为自变量虽然能充分利用高炉丰富的数据特征,同时也带入了很大的噪声, 给硅含量的预测准确性提供了很大的阻碍。

【发明内容】

[0004] 为了克服现有技术的不足,本发明提供一种高炉铁水硅含量预报的变量选择预报 方法。
[0005] 方案如下:
[0006] -种高炉铁水硅含量预报的变量选择预报方法,包括以下步骤:
[0007] 1)对获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据的归一 化;
[0008] 2)使用多变量相关性分析方法和斯皮尔曼等级相关性分析的方法对样本数据的 变量选择;
[0009] 3)确定高炉铁水硅含量预报的模型输入变量,输入变量包括炉顶压力、炉顶温度、 料速、炉顶煤气中的C0、C02和上一炉的硅含量;
[0010] 4)使用支持向量机算法建立高炉铁水硅含量预报的模型;
[0011] 5)采用粒子群算法对高炉硅含量预报的模型参数进行优化。
[0012] 所述的对于获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据 的归一化方法为:<=(Xi-minXi)/(maxXi-minXi),其中xjflXi"'分别表示归一化前后的 值,maxxJPminXi分别表示样本数据中的最大和最小值。
[0013] 所述的对于使用多变量相关性分析方法和斯皮尔曼等级相关性分析方法对样本 数据的变量选择,其中多变量相关性分析的方法为:
[0015] 其中x和y分别表示任意两个变量,cov(x,y)表示变量x和y的协方差矩阵。当x =7时,1'(1,7)=1表示具有完全线性相关性,1'(1,7)=0表示具有不完全相关性,1'(1,7) =-1表示具有完全负线性相关性。使用多变量相关性系数分析的方法能够很好的衡量高 炉变量之间的线性相关性。斯皮尔曼等级相关性分析方法为:
[0017] 其中N是变量样本的个数,d(Xi,yi)表示两个变量每一对样本的等级的差。
[0018] 所述的对于变量选择与预报方法,结合多变量相关性分析方法和斯皮尔曼等级相 关性系数分析方法,选择多个变量平均相关性系数小于0. 15的变量作为输入变量。
[0019] 所述的使用支持向量机算法建立高炉铁水硅含量预报的模型:记模型输入变量数 据样本为(Xi,yi),i= 1,2,…N,XiGRn,其中Xi为输入变量,yi是对应的输出变量,N是变 量样本的个数。舛?)是一个将输入变量x映射到高维特征空间的非线性映射,在特征空间 进行线性回归就对应于低维输入空间的非线性回归。在特征空间中构建一个线性回归函数
,这里《是特征空间的向量。假如所有训练数据都可以在精度e下用线 性函数拟合,考虑到允许拟合的情况,引入松弛因子I,〇0,根据结构风险最小化原则, 我们可以得到:
[0023] e彡 〇, |i,〇 〇,i= 1,2,…N
[0024] 其中,参数vG[0, 1]用来控制支持向量的个数或者错误样本点的个数,〇0表 示惩罚因子,用来对超出拟合平面的点进行惩罚。我们可以得到上述最优化问题的对偶问 题为:
[0028]其中
,a廊 < 表示拉格朗日乘子。在解决这个问题的过程 中,非零的拉格朗日乘子对应的训练样本称为支持向量,拟合的超平明完全有支持向量决 定:
[0030] 其中私x;,x) =河x,〇,(x)定义为核函数,满足莫斯条件的函数都可以被称为核函 数,这里,使用高斯核函数,定义如下:
[0032] 所述的采用粒子群算法对支持向量机的模型参数进行优化:模型中的参数v, 惩罚因子C和核函数中的参数〇都对模型的预测精度有很大的影响,采用具有全部 搜索能力的粒子群算法来选择这三个参数。以回归模型的验证样本集的均方根指标
为适应度函数,其中yi为验证集样本的真实值,5V验证样本根据 训练好的模型得到的预测值,N为验证样本的个数。
[0033] 本发明的有益效果:
[0034] 本发明以高炉铁水硅含量预报模型的高炉工艺参数为输入变量,在对输入变量的 样本数据进行归一化预处理之后,采用多变量相关性分析和斯皮尔曼等级相关性系数分析 方法对输入变量进行相关性分析,消除生产工艺参数之间的相关性,根据分析的结果确定 输入变量,使用支持向量机算法建立高炉铁水硅含量预报的模型,引入粒子群算法以优化 模型参数。对高炉冶炼过程的铁水硅含量预报具有普遍的通用性,可获得较好的预报精度, 提高高炉铁水硅含量的预报命中率。
【附图说明】
[0035] 图1是铁水硅含量预报值和真实值的对比图;
[0036] 图2是铁水硅含量预报误差图。
【具体实施方式】
[0037] 本发明针对高炉炼铁过程的高度非线性,各个高炉生产参数之间强耦合等特点, 将支持向量机算法应用于高炉炼铁生产过程,建立基于支持向量机的高炉铁水硅含量预报 模型。本发明对高炉冶炼过程的铁水硅含量预报具有普遍的通用性,提高了高炉铁水硅含 量预报的准确性和命中率,给高炉平稳可靠运行提供技术上的保障。多变量相关性分析的 方法仅仅是从线性情况下衡量数据变量之间的相关性,而高炉数据不仅具有线性性,也有 非常强的非线性,所以仅仅使用多变量相关性分析方式是非常片面的,而斯皮尔曼等级相 关性分析的方法是根据等级资料研宄两个变量间相关关系的方法,它是依据两列成对等级 的各对等级数之差来进行计算的,对数据条件的要求没有积差相关系数严格,是由连续变 量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都 可以用斯皮尔曼等级相关来进行研宄。所以非常适合高炉数据的分析,同时结合多变量相 关性分析的方法,不仅能从线性角度,也能从非线性角度精确地衡量数据本身的相关性,给 模型的精确预测提供了保障。
[0038] 高炉铁水硅含量的变量选择预报方法包括以下步骤:
[0039] 1)对获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据的归一 化;
[0040] 2)使用多变量相关性分析方法和斯皮尔曼等级相关性分析方法对样本数据的变 量选择;
[0041] 3)确定高炉铁水硅含量预报的模型输入变量,输入变量包括炉顶压力、炉顶温度、 料速、炉顶煤气中的co、co2和上一炉的硅含量;
[0042] 4)使用支持向量机算法建立高炉铁水硅含量预报的模型;
[0043] 5)采用粒子群算法对高炉硅含量预报的模型参数进行优化。
[0044] 所述的对于获取的高炉铁水硅含量预报模型的相关变量进行预处理,对样本数据 的归一化方法为:<=(Xi-minXi)/(maxXi-minXi),其中xjflXi"'分别表示归一化前后的 值,maxxJPminXi分别表示样本数据中的最大和最小值。
[0045] 所述的对于使用多变量相关性分析方法和斯皮尔曼等级相关性分析方法对样本 数据的变量选择,其中多变量相关性分析的方法为:
[0047] 其中x和y分别表示任意两个变量,cov(x,y)表示变量x和y的协方差矩阵。当x =7时,1'(1,7)=1表示具有完全线性相关性,1'(1,7)=0表示具有不完全相关性,1'(1,7) =-1表示具有完全负线性相关性。使用多变量相关性系数分析的方法能够很好的衡量高 炉变量之间的线性相关性。斯皮尔曼等级相关性分析方法为:
[0049] 其中N是变量样本的个数,d(Xi,yi)表示两个变量每一对样本的等级的差。
[0050] 所述的对于变量选择的方法结合多变量相关性分析方法和斯皮尔曼等级相关性 分析方法,选择多个变量平均相关性系数小于〇. 15的变量作为输入变量。
[0051] 所述的使用支持向量机算法建立高炉铁水硅含量预报的模型为:
[0052] 记模型输入变量数据样本为(Xi,yi),i= 1,2,…N,XiG Rn,其中Xi为输入变量, yi是对应的输出变量,N是变量样本的个数。_?)是一个将输入变量x映射到高维特征空间 的非线性映射,在特征空间进行线性回归就对应于低维输入空间的非
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1