一种基于局部在线建模的铸坯质量预测方法与流程

文档序号:33641113发布日期:2023-03-29 02:06阅读:55来源:国知局
一种基于局部在线建模的铸坯质量预测方法与流程

1.本发明涉及钢铁冶炼技术领域,尤其涉及一种基于局部在线建模的铸坯质量预测方法。


背景技术:

2.近年来,我国钢铁行业正处于产业结构调整和优化的关键时期。在日趋激烈的市场竞争中,不断提升产品质量是钢铁企业成功发展的必经之路。连铸工序是钢铁生产流程中承上启下的重要环节,而铸坯质量直接影响最终钢铁产品质量。在连铸生产过程中,钢水洁净度较差、工艺操作不稳定、设备状况不佳等因素往往造成不同程度的铸坯质量缺陷。常见的铸坯质量问题主要包括表面裂纹、夹渣、气孔等表面缺陷和中心裂纹、偏析、夹杂、疏松、缩孔等内部缺陷。若能基于连铸实时状况对铸坯质量进行在线预测,就能有效减少或避免严重缺陷铸坯的发生率,保障后续轧制工序的顺利进行,进而达到最终产品质量要求。
3.早期的铸坯质量预测主要基于连铸生产机理来构建数学模型。不过,连铸生产过程的钢水成分、工艺操作、设备状况等影响因素与铸坯质量缺陷之间具有强耦合、非线性及不确定性关系,不少机理研究并未通透,导致数学机理模型应用范围十分有限。随着数字化、信息化技术的蓬勃发展,以数据挖掘和神经网络为代表的智能化技术应运而生,逐步走向工业应用阶段,为解决铸坯质量在线预测提供新的思路。
4.现以应用与钢铁领域连铸坯质量预测中的方法有bp神经网络、支持向量机、极限学习机等,此类方法的共同特点都是先在离线状态下对历史数据进行训练得到全局模型,再基于离线模型结合待测样本输出预测结果。然而,连铸生产是具有时变性、非线性、强耦合特征的复杂过程,时间推移、设备更新、工艺改进等客观因素往往导致模型特征与实际工况不相匹配。而上述的铸坯质量预测模型属于离线全局模型,模型建立后不会随着生产过程的改变而自适应调整,无法跟踪生产状态的变化,极易导致模型性能下降甚至失效。因此,亟须开发一种自适应能力更好、预测精度更稳定的铸坯质量预测方法。
5.即时学习算法是一种具有较高自适应能力的人工智能技术。与传统全局学习算法不同,即时学习算法采用“边建模、边预测”的运行方式,通过相似性计算选出与待测样本最相关的历史样本在线构建局部模型,实现长时间的高精度稳定预测。相似样本的选择或者样本权重的计算是即时学习算法的关键步骤,在很大程度上影响模型的预测精度。传统的样本相似性度量函数:欧氏距离、马氏距离、曼哈顿距离等,而基于上述度量函数选择的相似样本仅考虑了查询样本与历史样本输入变量的相似度,并未考虑变量之间的相关性以及生产过程的时变性,可能导致模型的预测精度不稳定。
6.因此,需要研究一种基于局部在线建模的铸坯质量预测方法来应对现有技术的不足,以解决或减轻上述一个或多个问题。


技术实现要素:

7.有鉴于此,本发明提供了一种基于局部在线建模的铸坯质量预测方法,能够解决
传统离线全局模型预测铸坯质量时自适应能力差、预测精度不稳定的问题。
8.本发明提供一种基于局部在线建模的铸坯质量预测方法,所述预测方法以支持向量回归模型为局部模型进行局部在线建模,实现在连铸过程中对铸坯质量的预测;局部在线建模的样本数据集为:采用相似度函数选择出的与待测数据最相关的历史数据集;
9.在相似度计算时,在传统欧氏距离的基础上引入工艺参数特征权重、样本时间特征权重来强化样本数据与待测数据的相关性,并根据样本相似度从历史数据集中选出最相关数据构建成样本数据集用于局部建模。
10.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述预测方法的具体步骤包括:
11.s1、获取连铸生产过程中与铸坯质量相关的工况数据以及对应的质量数据,作为初始历史数据集,
12.s2、对所述初始历史数据集进行预处理得到标准样本数据集;
13.s3、根据所述标准样本数据集建立离线随机森林模型,并通过交叉验证的方式计算得到各工艺参数的特征权重;
14.s4、对待测数据进行预处理,根据s3得到的各工艺参数的特征权重计算待测数据与所述标准样本数据集中所有样本的加权欧氏距离;
15.s5、在所述标准样本数据集中引入时间特征权重,根据所述时间特征权重和所述加权欧氏距离计算得到待测数据与所述标准样本数据集中所有样本的相似度权值;
16.s6、根据得到的相似度权值从所述标准样本数据集中选择出满足要求的样本数据,构建成相似样本数据集;
17.s7、以得到的所述相似样本数据集为训练数据构建局部模型;
18.s8、将待测数据输入构建好的局部模型中进行预测,得到预测结果。
19.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤s2中的预处理包括:空值处理、异常值处理和归一化处理。
20.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤s1中质量数据的获得方式为通过低倍检测采集得到。
21.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤s4中的预处理包括归一化处理。
22.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤s6的具体内容包括:对相似度权值进行排序,选择相似度权值最大的前nk个样本数据,构建成相似样本数据集;nk为大于1的正整数。
23.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤s8得到预测结果后,丢弃当前的局部模型。
24.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述预测方法的步骤还包括:
25.s9、得到待测数据对应的真实样品,并通过低倍检测方式得到真实质量数据,将该待测数据和其真实质量数据添加到初始历史数据集中。
26.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,针对下一待测数据,重复进行步骤s2-s8。
27.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤s1中通过连铸生产过程跟踪系统实时采集工况数据;
28.所述连铸生产过程跟踪系统能够实现铸坯生产过程数据与铸坯时间方向的精确匹配。
29.与现有技术相比,上述技术方案中的一个技术方案具有如下优点或有益效果:本发明在样本相似性度量策略下,通过在线局部建模方法,实时查询历史数据库中的相似样本,选取最优的相似样本进行建模,能够自适应地根据连铸生产过程非线性、时变性的工况为系统在线建立当前工作点的局部预测模型,避免了离线全局模型的局限性,有效解决了预测模型中模型参数的在线更新问题;
30.上述技术方案中的另一个技术方案具有如下优点或有益效果:本发明根据连铸生产过程跟踪系统实时采的生产过程的工况数据构建历史数据库,并采取滚动训练方式基于历史数据库进行建模,这样既能够重复利用有用的历史样本数据,又能不断根据最新的工况数据即时选取最优的相似样本;
31.上述技术方案中的另一个技术方案具有如下优点或有益效果:本发明在每一个待测样本预测时刻建立新的局部模型,不保留旧模型的参数,从而过去时刻出现的干扰不会影响当前时刻局部预测模型的预测准确性,提高预测模型的鲁棒性、自适应能力和稳定性。
32.当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
33.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
34.图1是本发明一个实施例提供的基于局部在线建模的铸坯质量预测方法的架构示意图;
35.图2是本发明一个实施例提供的原始数据集划分示意图;
36.图3是本发明一个实施例提供的在随机森林算法3次交叉验证下各输入变量的特征权重图;
37.图4是本发明一个实施例提供的在线局部模型和离线支持向量回归模型对65号高碳钢铸坯三角区裂纹等级预测的结果对比图;
38.图5是本发明一个实施例提供的折算后在线局部模型和离线支持向量回归模型对65号高碳钢铸坯三角区裂纹等级预测的结果对比图。
具体实施方式
39.为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
40.应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
41.本发明针对传统铸坯质量预测大多基于全局建模方法,存在模型结构和参数相对
固定、自适应能力较差、难以在场景复杂、工况多变的连铸过程得到长期稳定应用的问题,提供一种基于局部在线建模的铸坯质量预测方法,以支持向量回归为局部模型,利用相似度函数选择与待测样本最相关的历史数据作为局部建模的子样本集进行局部在线建模,实现在连铸过程中铸坯质量的预测。在相似度计算中基于传统欧氏距离引入工艺参数特征权重、样本时间特征权重来强化样本数据与待测数据的相关性,并根据样本相似度构建相似样本集进行局部建模,在各待测样本预测过程中,采取滚动训练的方式来模拟连铸真实生产过程。此建模方法能够表征当前系统状态,也能很好地适应连铸生产过程数据的时变性、非线性性特点,行之有效地保证了在连铸过程中对铸坯质量的实时精准预测。该预测方法详细的步骤包括:
42.步骤1:通过连铸生产过程跟踪系统实时采集与储存连铸生产过程中与铸坯质量相关的工况数据集,表示为:x=[x1,x2,...,xn]
t
,xi∈rm,i=1,2,

,n,n为样本数量,m为样本维度,r为实数集;通过实验室低倍检测采集的数据,得到各样本对应的真实质量等级值y=[y1,y2,...,yn]
t
∈rn。
[0043]
步骤2:将采集到的数据作为初始历史数据集d
org
=[x;y
t
]∈r
(m+1)
×n,对初始历史数据集d
org
进行数据预处理,得到预处理的数据集d
l

[0044]
预处理方法包括:空值处理、异常值处理和归一化处理。
[0045]
步骤3:根据标准化后的初始历史数据集d
l
建立离线随机森林模型,并通过交叉验证的方式计算得到各输入变量的权重w
var
=[w1,w2,...,wm]
t
∈rm。
[0046]
步骤4:对于新采集的查询样本x
new
∈rm,按照公式(3)进行归一化处理。
[0047]
步骤5:根据输入变量权重矩阵w
var
计算查询样本x
new
与数据集x
l
中所有样本的加权欧氏距离si。
[0048]
步骤6:针对连铸生产时变性的特点,在数据集的样本数据中引入时间特征权重w
t
,并将样本时间特征权重w
t
和步骤5中的查询样本与数据集x
l
中所有样本的加权欧氏距离进行融合,计算查询样本与数据集x
l
中所有样本的相似度权值
[0049]
步骤7:根据相似度计算结果,在初始历史数据集d
l
中选择相似度权值最大的前nk个样本构建相似样本数据集dr。
[0050]
步骤8:根据相似样本数据集dr建立局部模型;局部建模结构采用支持向量回归模型;
[0051]
步骤9:查询样本x
new
输入局部模型,模型输出预测值f(x)
new
,并丢弃此局部模型;
[0052]
步骤10:当查询样本x
new
所对应的真实输出值y
new
由低倍检测得到时,采取滚动训练的方式将样本[x
new
,y
new
]添加到初始历史数据集d
l
中,并更新数据库;否则,维持初始历史数据集d
l
中所包含的样本不变。
[0053]
步骤11:下一个待测样本x
new+1
进入预测模型重复步骤2-10。
[0054]
实施例1:
[0055]
该实施例提供的基于局部在线建模的铸坯质量预测方法,其架构如图1所示。预测方法的具体步骤包括:
[0056]
步骤1:通过连铸生产过程跟踪系统实时采集与储存连铸生产过程中与铸坯质量相关的工况数据集x=[x1,x2,...,xn]
t
,xi∈rm,i=1,2,

,n,n为样本数量,m为样本维度;通过实验室低倍检测采集的数据,得到各样本对应的真实质量等级值y=[y1,y2,...,yn]
t
∈rn。
[0057]
工况数据获取首先是铸坯生产过程数据与铸坯时间方向的精确匹配。为此,基于铸坯生产过程跟踪系统,计算铸坯任意位置在各个装置(结晶器、二冷各区等)的关键时间节点。根据铸坯头、尾在各个装置的时刻,截取这段时间的生产过程数据,与铸坯时间方向进行匹配。然后再通过时空变换,将铸坯时间方向的数据变换到铸坯长度方向,实现铸坯生产过程数据与铸坯长度方向的精确匹配。
[0058]
铸坯在结晶器的工况数据与时间方向进行匹配:
[0059][0060]
铸坯在二冷各区的工况数据与时间方向进行匹配:
[0061][0062]
式中:l
j-c
为结晶器到切割机的距离;l
cn-c
为二冷区各个冷却区到切割机的距离;tc为铸坯切割时刻;tj为铸坯在结晶器浇注时刻;t
cn
为铸坯在二冷区各个冷却区的冷却时刻;v为拉速。
[0063]
步骤2:将采集到的数据作为初始历史数据集d
org
=[x;y
t
]∈r
(m+1)
×n,对初始历史数据集d
org
进行数据预处理,预处理方法包括:空值处理、异常值处理,归一化处理。
[0064]
空值处理:空值即缺失值,采用均值替换缺失值;
[0065]
异常值处理:对采集的工艺参数值设置边界范围,当所采集的数据值超出边界范围时,视为异常信号,将其直接删除,不予采用;
[0066]
归一化处理:归一化处理采用min-max标准化方法,通过线性变化将初始历史数据集映射到[0,1]区间,得到归一化处理后的初始历史数据集x
l
、为数据x、y经归一化处理后的数据;
[0067]
min-max标准化公式为:
[0068][0069]
式中,函数min{d
org
}、max{d
org
}分别表示计算矩阵各行的最小值和最大值。
[0070]
步骤3:根据标准化后的初始历史数据集d
l
建立离线随机森林模型,并通过交叉验证的方式计算得到各输入变量的权重w
var
=[w1,w2,...,wm]
t
∈rm。
[0071]
随机森林是以k个决策树{h(x,θk),k=1,2,...,k}为基本分类单元,进行集成学习后得到的一个组合分类器。由于构建每个决策树时,随机抽取训练样本和属性子集的过程是独立的,且总体是一样的,因此参数集{θk,k=1,2,...,k}是一个独立同分布的随机向量。其中,随机森林求变量权重评分的步骤:
[0072]
初始历史数据集d
l
有n个查询的样本,表示各个步态参数的变量依次为f1,f2,

,fm。应用自助法重采技术有放回地抽取k个新的自助样本集,在此过程中得到k个分类回归树,每次未被抽中的样本则组成了k个袋外数据(out-of-bag,oob),该部分数据样本作为测
试样本用于评估各个步态参数在分类中的重要性,具体如下:
[0073]

用自助样本可以得到若干个树形分类器,同时对应的oob进行分类,得到k个oob样本中的每一个样本的投票数,记作v1,v2,

,vk。
[0074]

将变量fi的数值在k个oob中的顺序随机打乱,形成新的oob测试集,根据样本判别的正确数,所得到的结果可表示为:
[0075][0076]

v1,v2,

,vk与矩阵(3)对应的第i行向量相减,求和平均后得到各变量fi的权重评分,即:
[0077][0078]
步骤4:对于新采集的查询样本x
new
∈rm,按照公式(3)进行归一化处理。
[0079]
步骤5:根据输入变量权重矩阵w
var
计算查询样本x
new
与数据集x
l
中所有样本的加权欧氏距离:
[0080][0081]
式中,si为查询样本与数据集x
l
中样本的加权欧氏距离,wi为权重因子,h为查询样本的特征向量,hi为历史样本数据集中样本i的特征向量。
[0082]
步骤6:针对连铸生产时变性的特点,在样本数据中引入时间特征权重w
t
,确保分配最相关、最合适的样本进行在线局部建模。并将样本时间特征权重w
t
和步骤5中的查询样本与数据集x
l
中所有样本的加权欧氏距离进行融合,计算查询样本与数据集x
l
中所有样本的相似度权值的相似度权值
[0083]
式中,为数据集x
l
中第i个样本的相似度权值;r为可调参数;w
it
表示数据集x
l
中各样本时间特征权重,w
it
确定方式如下:
[0084]
设定所选的数据集x
l
的时间权向量为的时间权向量为
[0085]
定义1时间权向量的熵i。时间权向量的熵是一个度量值,熵值越大,则说明数据集中各样本时间权重之间的差异越小;反之亦然。
[0086][0087]
定义2时间度λ。时间度λ∈[0,1],λ的大小体现对时序数据的重视程度(见表1),即当λ越小时,表明越注重离当前工况点时间接近的数据;反之亦然。
[0088][0089]
确定数据集x
l
中各样本时间权重的准则:在给定时间度λ的值下,以尽可能地挖掘样本的信息和兼顾被评价对象在时许上的差异信息为标准来寻找适合该样本集的时间权向量。此方法可归纳为求解非线性规划问题:
[0090][0091][0092]
表1时间度λ的标度参考表
[0093][0094][0095]
步骤7:根据相似度计算结果,在初始历史数据集d
l
中选择相似度权值最大的前nk个样本构建相似样本数据集dr。
[0096]
步骤8:根据相似样本数据集dr建立局部模型,局部建模结构采用支持向量回归模型。
[0097]
支持向量回归基于支持向量机发展而来,广泛应用于非线性问题的建模和预测。该方法通过引入最大误差值ε,规定预测结果误差的绝对值大于ε的样本参与损失值计算。支持向量回归问题的目标函数为:
[0098][0099][0100]
式中,样本为(x,y),f(x)为模型输出,y为期望输出,η、b为待定模型参数,ε为偏差最大允许值,c为正则化常数;p为相似样本数据集dr样本数量;l
ε
(f(x)-y)为ε-不敏感损失
函数;
[0101]
为便于在更大的可行域求解,引入松弛因子ξi和和将其带入式(12)可得:
[0102][0103][0104]
进而,通过引入拉格朗日乘子,由拉格朗日乘子法得到拉格朗日函数l,在满足kkt最优化条件下,将回归模型带入拉格朗日函数l,并令其主要变量偏导数的值为零,则支持向量回归可表示为:
[0105][0106]
式中,αi、为拉格朗日乘子;κ(x,xi)为满足mercer条件的核函数。
[0107]
步骤9:查询样本x
new
输入局部模型,模型输出预测值f(x)
new
,并丢弃此局部模型。
[0108]
步骤10:当查询样本x
new
所对应的真实输出值y
new
由低倍检测得到时,采取滚动训练的方式将样本[x
new
,y
new
]添加到初始历史数据集d
l
中,并更新数据库;否则,维持初始历史数据集d
l
中所包含的样本不变。
[0109]
步骤11:下一个待测样本x
new+1
进入预测模型重复步骤2-10。
[0110]
实施例2:
[0111]
以下结合国内某钢厂65号高碳钢铸坯三角区裂纹为例,验证基于即时学习算法的铸坯质量预测方法的有效性。在钢铁生产流程中,铸坯质量直接影响最终钢铁产品质量,三角区裂纹是铸坯典型的内部质量缺陷,主要分布在板坯的三角区部位,裂纹的方向垂直于板坯的窄面,其形成原因与连铸过程的钢水成分、工艺参数、工艺操作、设备状况等因素密切相关。
[0112]
结合现场调研和前人研究,选取影响铸坯三角区裂纹形成的7个关键因素作为输入变量,具体见表2。同时,以三角区裂纹等级为预测模型输出值,根据裂纹的严重程度可分为0、0.5、1、1.5、2共5种等级。
[0113]
表2铸坯质量缺陷影响因素
[0114][0115]
采集2022年1月-6月国内某钢厂65号高碳钢铸坯三角区裂纹的90组实际生产数据作为原始数据集。为贴近实际生产状况,原始数据集划分如图2所示,根据生产时间序列将原始数据集划分为两部分,前70组时间较早的数据作为历史数据集,后20组时间较近的数据用于模拟待测样本。在线局部建模时,最初前70组数据作为初始历史数据集,当各待测样本完成预测后,依次添加到初始历史数据集中,直至20个待测样本全部完成预测。在近邻样本选择时,用于在线局部建模的样本容量nk设置为30。
[0116]
以铸坯三角区裂纹为预测对象,在随机森林3次交叉验证下定量分析表1中7个关键输入变量的权重,分析结果如图3所示。根据输入变量权重矩阵w
var
计算查询样本x
new
与数据集x
l
中所有样本的加权欧氏距离;同时根据样本时间特征权重计算方式,通过多次仿真试验对比确定相关参数:时间度λ=0.3,可调参数r=0.4,求解数据集x
l
中各样本的时间权重w
t
,并将样本时间特征权重w
t
和查询样本与数据集x
l
中所有样本的加权欧氏距离进行融合,计算查询样本与数据集x
l
中所有样本的相似度权值在初始历史数据集中选取相似度权值最大的前nk=30个样本进行局部在线建模,局部模型结构采用支持向量回归模型。
[0117]
表3为使用不同的建模方法对铸坯三角区裂纹等级的预测结果比较,即离线支持向量回归模型与本发明的在线局部建模方法的比较。本发明使用平均绝对误差mae、均方误差mse、决定系数r2、准确率a等多种误差度量方式作为综合评价指标。
[0118][0119][0120][0121][0122]
式中:m为测试集样本数,a为预测正确的个数,为真实输出的平均值。mae和mse
的数值越小,表明模型精度越高;r2和a越接近于1,表明模型拟合效果越好。
[0123]
表3两种建模方式预测的评价结果对比
[0124][0125]
在实际铸坯质量检测中,铸坯三角区裂纹的评级方法采用0、0.5、1、1.5、2级阶梯型评价,而回归模型得到的结果为连续的数值,结果如图4所示。为与实际铸坯质量检测结果相匹配,回归模型的预测结果采用表4所示的对应关系进行折算。在此基础上,图5所示为预测值按实际评价方法取值后的两种模型对比情况。不难发现,在线局部建模的预测值与真实值重合的个数明显多于离线支持向量回归模型。具体来说,局部模型的预测准确率为0.9,而离线支持向量回归模型的预测准确率仅为0.65,这主要得益于本发明的在线局部建模方式充分考虑了连铸生产过程非线性、时变性的特点,即将变量之间的相关性以及生产过程的时变性融入样本相似度的计算,强化局部建模的样本数据与待测样本的相关性。
[0126]
表4预测结果与实际评级之间对应关系
[0127][0128][0129]
以上对本技术实施例所提供的一种基于局部在线建模的铸坯质量预测方法,进行了详细介绍。以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
[0130]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。
[0131]
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1