本发明属于隧道大型掘进设备智能控制领域,具体涉及一种基于多目标学习的tbm掘进参数预测方法,可同时预估多个tbm掘进参数,优化tbm掘进过程中控制策略。
背景技术:
在硬岩tbm的掘进过程中,司机需根据岩体地质条件对设备掘进参数进行实时调整。然而,传统的控制策略主要根据tbm司机的驾驶经验和掘进参数的波动情况进行人为判断,但这种方式易受人为主观性和决策规则单一性的影响而导致参数调整与实际值产生较大偏差,诱发tbm控制策略的决策失误,严重威胁人机的安全性与可靠性。
此外,在一个完整的tbm掘进循环内,司机通常需根据不同阶段的操作规则逐步改变tbm掘进及控制参数值,其中如何根据上升段数据来预测tbm稳定段掘进参数的变化趋势是现场tbm司机迫切关注的问题,也是目前tbm智能控制领域中的一个研究热点。因而,如何克服传统决策规则的单一性问题、实时精准预测tbm掘进参数,并以此辅助tbm司机优化控制策略对于实现tbm安全高效掘进具有至关重要的现实意义。
技术实现要素:
针对上述现有技术描述的不足,本发明提供一种基于多目标学习的tbm掘进参数预测方法,通过基于多目标学习的人工智能算法有效表征上升段数据与稳定段多目标变量之间的非线性映射关系,从而实时精准预测多个tbm性能和控制参数。除了借助岩机模型所预估的多目标参数信息之外,tbm司机还可以综合围岩地质情况和渣片的颗粒分布来优化掘进过程中控制策略。
为解决上述问题,本发明所采用的技术方案通过一种基于多目标学习的tbm掘进参数预测方法来实现,其具体步骤如下:
s1,通过tbm智能数据采集系统获取tbm掘进参数的原始数据。
所述tbm掘进参数从现场tbm监控平台中智能数据采集系统获取,包括tbm性能参数、控制参数和设定参数。
所述tbm性能参数包括刀盘扭矩t和总推力f;tbm控制参数包括刀盘转速n和掘进速度v;tbm设定参数包括刀盘转速设定值np和掘进速度设定值vp。
s2,对采集的tbm掘进参数进行降噪与增强处理,获取循环上升段和稳定段数据。
s2.1,对步骤s1所获tbm掘进参数进行但不限于剔除非工作状态下异常数据的初步处理。
s2.2,将初步处理的tbm掘进参数数据进行标准化,并划分循环上升段和稳定段。
s3,根据预处理后tbm掘进参数数据,提取反映tbm健康状态的评估指标。
所述评估指标,包括循环上升段tbm掘进数据的时域特征和稳定段掘进数据的时域特征。
s3.1,根据预处理后tbm掘进参数数据,提取循环上升段数据的时域特征。
所述循环上升段数据的时域特征,包括所有tbm性能参数、控制参数和设定参数在上升段的时域均值指标、均方根指标和方差指标;时域均值指标和均方根指标反映tbm设备在一段运行时间内的总体健康状态,方差指标有效表征tbm掘进参数在一段运行时间内的的波动情况;
s3.2,根据预处理后tbm掘进参数数据,提取稳定段数据的时域特征。
所述稳定段数据的时域特征为所有tbm性能参数和控制参数在稳定段的均值指标。
s4,利用人工智能算法有效表征上升段tbm特征指标与稳定段多目标变量之间的非线性映射关系,建立基于多目标学习的岩机作用模型。
所述稳定段tbm多目标变量包括设备的刀盘扭矩、总推力、刀盘转速、推进速度。
且所述岩机作用模型包括但不限于bp(backpropagation)神经网络、多输出高斯过程回归(multiple-outputgaussianprogressregression)、多输出支持向量回归(multiple-outputsupportvectorregression)等方法。
本发明以多输出高斯过程回归(multiple-outputgaussianprogressregression-mogp)为例阐述tbm岩机作用模型的构建过程,且循环上升段数据的时域特征为特征指标,稳定段数据为目标变量;其具体实施步骤如下:
s4.1构建单输出高斯过程回归模型;
单输出高斯过程回归模型(single-outputgaussianprogressregression-sogp)首先对上升段tbm特征指标与每个稳定段tbm目标变量间的非线性关系分别进行建模,具体步骤为:
s4.1.1,给定样本特征矩阵x和单目标变量y;
x=[x1,x2,…,xi,…,xm];
y=[y1,y2,…,yi,…,ym];
其中,m为样本数量,xi为样本特征矩阵中第i个元素且由l个特征指标所组成的向量;yi为tbm目标变量中第i个元素。
s4.1.2,基于sogp方法构造单目标变量与特征指标的预测模型;
yi=f(xi)+ε(i=1,2,…,m);
式中,ε表示均值为0且服从独立同分布的高斯函数,即ε~n(0,δ2),δ2表示高斯函数的方差;f(x)~n(0,k(x,x)),k表示特征样本间的协方差。
s4.1.3,重复步骤s4.1.1-s4.1.2,直至对每个目标变量都建立一个sogp预测模型fd(x),得到d个sogp预测模型:
其中,d为目标变量的个数,d为目标变量的序号。
s4.2建立多输出高斯过程回归模型;
要想对d个sogp预测模型
s4.2.1,对单目标变量的sogp预测模型fd(x)用光滑核函数和隐含函数的卷积运算来近似表示,具体如下:
fd(x)=∫xgd(x-z)u(z)dz;
s4.2.2,为了提高sogp预测模型的近似精度,将光滑核函数和隐含函数进一步线性分为若干子函数:
式中,q为子函数个数,q为子函数的序号,gd,q(x)为光滑核函数的子函数、uq(x)为隐含函数的子函数,且gd,q(x)和uq(x)拥有相同的协方差函数,且相互独立。
s4.2.3,将光滑核函数和隐含函数选择相同的高斯形式,则光滑核函数的表达式如下:
式中,sd,q表示由第d个sogp预测模型fd(x)和隐函数uq(x)计算得到的方差系数,
s4.2.4,构造隐含函数的协方差矩阵为:
式中,
s4.2.5,根据步骤s4.2.2-s4.2.4计算任意两个目标变量之间的协方差,公式为:
s4.2.6,根据步骤s4.2.5并通过卷积计算,构造多输出高斯过程回归模型,即mogp预测模型,且mogp预测模型就是岩机作用模型:
p(y|x,θ)=n(y|0,kf,f,σ);
式中,y表示d个目标变量所组成的矩阵;kf,f表示卷积计算所得的协方差矩阵;σ是零均值且服从独立同分布的高斯噪声矩阵,表示每个目标变量的输出值扰动;θ表示mogp模型的超参数集合。
s4.2.7,在根据步骤s1-s3获取新的上升段tbm特征向量x*之后,可利用步骤s4.2.6中mogp模型估计多个目标变量的预测分布,具体如下:
式中,kf,f表示特征样本与自身进行卷积计算所得的协方差矩阵;
s5,通过非线性优化方法对岩机作用模型的参数进行自适应调整,改善tbm掘进参数的预测精度。
且所述非线性优化方法包括但不限于最大似然估计(maximumlikelihoodestimation),粒子群优化(particleswarmoptimization),网格搜索(gridsearch),遗传算法(geneticalgorithm)等方法。
s6,根据岩机作用模型预估的多目标参数信息,tbm司机可综合围岩地质情况和渣片的颗粒分布优化tbm控制策略。
与现有技术相比较,本发明具有如下有益效果:
第一,本发明通过对tbm掘进数据提取均值、均方根、方差等特征指标,反映设备掘进过程中健康状态,其均值和均方根特征可描述tbm总体运行状态,方差指标可有效表征tbm掘进参数的波动情况;
第二,本发明利用人工智能算法对上升段tbm特征指标与稳定段多目标变量之间的非线性映射关系进行建模,并通过在线优化方法自适应调整模型参数,从而实时预测tbm稳定段掘进参数的变化趋势;
第三,本发明根据岩机模型所预估的多目标参数信息,在综合围岩地质情况和渣片颗粒分布的基础之上,辅助tbm司机优化掘进过程中控制策略,可显著改善传统决策规则的单一性和人为判断的主观性缺陷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的系统流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于多目标学习的tbm掘进参数预测方法,如图1所示,其步骤如下:
s1,通过tbm智能数据采集系统获取tbm掘进参数的原始数据。
所述tbm掘进参数从现场tbm监控平台中智能数据采集系统获取,包括tbm性能参数、控制参数和设定参数。
所述tbm性能参数包括刀盘扭矩t和总推力f;tbm控制参数包括刀盘转速n和掘进速度v;tbm设定参数包括刀盘转速设定值np和掘进速度设定值vp。
s2,对采集的tbm掘进参数进行降噪与增强处理,获取循环上升段和稳定段数据。
s2.1,对步骤s1所获得的tbm掘进参数进行但不限于剔除非工作状态下异常数据的初步处理。
s2.2,将初步处理的tbm掘进参数数据进行标准化,并划分成循环上升段和稳定段。
s3,根据预处理后tbm掘进参数数据,提取反映tbm健康状态的评估指标。
所述评估指标,包括循环上升段tbm掘进数据的时域特征和稳定段掘进数据的时域特征。
s3.1,根据预处理后tbm掘进参数数据,提取循环上升段数据的时域特征。
所述循环上升段数据的时域特征,包括所有tbm性能参数、控制参数和设定参数在上升段的时域均值指标、均方根指标和方差指标;时域均值指标和均方根指标反映tbm设备在一段运行时间内的总体健康状态,方差指标有效表征tbm掘进参数在一段运行时间内的的波动情况。
s3.2,根据预处理后tbm掘进参数数据,提取稳定段掘进数据的时域特征。
所述稳定段数据的时域特征为所有tbm性能参数和控制参数在稳定段的均值指标。
s4,利用人工智能算法有效表征上升段tbm特征指标与稳定段多目标变量之间的非线性映射关系,建立基于多目标学习的岩机作用模型。
所述稳定段tbm多目标变量包括设备的刀盘扭矩、总推力、刀盘转速、推进速度。
所述岩机作用模型包括但不限于多输出高斯过程回归(multiple-outputgaussianprogressregression-mogp),还包括bp(backpropagation)神经网络、多输出支持向量回归(multiple-outputsupportvectorregression)等方法。
本发明实施例以多输出高斯过程回归(mogp)为例阐述tbm岩机作用模型的构建过程,其具体实施步骤如下:
s4.1构建单输出高斯过程回归模型;
为了实现上述目的,单输出高斯过程回归模型(single-outputgaussianprogressregression-sogp)首先对上升段tbm特征指标与每个稳定段tbm目标变量间的非线性关系分别进行建模。
本发明实施例以多输出高斯过程回归(multiple-outputgaussianprogressregression-mogp)为例阐述tbm岩机作用模型的构建过程,且循环上升段数据的时域特征为特征指标,稳定段数据的时域特征为目标变量,其具体实施步骤如下:
s4.1构建单输出高斯过程回归模型;
单输出高斯过程回归模型(single-outputgaussianprogressregression-sogp)首先对上升段tbm特征指标与每个稳定段tbm目标变量间的非线性关系分别进行建模,具体步骤为:
s4.1.1,给定样本特征矩阵x和单目标变量y;
x=[x1,x2,…,xi,…,xm];
y=[y1,y2,…,yi,…,ym];
其中,m为样本数量,xi为样本特征矩阵中第i个元素且由l个特征指标所组成的向量;yi为tbm目标变量中第i个元素。
s4.1.2,基于sogp方法构造单目标变量与特征指标的预测模型;
yi=f(xi)+ε(i=1,2,…,m);
式中,ε表示均值为0且服从独立同分布的高斯函数,即ε~n(0,δ2),δ2表示高斯函数的方差;f(x)~n(0,k(x,x)),k表示特征样本间的协方差。
s4.1.3,重复步骤s4.1.1-s4.1.2,直至对每个目标变量都建立一个sogp预测模型fd(x),得到d个sogp预测模型:
其中,d为目标变量的个数,d为目标变量的序号。
s4.2建立多输出高斯过程回归模型;
要想对d个sogp预测模型
s4.2.1,对单目标变量的sogp预测模型fd(x)用光滑核函数和隐含函数的卷积运算来近似表示,具体如下:
fd(x)=∫xgd(x-z)u(z)dz。
s4.2.2,为了提高sogp预测模型的近似精度,将光滑核函数和隐含函数进一步线性分为若干子函数:
式中,q为子函数个数,q为子函数的序号,gd,q(x)为光滑核函数的子函数、uq(x)为隐含函数的子函数,且gd,q(x)和uq(x)拥有相同的协方差函数,且相互独立。
s4.2.3,将光滑核函数和隐含函数选择相同的高斯形式,则光滑核函数的表达式如下:
式中,sd,q表示由第d个sogp预测模型fd(x)和隐函数uq(x)计算得到的方差系数,
s4.2.4,构造隐含函数的协方差矩阵为:
式中,
s4.2.5,根据步骤s4.2.2-s4.2.4计算任意两个目标变量之间的协方差,公式为:
s4.2.6,根据步骤s4.2.5并通过卷积计算,构造多输出高斯过程回归模型,即mogp预测模型,且mogp预测模型就是岩机作用模型:
p(y|x,θ)=n(y|0,kf,f,σ);
式中,y表示d个目标变量所组成的矩阵;kf,f表示卷积计算所得的协方差矩阵;σ是零均值且服从独立同分布的高斯噪声矩阵,表示每个目标变量的输出值扰动;θ表示mogp模型的超参数集合。
s4.2.7,在根据步骤s1-s3获取新的上升段tbm特征向量x*之后,可利用步骤s4.2.6中mogp模型估计多个目标变量的预测分布,具体如下:
式中,kf,f表示特征样本与自身进行卷积计算所得的协方差矩阵;
s5,通过非线性优化方法对岩机作用模型的参数进行自适应调整,改善tbm掘进参数的预测精度。
所述非线性优化方法包括但不限于最大似然估计(maximumlikelihoodestimation),还包括粒子群优化(particleswarmoptimization),网格搜索(gridsearch),遗传算法(geneticalgorithm)等方法。
本发明实施例以最大似然估计为例对mogp模型的超参数集合θ进行寻优,其最优估计值标记为θ'。此时,上述mogp模型的预测分布函数更新如下:
s6,根据岩机作用模型预估的多目标变量信息,tbm司机可综合围岩地质情况和渣片的颗粒分布优化tbm控制策略。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。