基于Xgboost的盾构施工不良地质类型预测方法与流程

文档序号:16001327发布日期:2018-11-20 19:29阅读:144来源:国知局
本发明属于工业大数据
技术领域
,涉及一种盾构施工不良地质类型的预测方法,具体涉及一种基于Xgboost的盾构施工不良地质类型的预测方法,可用于在盾构施工过程中实时监测和分析开挖面围岩的地质情况。
背景技术
:伴随中国经济高速发展,大量人口涌入各大中型城市,城区规划面积有限,现有运输条件已不能满足人们交通出行的需求。城市化进程的加快、大城市人口数量的激增以及城市公路交通的拥堵使得城市轨道交通日益得到各国政府的高度重视。面对日益突出的交通拥堵、出行耗时等民生问题,世界各国诸多超大城市、大城市等纷纷通过或规划借助大力发展城市轨道交通来缓解现有交通压力、改善职住平衡。其中,城市轨道交通具有运量大、效率高、能耗低、集约化、乘坐方便、安全舒适等诸多优点,是解决城市交通拥堵问题、实现城市空间布局调整及城市均衡发展的重要途径。根据城市轨道交通协会统计,截止2017年6月底,中国大陆地区31个城市开通运营城市轨道交通,共计133条线路,运营线路总里程达4400公里。随着需求不断增长,地铁建设投资规模持续扩大,成大城市集中度高,三线及以下城市未来投资增长潜力较大趋势。而地铁建设的重中之重在于地铁隧道的挖掘。在隧道建设中,盾构法以其明显的经济技术优势和对周边环境影响较小的特点,成为地铁隧道施工最常用的方式之一。盾构机由于具有全封闭、快掘进、同时衬砌的优点,被广泛应用在地铁隧道施工工程。但这一优点也决定了盾构机在施工中不能像常规法施工的隧道那样可对围岩地质特征作全面观察,虽然盾构施工法会在隧道开挖之前对施工隧道区间进行勘察,记录地质信息,但这只能提供局部区域的有限地质情况。在施工过程中若前方突然出现不良地质体,会产生塌方、掉块、涌水等事故,甚至导致盾构机进退两难,轻则耽误工期、增大施工费用,重则产生设备损坏及人员伤亡等安全事故。所以,在盾构掘进过程中能够实时监测和分析开挖面围岩的地质情况是非常重要的。根据工程经验可得地层特征和盾构机的掘进参数往往存在一定的对应关系。盾构法施工涉及的掘进参数多达数十个,且这些参数的取值范围波动较大,如掘进速度在卵石地层可能为20~30mm/min,而在粉质黏土层可达到60mm/min。盾构机的PDV数据采集系统实时采集数据,有的采集周期为10s,有的采集周期为60s,这样在施工过程中就积累了大量的掘进参数数据资料。同时,某些参数还受到诸多外界因素的影响与控制,如地质条件、人为操作水平、系统运行状态等。盾构法施工中的参数具有数据集规模大、属性数量多、取值范围多变等特点。这些特点导致人工方法难以找到其中的规律。在盾构机掘进过程中对于地质情况的研究主要有:对于地面沉降的预测研究、对于不良地质类型的预测研究、对于地面隆起的预测研究。但是,对于不良地质类型的预测研究尤为重要。就目前公开的资料来看,针对盾构施工过程中盾构机前方不良地质类型预测方面的研究方法主要有两种:第一种方法是目前在盾构施工过程中应用的方法,主要是以盾构机开挖前对施工区间勘探所得的地质勘探报告、大量的专业知识和人工经验对盾构机开挖面前方地质情况进行预测。这种方法是以开挖前的地质勘探报告为判断基础,以盾构机操作人员的专业知识、人工经验为判断标准,对盾构机前方的地质类型进行识别。这种方法依靠了大量的人工经验和专业知识,不具有时效性。而且由于地勘报告中相邻采样点的距离较大,可能会导致对地层类型出现误判情况,从而影响施工安全。第二种方法为神经网络法,是目前在人工智能算法方面针对地层识别、地质类型预测所提出的主要研究方法。是以基于人工神经网络的方法对地质类型预测或地层进行识别。利用机理分析得出可以表征地层变化的关键影响参数,并将这些参数作为模型输入带入到人工神经网络模型中从而可以构建地层识别模型,达到识别地层的目的。例如,浙江大学的朱北斗等人在其发表的论文“基于盾构掘进参数的BP神经网络地层识别[J]”(浙江大学学报,2011(5),5-13)中,首先根据工程经验对盾构施工过程进行机理分析,分析得到盾构机的推进力、推进速度、刀盘扭矩、刀盘速度这4个掘进参数与地质类型特征具有较高的相关性,因此将这4个特征作为表征地质类型特征的关键影响参数。然后以这4个关键影响参数作为输入,以地质类型特征作为输出带入到BP神经网络模型中进行训练从而可以构建地层识别模型,模型预测准确率为93%,基本达到对盾构机前方地质类型预测的目的。在此方法中采用的BP神经网络算法虽然具有非线性映射的能力和较好的泛化能力,但是BP神经网络对训练样本具有依赖性和在训练过程中容易形成局部极小化,并且在此方法中利用机理分析进行关键影响因素提取,可能会忽略存在其他可以表征地层识别的关键影响因素,导致在样本采样不具有典型性的时候模型不能达到最优精度,而且BP神经网络算法收敛速度很慢,这导致模型不具有时效性,不能满足对地层进行实时预测。技术实现要素:本发明的目的在于克服上述现有技术存在的不足与缺陷,提供了一种基于Xgboost的盾构施工不良地质类型的预测方法,旨在实现对盾构施工过程中盾构机前方不良地质情况的实时预测,并提高预测精度。本发明的技术方案包括如下步骤:(1)对盾构机的PDV历史数据进行预处理:从盾构机PDV数据采集系统中获取包括地质特征数据和多个不同掘进参数数据的PDV历史数据,并对多个不同掘进参数数据进行预处理,得到包含多个预处理后的掘进参数数据的掘进参数数据集;(2)获取预处理后的多个掘进参数数据的关键特征:建立随机森林算法特征提取模型,并利用地质特征数据和掘进参数数据集对随机森林算法特征提取模型进行训练,得到包含多个表征地层变化的掘进参数关键数据特征的掘进参数关键数据特征集;(3)构建不良地质预测数据包:提取掘进参数数据集中与掘进参数关键数据特征集中所有特征对应的数据,组成掘进参数特征数据集,并将其与地质特征数据合并为不良地质预测数据包;(4)建立Xgboost算法不良地质预测模型:将不良地质预测数据包中80%的特征数据作为训练集,其余的特征数据作为测试集,并利用训练集对Xgboost算法不良地质预测模型进行训练,得到Xgboost算法不良地质预测模型;(5)对Xgboost算法不良地质预测模型进行评估:(5a)利用测试集对Xgboost算法不良地质预测模型进行测试,并将测试得到的不良地质类型预测值与测试集中的不良地质类型真实值进行对比,得到Xgboost算法不良地质预测模型预测结果的正确率accuracy;(5b)判断正确率accuracy是否小于预先设置阈值,若是,执行步骤(2),否则保存Xgboost算法不良地质预测模型。(6)对盾构施工过程中不良地质类型进行预测:从盾构机PDV数据采集系统采集到的盾构施工过程中PDV实时数据中提取掘进参数关键数据特征集中所有特征对应的数据,并将其输入到Xgboost算法不良地质预测模型中,得到盾构施工过程中不良地质类型的预测值。本发明与现有技术相比,具有以下优点:1.本发明获取的掘进参数数据的关键特征,是通过随机森林算法实现的,利用地质特征数据和掘进参数数据集对随机森林算法特征提取模型进行训练,得到包含多个表征地层变化的掘进参数关键数据特征的掘进参数关键数据特征集,避免了现有技术采用机理分析获取掘进参数数据关键特征,忽略其他可以表征地层变化的关键数据特征的问题。提升了不良地质类型预测准确率。2.本发明建立Xgboost算法不良地质预测模型所采用Xgboost算法避免了现有技术中建立BP算法地质预测模型所采用的BP神经网络算法对训练样本具有依赖性和在训练过程中容易形成局部极小化的问题,进一步提升了不良地质类型预测准确率。3.本发明建立Xgboost算法不良地质预测模型所采用Xgboost算法支持分布式集成学习而且支持以字典而不是矩阵的形式作为输入,与现有技术中建立BP算法地质预测模型所采用的BP神经网络算法相比所需耗费的内存得到了降低,提高了预测的时效性。附图说明图1为本发明的实现流程图;图2(a)为本发明测试集预测结果展示图,图2(b)为本发明测试集真实数据展示图。具体实施方式下面结合附图和具体实施例,对本发明作进一步详细说明。参照图1,本发明的实现步骤如下:步骤1)对盾构机的PDV历史数据进行预处理:从盾构机PDV数据采集系统中获取包括地质特征数据和多个不同掘进参数数据的PDV历史数据,并对多个不同掘进参数数据进行预处理,得到包含多个预处理后的掘进参数数据的掘进参数数据集;对多个不同掘进参数数据进行预处理的具体步骤为:步骤1a)利用python程序语言调用pandas模块中的fillna函数对并对存在缺失值的多个不同掘进参数数据进行平均数填充,得到包含多个完整的掘进参数数据的掘进参数数据集;步骤1b)判断p(|x-μ|>3σ)≤0.003是否成立,若是,则将掘进参数数据集中的观察值x作为掘进参数数据异常值,并执行步骤(1c),否则,掘进参数数据集中不存在异常值,执行步骤(1d),其中x为掘进参数数据集中的观察值,μ为掘进参数数据集中每个掘进参数的平均值,σ为掘进参数数据集中每个掘进参数的标准差,p为观察值x和平均值μ的差值超过3倍标准差σ的概率;步骤1c)利用掘进参数数据集中掘进参数数据的平均值对相应掘进参数数据异常值进行替换,得到不存在异常值且完整的掘进参数数据集;步骤1d)利用公式x*=(x-xmin)/(xmax-xmin)对不存在异常值且完整的掘进参数数据集进行归一化,得到含多个预处理后的掘进参数数据的掘进参数数据集,其中x*为预处理后的数据集,x为不存在异常值且完整的掘进参数数据集,xmin为不存在异常值且完整的掘进参数数据集的最小值,xmax为不存在异常值且完整的掘进参数数据集的最大值。步骤2)获取预处理后的多个掘进参数数据的关键特征:建立随机森林算法特征提取模型,并利用地质特征数据和掘进参数数据集对随机森林算法特征提取模型进行训练,得到包含多个表征地层变化的掘进参数关键数据特征的掘进参数关键数据特征集;获取预处理后的多个掘进参数数据的关键特征的具体步骤为:步骤2a)以掘进参数数据集X为输入,以地质特征数据Y为输出,构建基于随机森林算法的特征提取模型;步骤2b)利用随机森林算法的特征提取模型中决策树Fi的袋外数据oobi,计算决策树Fi的袋外数据误差erroobi,i为决策树的序号;步骤2c)对袋外数据oobi中的每个掘进参数数据加入噪声干扰,并计算决策树Fi的袋外数据误差err'obbi;步骤2d)计算掘进参数数据集X的每个数据特征的重要性VI,并将重要性VI大于预先设定的提取参数特征阈值δ的数据特征,作为能表征地层变化的掘进参数关键数据特征,得到包含多个表征地层变化的掘进参数关键数据特征的掘进参数关键数据特征集,其中,VI的计算公式为:VI=∑(err'obbi-errobbi)/Ntree其中,Ntree为随机森林中树的个数。步骤3)构建不良地质预测数据包:提取掘进参数数据集中与掘进参数关键数据特征集中所有特征对应的数据,组成掘进参数特征数据集,并将其与地质特征数据合并为不良地质预测数据包;步骤4)建立Xgboost算法不良地质预测模型:将不良地质预测数据包中80%的特征数据作为训练集,其余的特征数据作为测试集,并利用训练集对Xgboost算法不良地质预测模型进行训练,得到Xgboost算法不良地质预测模型;利用训练集对Xgboost算法不良地质预测模型进行训练的具体实现步骤为:步骤4a)对训练集中的地质特征数据进行二值化编码,得到满足Xgboost算法输入要求的训练集;步骤4b)设置Xgboost算法中每一个超参数的范围,并利用GridSearchCV网格搜索法对所有超参数在设定的范围内进行遍历,得到最优模型精度的Xgboost的超参数组合;步骤4c)将最优超参数组合输入至Xgboost算法中,利用满足Xgboost算法输入要求的训练集对含有最优超参数组合的Xgboost算法进行模型训练,得到Xgboost算法不良地质预测模型。步骤5)对Xgboost算法不良地质预测模型进行评估:步骤5a)利用测试集对Xgboost算法不良地质预测模型进行测试,并将测试得到的不良地质类型预测值与测试集中的不良地质类型真实值进行对比,得到Xgboost算法不良地质预测模型预测结果的正确率accuracy;步骤5b)判断正确率accuracy是否小于预先设置阈值,若是,执行步骤(2),否则保存Xgboost算法不良地质预测模型。不良地质预测模型预测结果的正确率accuracy计算公式为:accuracy=(TP+TN)/(P+N)其中,accuracy为不良地质预测模型预测结果正确率,TP为实际为正例且被预测为正例的样本数,TN为实际为负例且被预测为负例的样本数,P为正例样本总数,N为负例样本总数。步骤6)对盾构施工过程中不良地质类型进行预测:从盾构机PDV数据采集系统采集到的盾构施工过程中PDV实时数据中获取表征地层变化的掘进参数关键数据特征对应的数据,并将其输入到Xgboost算法不良地质预测模型中,得到盾构施工过程中不良地质类型的预测值。以下通过仿真实验,对本发明的效果作进一步说明:1.仿真条件:本发明的数据仿真实验是在主频2.4GHZ的Intel(R)Core(TM)2Duo、内存4GB的硬件环境和Anacondaspyder软件环境下进行的;实验中采用的数据为宁波地铁体育馆-明楼段盾构机掘进的真实数据,共有28个特征,其中有27个掘进参数特征,1个地质参数特征,共计600条数据记录;掘进参数特征包括:贯入度、土压、上、下、左、右方向的千斤顶推力、刀盘转速、刀盘扭矩、掘进速度、回转角、俯仰角、总推力、总油压、千斤顶行程、千斤顶速度、螺旋机转速、螺旋机扭矩、注浆压力、注浆量、X坐标、Y坐标、Z坐标和盾尾间隙,盾构姿态数据包括切口的水平偏差和垂直偏差,以及盾尾的水平偏差和垂直偏差;地质参数特征中含有三种地质数据为:软弱地层、软硬交互地层和孤石地层。2.仿真内容:采用本发明基于Xgboost的盾构施工不良地质类型的预测方法对宁波地铁体育馆-明楼段盾构机掘进的真实数据进行预测仿真,仿真结果如图2所示。具体仿真步骤为:1):数据预处理:由于原始数据可能存在缺失值和由盾构开关机、盾构故障以及盾构司机盲目操作等带来的异常值数据,所以要对实验数据进行数据预处理,首先利用均值填补法进行缺失值填补、并通过3σ西格玛方法进行异常值检测并利用异常值所处列的平均数对异常值进行替换,最后进行归一化处理,将其归一化到[0,1]区间中,得到预处理后的实验数据。预处理后的数据如下表1所示:表1数据预处理之后的数据2):获取预处理后的掘进参数数据的关键特征:采用随机森林(RF)灰盒算法建立特征提取模型对预处理后数据集进行特征提取,获得预处理后的掘进参数数据的关键特征;设置迭代次数k=10000,阈值δ=22在不断迭代的RF算法中,利用RF算法的变量重要性度量对特征进行排序,并寻找较大影响因子的叶子节点给予保留,多次迭代进行比较,目的剔除掉流量数据中无关的、冗余的特征,最终得到预处理后的掘进参数数据的关键特征。如下表2所示:表2预处理后的掘进参数数据的关键特征特征种类重要度得分盾构机总推力84.806推进速度70.104刀盘扭矩59.871刀盘转速38.956贯入度26.4143):构建不良地质预测数据包:提取预处理后的掘进参数数据中与掘进参数关键数据特征对应的数据,组成掘进参数特征数据集,并将其与地质特征数据合并为不良地质预测数据包。如下表3所示:表3不良地质预测数据包展示5):建立Xgboost算法不良地质预测模型:5a)将不良地质预测数据包中80%的特征数据作为训练集,其余的特征数据作为测试集;5b)利用python程序语言调用LabelBinarizer模块对训练集中软弱地层、软硬交换地层、孤石底层进行地质特征二值化编码,将软弱地层、软硬交换地层、孤石底层转换为0、1、2,得到Xgboost算法输入要求的训练集;5c)将训练集数据加载至Xgboost自定义的数据矩阵类DMatrix中;5d)设置Xgboost算法中每一个超参数的范围,并利用GridSearchCV网格搜索法对所有超参数在设定的范围内进行遍历,得到最优模型精度的Xgboost的超参数组合;5e)设置Xgboost分类算法的参数,选择综合效果最优的参数,最终设置的Xgboost分类算法参数为:迭代次数为200,类别数目为3、分类器类型为gbtree、目标函数为multi:softmax、学习速率eta=0.3、树的最大深度max_depth=6;5f)利用满足Xgboost算法输入要求的训练集对含有最优超参数组合的Xgboost算法进行模型训练,得到Xgboost算法不良地质预测模型。6):利用Xgboost算法不良地质预测模型进行不良地质类型预测:将测试集输入至Xgboost算法不良地质预测模型中得到不良地质类型预测值,将不良地质类型预测值与测试集中不良地质类型真实值进行对比,得到Xgboost算法不良地质预测模型预测准确率为100%。3.仿真结果分析:图2(a)为测试集预测结果展示图,横坐标表示数据采集点,纵坐标表示不良地质类型,纵坐标上的0、1、2分别表示为软弱地层、软硬交互地层和孤石底层,实线表示不良地质类型预测结果,从数据采集点1到数据采集点48为软弱地层,从数据采集点49到数据采集点89为软硬交互地层,从数据采集点90到数据采集点105为孤石地层。图2(b)为测试集真实数据展示图,横坐标表示数据采集点,纵坐标表示不良地质类型,纵坐标上的0、1、2分别表示为软弱地层、软硬交互地层和孤石底层,实线表示不良地质类型真实数据。从数据采集点1到数据采集点48为软弱地层,从数据采集点49到数据采集点89为软硬交互地层,从数据采集点90到数据采集点105为孤石地层。对比图2(a)和图2(b)可得,本发明对于不良地质类型预测准确率为100%,和现有技术相比,本发明提高了对不良地质类型预测的准确率。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1