1.一种基于Xgboost的盾构施工不良地质类型预测方法,其特征在于,包括如下步骤:
(1)对盾构机的PDV历史数据进行预处理:
从盾构机PDV数据采集系统中获取包括地质特征数据和多个不同掘进参数数据的PDV历史数据,并对多个不同掘进参数数据进行预处理,得到包含多个预处理后的掘进参数数据的掘进参数数据集;
(2)获取预处理后的多个掘进参数数据的关键特征:
建立随机森林算法特征提取模型,并利用地质特征数据和掘进参数数据集对随机森林算法特征提取模型进行训练,得到包含多个表征地层变化的掘进参数关键数据特征的掘进参数关键数据特征集;
(3)构建不良地质预测数据包:
提取掘进参数数据集中与掘进参数关键数据特征集中所有特征对应的数据,组成掘进参数特征数据集,并将其与地质特征数据合并为不良地质预测数据包;
(4)建立Xgboost算法不良地质预测模型:
将不良地质预测数据包中80%的特征数据作为训练集,其余的特征数据作为测试集,并利用训练集对Xgboost算法不良地质预测模型进行训练,得到Xgboost算法不良地质预测模型;
(5)对Xgboost算法不良地质预测模型进行评估:
(5a)利用测试集对Xgboost算法不良地质预测模型进行测试,并将测试得到的不良地质类型预测值与测试集中的不良地质类型真实值进行对比,得到Xgboost算法不良地质预测模型预测结果的正确率accuracy;
(5b)判断正确率accuracy是否小于预先设置阈值,若是,执行步骤(2),否则保存Xgboost算法不良地质预测模型。
(6)对盾构施工过程中不良地质类型进行预测:
从盾构机PDV数据采集系统采集到的盾构施工过程中PDV实时数据中提取掘进参数关键数据特征集中所有特征对应的数据,并将其输入到Xgboost算法不良地质预测模型中,得到盾构施工过程中不良地质类型的预测值。
2.根据权利要求1所述的基于Xgboost的盾构施工不良地质类型预测方法,其特征在于,步骤(1)所述的对多个不同掘进参数数据进行预处理,包括如下步骤:
(1a)对多个不同掘进参数数据进行缺失值检测,并对存在缺失值的多个不同掘进参数数据进行平均数填充,得到包含多个完整的掘进参数数据的掘进参数数据集;
(1b)判断p(|x-μ|>3σ)≤0.003是否成立,若是,则将掘进参数数据集中的观察值x作为掘进参数数据异常值,并执行步骤(1c),否则,掘进参数数据集中不存在异常值,执行步骤(1d),其中x为掘进参数数据集中的观察值,μ为掘进参数数据集中每个掘进参数的平均值,σ为掘进参数数据集中每个掘进参数的标准差,p为观察值x和平均值μ的差值超过3倍标准差σ的概率;
(1c)利用掘进参数数据集中掘进参数数据的平均值对相应掘进参数数据异常值进行替换,得到不存在异常值且完整的掘进参数数据集;
(1d)利用公式x*=(x-xmin)/(xmax-xmin)对不存在异常值且完整的掘进参数数据集进行归一化,得到含多个预处理后的掘进参数数据的掘进参数数据集,其中x*为预处理后的数据集,x为不存在异常值且完整的掘进参数数据集,xmin为不存在异常值且完整的掘进参数数据集的最小值,xmax为不存在异常值且完整的掘进参数数据集的最大值。
3.根据权利要求1所述的基于Xgboost的盾构施工不良地质类型预测方法,其特征在于,步骤(2)所述的获取预处理后的多个掘进参数数据的关键特征,具体包括如下步骤:
(2a)以掘进参数数据集X为输入,以地质特征数据Y为输出,构建基于随机森林算法的特征提取模型;
(2b)利用随机森林算法的特征提取模型中决策树Fi的袋外数据oobi,计算决策树Fi的袋外数据误差erroobi,i为决策树的序号;
(2c)对袋外数据oobi中的每个掘进参数数据加入噪声干扰,并计算决策树Fi的袋外数据误差err'obbi;
(2d)计算掘进参数数据集X的每个数据特征的重要性VI,并将重要性VI大于预先设定的提取参数特征阈值δ的数据特征,作为能表征地层变化的掘进参数关键数据特征,得到包含多个表征地层变化的掘进参数关键数据特征的掘进参数关键数据特征集,其中,VI的计算公式为:
VI=∑(err'obbi-errobbi)/Ntree
其中,Ntree为随机森林中树的个数。
4.根据权利要求1所述的基于Xgboost的盾构施工不良地质类型预测方法,其特征在于,步骤(4)所述的利用训练集对Xgboost算法不良地质预测模型进行训练,实现步骤为:
(4a)对训练集中的地质特征数据进行二值化编码,得到满足Xgboost算法输入要求的训练集;
(4b)设置Xgboost算法中每一个超参数的范围,并利用GridSearchCV网格搜索法对所有超参数在设定的范围内进行遍历,得到最优模型精度的Xgboost的超参数组合;
(4c)将最优超参数组合输入至Xgboost算法中,利用满足Xgboost算法输入要求的训练集对含有最优超参数组合的Xgboost算法进行模型训练,得到Xgboost算法不良地质预测模型。
5.根据权利要求1所述的基于Xgboost的盾构施工不良地质类型预测方法,其特征在于,步骤(5b)所述的不良地质预测模型预测结果的正确率accuracy计算公式为:
accuracy=(TP+TN)/(P+N)
其中,accuracy为不良地质预测模型预测结果正确率,TP为实际为正例且被预测为正例的样本数,TN为实际为负例且被预测为负例的样本数,P为正例样本总数,N为负例样本总数。