基于分类回归决策树算法的盾构施工地质识别方法及系统与流程

文档序号:17696070发布日期:2019-05-17 21:32阅读:362来源:国知局
基于分类回归决策树算法的盾构施工地质识别方法及系统与流程

本发明涉及地质识别领域,特别是涉及一种基于分类回归决策树算法的盾构施工地质识别方法及系统。



背景技术:

盾构是一种用于隧道施工的全机械化施工装备,具有效率高、安全性好的特点。在实际施工时,地质条件会对盾构施工造成很大影响。例如在不同的地质条件下,盾构的刀盘设计、控制系统和施工管理等都会有很大区别。因此,对盾构施工段的地质进行识别一直是该领域的研究热点。现在存在一些通过机器学习算法对盾构施工地质进行识别的方法,但是由于盾构机载参数种类多,所以需要从中选择若干重要参数作为算法输入,然而这一过程需要依赖工程经验或者额外的特征选择算法,这些方法增加了计算时间成本的同时也提高了实际应用的难度。



技术实现要素:

本发明的目的是提供一种基于分类回归决策树算法的盾构施工地质识别方法及系统,能够快速准确的对地质进行识别。

为实现上述目的,本发明提供了如下方案:

一种基于分类回归决策树算法的盾构施工地质识别方法,所述方法包括:

获取盾构传感器采集的原始数据;

对所述原始数据进行清洗,得到清洗数据;

获取地质特征和工程需求;

将已探明的试掘进段的所述清洗数据按照所述地质特征和所述工程需求进行分类,得到多个分类地质标签;

将所述地质标签通过施工里程与机载参数相匹配,得到有地质标签的训练集;

将所述训练集作为输入量代入分类回归决策树机器学习模型中,得到地质识别模型;

根据所述地质识别模型识别盾构施工地质。

可选的,所述对所述原始数据进行清洗,得到清洗数据,具体包括:

当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比小于设定值时,对这部分数据进行清除,得到清除后的数据;

当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比大于设定值时,对这部分数据采用插值填充方法填补修正数据,得到填补后的数据;

根据所述清除后的数据和所述填补后的数据,得到清洗数据。

可选的,所述机载参数包括盾构施工的操作参数和盾构施工的响应参数。

可选的,所述根据所述地质识别模型去识别盾构施工地质,具体包括:

在识别的地质有两类的情况下,根据所述地质识别模型选择auc作为模型评价指标,所述auc表示roc曲线下与坐标轴围成的面积;

在识别的地质有三类或以上时,根据所述地质识别模型选择准确率作为模型评价指标。

一种基于分类回归决策树算法的盾构施工地质识别系统,所述系统包括:

第一获取模块,用于获取盾构传感器采集的原始数据;

清洗模块,用于对所述原始数据进行清洗,得到清洗数据;

第二获取模块,用于获取地质特征和工程需求;

分类模块,用于将已探明的试掘进段的所述清洗数据按照所述地质特征和所述工程需求进行分类,得到多个分类地质标签;

结合模块,用于将所述地质标签通过施工里程与机载参数相匹配,得到有地质标签的训练集;

模型建立模块,用于将所述训练集作为输入量代入分类回归决策树机器学习模型中,得到地质识别模型;

识别模块,用于根据所述地质识别模型识别盾构施工地质。

可选的,所述清洗模块,具体包括:

清除单元,用于当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比小于设定值时,对这部分数据进行清除,得到清除后的数据;

填补单元,用于当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比大于设定值时,对这部分数据采用插值填充方法填补修正数据,得到填补后的数据;

结合单元,用于根据所述清除后的数据和所述填补后的数据结合,得到清洗数据。

可选的,所述机载参数包括盾构施工的操作参数和盾构施工的响应参数。

可选的,所述识别模块,具体包括:

auc评价单元,用于在识别的地质有两类的情况下,根据所述地质识别模型选择auc作为模型评价指标,所述auc表示roc曲线下与坐标轴围成的面积;

准确率评价单元,用于在识别的地质有三类或以上时,根据所述地质识别模型选择准确率作为模型评价指标。

根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供一种基于分类回归决策树算法的盾构施工地质识别方法,包括:获取盾构传感器采集的原始数据;对所述原始数据进行清洗,得到清洗数据;获取地质特征和工程需求;将已探明的试掘进段的所述清洗数据按照所述地质特征和所述工程需求进行分类,得到多个分类地质标签;将所述地质标签通过施工里程与机载参数相匹配,得到有地质标签的训练集;将所述训练集作为输入量代入到分类回归决策树机器学习模型中,得到地质识别模型;根据所述地质识别模型识别盾构施工地质。采用本发明的方法能够快速准确的对地质进行识别。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例基于分类回归决策树算法的盾构施工地质识别方法流程图;

图2为本发明实施例基于分类回归决策树算法的盾构施工地质识别系统结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于分类回归决策树算法的盾构施工地质识别方法及系统,能够快速准确的对地质进行识别。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例基于分类回归决策树算法的盾构施工地质识别方法流程图。如图1所示,一种基于分类回归决策树算法的盾构施工地质识别方法,所述方法包括:

步骤101:获取盾构传感器采集的原始数据;

步骤102:对所述原始数据进行清洗,得到清洗数据;

步骤103:获取地质特征和工程需求;

步骤104:将已探明的试掘进段的所述清洗数据按照所述地质特征和所述工程需求进行分类,得到多个分类地质标签;此步骤依赖于试掘进区间已经探明的地质情况,并且根据工程实际中所需要不同对待的地质条件进行分类;

步骤105:将所述地质标签通过施工里程与机载参数相匹配,得到有地质标签的训练集;所述机载参数包括盾构施工的操作参数和盾构施工的响应参数,所述盾构施工的操作参数包括进尺、刀盘转速等;所述盾构施工的响应参数包括总推力,刀盘扭矩等;

步骤106:将所述训练集作为输入量代入到分类回归决策树机器学习模型中,得到地质识别模型;

步骤107:根据所述地质识别模型识别盾构施工地质。

步骤102,具体包括:

当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比小于设定值时,对这部分数据进行清除,得到清除后的数据;

当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比大于设定值时,对这部分数据采用插值填充方法填补修正数据,得到填补后的数据;

根据所述清除后的数据和所述填补后的数据,得到清洗数据。

在施工过程中,由于实际工况复杂,盾构传感器常处在极端工作环境下,所以盾构机载参数中常常会有异常值与缺失值。本步骤的目的是处理这些异常值与缺失值并检验各个传感器返回值之间的一致性。

步骤107,具体包括:

在识别的地质有两类的情况下,根据所述地质识别模型选择auc作为模型评价指标,所述auc表示roc曲线下与坐标轴围成的面积;

在识别的地质有三类或以上时,根据所述地质识别模型选择准确率作为模型评价指标。

本发明的方法无需额外结合其他算法进行特征筛选,可以将全部参数作为输入,分类回归决策树算法自身会选用基尼系数或信息熵方法,甄别出有效参数作为特征输入构建模型,且与其他几种常见的机器学习算法相比,分类回归决策树模型均体现出较短的训练时间与预测时间。

图2为本发明实施例基于分类回归决策树算法的盾构施工地质识别系统结构图。如图2所示,一种基于分类回归决策树算法的盾构施工地质识别系统,所述系统包括:

第一获取模块201,用于获取盾构传感器采集的原始数据;

清洗模块202,用于对所述原始数据进行清洗,得到清洗数据;

第二获取模块203,用于获取地质特征和工程需求;

分类模块204,用于将已探明的试掘进段的所述清洗数据按照所述地质特征和所述工程需求进行分类,得到多个分类地质标签;

结合模块205,用于将所述地质标签通过施工里程与机载参数相匹配,得到有地质标签的训练集;所述机载参数包括盾构施工的操作参数和盾构施工的响应参数,所述盾构施工的操作参数包括进尺、刀盘转速等;所述盾构施工的响应参数包括总推力,刀盘扭矩等;

模型建立模块206,用于将所述训练集作为输入量代入到分类回归决策树机器学习模型中,得到地质识别模型;

识别模块207,用于根据所述地质识别模型识别盾构施工地质。

所述清洗模块202,具体包括:

清除单元,用于当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比小于设定值时,对这部分数据进行清除,得到清除后的数据;

填补单元,用于当传感器传回的原始数据中的无效值、缺失值无法进行后续数据处理部分的数据量占比大于设定值时,对这部分数据采用插值填充方法填补修正数据,得到填补后的数据;

结合单元,用于将所述清除后的数据和所述填补后的数据结合,得到清洗数据。

所述识别模块207,具体包括:

auc评价单元,用于在识别的地质有两类的情况下,根据所述地质识别模型选择auc作为模型评价指标,所述auc表示roc曲线下与坐标轴围成的面积;

准确率评价单元,用于在识别的地质有三类或以上时,根据所述地质识别模型选择准确率作为模型评价指标。

与现有的一些基于机器学习对盾构施工地质进行识别的方法相比,本发明的积极效果是:

1)在输入模型进行训练之前无需额外的特征工程步骤;2)算法简便,模型训练时间成本低;3)不同于人工神经网络等机器学习算法内部的“黑箱”结构,由于分类回归决策树算法有着明确的分类过程,可解释性强且便于可视化分析。

具体实施例1:

本实施例所用的是天津地铁3号线的盾构掘进机载参数

步骤一:数据清洗。在本例中去除的无效值、缺失值占总数据量的比例大约为8%。

步骤二:将已探明地质情况的试掘进段按照工程需求和地质特征分为不同的类。表1为地质分类表,本实施例中,将地质分为三类,如表1所示:

表1地质分类表

步骤三:将地质分类通过施工里程与预处理过的机载参数对应,形成有地质标签的训练集。

步骤四:将训练集作为输入量带入分类回归决策树机器学习算法中形成地质识别模型。本实施例模型的参数设置为:最大深度为5;所选用的特征筛选方法为信息熵选择法,该特征筛选方法基本原理如下:

信息熵的定义:h(xi)=-∑p(xi)logp(xi)

其中p(xi)为被识别为xi类的概率。信息熵可以用来表示识别结果的不确定度。用未识别时的信息熵减去经过某个特征识别后的信息熵,由此得到该特征的信息熵增益。随后选用信息熵增益较大的几个特征作为输入参数建立模型。

本实施例将已探明的试掘进段的所述清洗数据的数据集按照8:2的比例分别划分为训练集和测试集。表2为地质识别方法对比表。本实施例与支持向量机svm机器学习算法所建立的地质识别模型在测试集中的结果对比如表2所示,其中支持向量机svm地质识别模型使用了事先确定的7个机载参数作为输入。

表2地质识别方法对比表

该结果说明相较于其他算法,基于分类回归决策树机器学习算法的地质识别模型具有更短的模型训练时间和更高的预测准确率,而且本方法自身具有关键参数的筛选步骤,无需事先确定输入参数,操作简便便于应用。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1