一种施工数据可靠性的预测方法、系统、设备及存储介质

文档序号:37637818发布日期:2024-04-18 17:56阅读:8来源:国知局
一种施工数据可靠性的预测方法、系统、设备及存储介质

本发明涉及计算机,尤其涉及一种施工数据可靠性的预测方法、系统、设备及存储介质。


背景技术:

1、在施工的安全管理过程中,时常需要对各项施工参数进行预测,例如隧道施工时建筑物倾斜率(btr)的预测。在进行预测时,通常需要输入施工数据,但是输入的数据可靠性不稳定,可能出现不太可靠的数据,例如从传感器中收集的定量数据可能由于恶劣工作环境的影响或者传感器退化的影响而变得不可靠,而从工程师那里收集的定性数据可能会受到歧义或者知识限制的影响而变得不可靠。此外,隧道施工数据计算、传输或者记录中的错误也可能导致数据不太可靠。采用不可靠的数据得到的预测结果可能会误导决策者采取不适当的措施。

2、在实际施工实践中,现有技术使用多个标签,例如来自多个传感器的冗余读数、专家知识等,通过交叉检查来识别和区分可靠数据和不可靠数据。例如,在btr预测的场景下,记录中的每个切削扭矩是掘进机(tbm)在一段时间内(例如一小时)的多个读数的平均值,沉降是地铁隧道施工现场关键位置的多个传感器读数的平均数,然后计算平均切削扭矩或者沉降。从这个意义上讲,多个读数被用作多个标签。当多个读数不可用时,通常会咨询现场工程师,在单个读数成为正式记录之前对其进行检查,此时,专家知识被用作第二个标签。无论哪种方式,都需要获取多个标签来相互证实,以帮助区分可靠数据和不可靠数据,这是一种常见的工程实践。

3、然而,当隧道施工数据只有一个标签时,例如,当数据已被记录且无法重新收集数据时。对于这种单标签数据,上述传统的基于多标签的交叉检查不再适用,因此,这种方法具有局限性,适用范围较小。


技术实现思路

1、本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提出一种适用范围广、预测准确度高的施工数据可靠性的预测方法、系统、设备及存储介质。

2、一方面,本发明实施例提供了一种施工数据可靠性的预测方法,包括:

3、获取施工数据的总数据集,根据所述总数据集确定第一训练数据集和第一测试数据集;

4、采用改进助推算法对所述第一训练数据集进行助推操作,更新所述第一训练数据集中每个子数据组的权重;

5、基于所述权重,采用改进装袋算法为每个所述子数据组生成多个数据标签,根据所述数据标签识别所述子数据组的数据类型,并根据所述数据类型更新所述第一训练数据集;其中,所述数据类型包括可靠数据和不太可靠数据;所述可靠数据是具有一致输入输出关系的所述施工数据;所述不太可靠数据是输入输出关系不一致的所述施工数据;

6、重复执行所述采用改进助推算法对所述第一训练数据集进行助推操作,更新所述第一训练数据集的权重的步骤,直至边际贡献降低至预定阈值以下,得到权重更新后的第二训练数据集;

7、所述根据所述第二训练数据集和所述第一测试数据集,得到目标施工数据可靠性识别模型;

8、通过所述目标施工数据可靠性识别模型对待识别施工数据进行可靠性识别,得到可靠性识别结果。

9、可选地,所述采用改进助推算法对所述第一训练数据集进行助推操作,更新所述第一训练数据集中每个子数据组的权重,包括以下之一:

10、对于第一轮助推,根据所述子数据组的数据类型,更新所述子数据组的权重;

11、对于第r轮助推,当所述子数据组在前一轮次中被识别为不可靠数据,则更新所述子数据组的权重。

12、可选地,所述基于所述权重,采用改进装袋算法为每个所述子数据组生成多个数据标签,根据所述数据标签识别所述子数据组的数据类型,包括:

13、对所述第一训练数据集中进行随机采样,得到若干个子训练数据集;其中,每个所述子训练数据集的大小相同;

14、通过训练后的子模型计算所述子数据组的输出误差,采用基线模型根据所述输出误差生成数据标签;其中,所述子模型是根据子训练数据集构建的;

15、根据所述数据标签计算所述子数据组的度量误差;

16、根据所述度量误差对所述子数据组进行排序筛选,得到所述第一训练数据集的数据类型。

17、可选地,所述根据所述第二训练数据集和所述第一测试数据集,得到目标施工数据可靠性识别模型,包括:

18、根据所述第二训练数据集构建第一施工数据可靠性识别模型;

19、采用所述第一测试数据集对所述第一施工数据可靠性识别模型进行模型验证,得到目标施工数据可靠性识别模型。

20、可选地,所述方法还包括:

21、配置改进装袋算法的算法模型参数;其中,所述模型参数包括子模型的数量和子训练数据集的大小。

22、可选地,所述输出误差的计算公式为:

23、

24、其中,表示第p个子数据组在第r轮的输出误差;yp表示第p个子数据组的实际输出,表示第r轮中第s个子模型的第p个估计输出。

25、可选地,对于第一轮助推,所述边际贡献的计算公式为:

26、

27、其中,δctr(1)表示第一轮助推的边际贡献;mmae1表示第一轮助推的平均绝对误差;mmae0表示第一训练数据集的平均绝对误差;nd1表示第一轮助推的数据组数量;nd0表示第一训练数据集的数据组数量。

28、对于第r轮助推,所述边际贡献的计算公式为:

29、

30、其中,δctr(r+1)表示第r+1轮助推的边际贡献;mmaer+1表示第r+1轮助推的平均绝对误差;maer表示第r轮的平均绝对误差;ndr+1表示第r+1轮助推的子数据组数量;ndr表示第r轮助推的子数据组数量;δmmaer表示本次助推前后的平均绝对误差的差值;δnd表示本次助推前后的子数据组数量的差值。

31、另一方面,本发明实施例还提供了一种施工数据可靠性的预测系统,包括:

32、第一模块,用于获取施工数据的总数据集,根据所述总数据集确定第一训练数据集和第一测试数据集;

33、第二模块,用于采用改进助推算法对所述第一训练数据集进行助推操作,更新所述第一训练数据集中每个子数据组的权重;

34、第三模块,用于基于所述权重,采用改进装袋算法为每个所述子数据组生成多个数据标签,根据所述数据标签识别所述子数据组的数据类型,并根据所述数据类型更新所述第一训练数据集;其中,所述数据类型包括可靠数据和不太可靠数据;所述可靠数据是具有一致输入输出关系的所述施工数据;所述不太可靠数据是输入输出关系不一致的所述施工数据;

35、第四模块,用于重复执行所述采用改进助推算法对所述第一训练数据集进行助推操作,更新所述第一训练数据集的权重的步骤,直至边际贡献降低至预定阈值以下,得到权重更新后的第二训练数据集;

36、第五模块,用于所述根据所述第二训练数据集和所述第一测试数据集,得到目标施工数据可靠性识别模型;

37、第六模块,用于通过所述目标施工数据可靠性识别模型对待识别施工数据进行可靠性识别,得到可靠性识别结果。

38、需要说明的是,一些实施例中,系统还可以包括如下模块:

39、第七模块,用于配置改进装袋算法的算法模型参数;其中,所述模型参数包括子模型的数量和子训练数据集的大小。

40、另一方面,本发明实施例还提供了一种电子设备,包括:处理器以及存储器;存储器用于存储程序;处理器执行程序实现如前面所述的方法。

41、另一方面,本发明实施例还提供了一种计算机存储介质,其中存储有处理器可执行的程序,处理器可执行的程序在由处理器执行时用于实现如前面所述的方法。

42、本发明实施例具有如下有益效果:本发明实施例基于施工数据预测的输入输出关系定义可靠数据和不太可靠数据,并采用改进装袋算法为子数据组生成多个数据标签,进而识别数据类型进行以更新第一训练数据集的训练方式,结合改进助推算法更新不同数据类型的子数据组的权重,能够得到具有合适权重的训练数据集,其构建的目标施工数据可靠性识别模型能够广泛而准确地对施工数据进行类型划分。此外,通过改进助推程序能够控制训练的速度,改善拟合不足或者过度拟合的情况。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1