一种基于多任务学习的地压灾害预测方法及装置

文档序号:36171990发布日期:2023-11-24 10:44阅读:27来源:国知局
一种基于多任务学习的地压灾害预测方法及装置

本发明涉及数据分析与预测,特别是指一种基于多任务学习的地压灾害预测方法及装置。


背景技术:

1、随着浅部矿产资源的逐渐枯竭,我国矿产资源开发正逐步进入深部采矿阶段,随开采深度增加,开采扰动更易破坏岩体原始应力平衡,诱发岩爆、冒顶、塌方等地压灾害。地压灾害的突发性、随机性和危害性不仅大大限制了施工效率,更是严重威胁着工人和设备的安全。

2、微震监测作为非接触式、实时、动态的空间三维监测手段,具有监测范围广、信息量大的优点,因而广泛应用在金属非金属矿山和隧道等地下工程的地压灾害监测中,但目前基于微震监测数据的地压灾害预测预警方法并未或较少的考虑了时间因素,大多为事后分析,预警的时效性低,超前分析能力较差,一定程度上影响地压灾害防治的工作效率、效果;此外,地压灾害发生前微震参数较正常期间会出现明显偏离,仅通过当前的数据进行地压灾害预测预警,会很大程度的降低地压灾害预测预警的时效性和准确性。因此通过对微震时序数据的变化进行准确预测,将微震事件的时间节点前移,可为地压灾害防治工作提供更充分的时间保障。

3、微震时序数据是一种动态的、非线性的时序数据,受采场周围多种因素的综合影响,变化规律难以分析掌握,并且多个类型的微震时序数据彼此之间的变化往往都是存在联系的,例如在累计视体积的急剧增大时,微震事件数往往会随之陡增,而能量指数和施密特数会快速下降。但在目前的研究中,往往是只单独考虑某个指标并分别进行预测,将各个指标割裂开来,无法反映各指标之间的内在联系,也难以发掘各指标之间的复杂关系。目前微震时序数据预测方法大致可分为经典时序建模(arma、arima等)、深度学习(rnn、gru、lstm等)、机器学习(lightgbm、xgboost、random forest等)三类。目前地压灾害预测在面对多个微震时序数据预测任务时存在的主要缺点有:(1)效率低,需要采用多个模型去预测多个微震时序数据,当面对较大的微震时序数据集时,模型参数较多,模型预测时间、计算成本、存储成本和维护成本更高。(2)效果差,由于部分微震时序数据稀疏或不平衡,例如累计视体积时序数据集中存在很多不变或变化很小的数据,影响数据特性提取,导致模型过拟合严重。(3)预测结果偏离真实的微震数据特征,受凿岩作业、爆破作业、机械振动和电磁干扰等因素影响,微震时序数据中不可避免的存在一些噪声,预测值往往会继承原始数据中的噪声特征,无法反映真实的微震信号特征,从而影响后续数据分析的准确性和可靠性。


技术实现思路

1、本发明实施例提供了一种基于多任务学习的地压灾害预测方法及装置。本技术主要针对地压灾害预测效率低,效果差和预测结果偏离真实的微震数据特征的问题,本技术不仅可以提高地压灾害预测的效率,精度,还可以保留真实的微震数据特征。所述技术方案如下:

2、一方面,本技术实施例提供了一种基于多任务学习的地压灾害预测方法,包括以下步骤:

3、s1: 从微震震源的参数数据,提取微震时序数据;

4、s2: 对微震时序数据进行预处理,得到输入向量,所述预处理包括数据重采样、缺失数据处理和数据归一化;

5、s3: 将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数、累计能量、累计视体积及能量指数,进行地压灾害预测,

6、其中,所述地压灾害预测模型是基于attention-lstm-mtl神经网络的多任务学习模型,所述多任务学习模型包含两层堆叠式的lstm网络、attention模块和四个全连接层,所述两层堆叠式lstm网络包含遗忘门、输入门和输出门。

7、优选地, 所述s1的从微震震源的参数数据,提取微震时序数据,包括:

8、s11: 通过微震监测系统得到微震震源参数数据;

9、s12: 从微震震源参数数据提取微震时序数据。

10、优选地, 所述微震时序数据,包括事件数、累计能量、累计视体积及能量指数的时序数据。

11、优选地, 所述s2的对微震时序数据进行预处理,得到输入向量,包括:

12、s21: 通过公式(1)将微震时序数据进行数据重采样,得到固定频率的时序数据:

13、(1)

14、式中,为均值聚合函数,为固定频率的时序数据,为微震时序数据;

15、s22: 将固定频率的时序数据的缺失数据进行缺失数据处理,得到完整的时序数据;

16、s23: 通过公式(2)对完整的时序数据x_w进行数据归一化处理,得到输入向量:

17、(2)

18、式中,为输入向量,为完整的时序数据中的最小值,为完整的时序数据中的最大值。

19、优选地, 所述s22的将固定频率的时序数据的缺失数据进行缺失数据处理,得到完整的时序数据,包括:

20、s221: 选取固定频率的时序数据中存在缺失值的数据,得到缺失数据;

21、s222: 将缺失数据置零,得到完整的时序数据。

22、优选地, 在所述s3的将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数、累计能量、累计视体积及能量指数,包括:

23、s31: 将输入向量中的t时刻的输入和上一时刻的两层堆叠式的lstm网络输出进行拼接得到拼接后的向量;

24、s32: 将拼接后的向量输入遗忘门,基于公式(3)通过遗忘门的sigmoid神经网络层被映射到(0,1)之间,得到遗忘门的输出值:

25、(3)

26、式中,为遗忘门的输出值为输入向量中的t时刻的输入,为上一时刻的两层堆叠式的lstm网络输出,为遗忘门的sigmoid神经网络层的权重, 为遗忘门的sigmoid神经网络层的偏差;

27、s33: 将拼接后的向量第一次输入到输入门,按照公式(4)通过sigmoid神经网络层映射到(0,1)区间,得到输入门第一次输出值,再通过tanh神经网络层将输入门第一次输出值映射到(-1,1)区间,生成状态候选向量:

28、(4)

29、式中,为输入门第一次输出值,为输入向量中的t时刻的输入,为上一时刻的lstm网络输出,为状态候选向量,为输入门的sigmoid神经网络层的权重,为输入门的sigmoid神经网络层的偏差,为输入门的tanh神经网络层的权重,为输入门的tanh神经网络层的偏差;

30、s34: 基于遗忘门输出值,通过公式(5)对状态候选量进行更新,得到更新后的状态候选量:

31、(5)

32、式中,为状态候选向量,为更新后的状态候选量,为选择性遗忘的t-1时刻传递的信息,为需要新加入的信息;

33、s35: 将拼接后的向量第二次输入输出门,按照公式(6)通过sigmoid神经网络层映射到(0,1)区间,并和更新后的状态候选量整合得到t时刻的输入门第二次输出值:

34、(6)

35、式中,为输入门第二次输出值,为输入向量中的t时刻的输入,为上一时刻的lstm网络输出,为更新后的输入门的sigmoid神经网络层的权重,为输入门中sigmoid神经网络层的偏差;

36、s36: 将输入门第二次输出值输入attention模块,按照公式(7)根据时间步重要性不同分配相应的权重,得到输入门第二次输出值的注意力分数:

37、(7)

38、式中,为注意力分数,为全连接层的权重,为全连接层的偏差,为lstm网络输出,tanh为全连接层激活函数;

39、s37: 基于公式(8),输入所述注意力分数,通过softmax函数计算得到t时刻的输入门第二次输出值所对应的注意力权重:

40、(8)

41、式中,为注意力分数,为注意力权重;

42、s38: 基于公式(9),输入所述注意力权重对t时刻的输入门第二次输出值进行加权求和得到attention模块的输出值:

43、(9)

44、式中,为注意力权重,为lstm网络输出,为attention模块的输出值;

45、s39: 将attention模块的输出值输入四个全连接层来输出预测数值,所述预测数值包括:预测的事件数、累计能量、累计视体积及能量指数,所述四个全连接层对应四个任务。

46、优选地, 在所述s3将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数、累计能量、累计视体积及能量指数之前,所述方法还包括:

47、s0:通过训练数据对初始的基于attention-lstm-mtl神经网络的多任务学习模型进行训练,得到预训练的地压灾害预测模型;

48、所述s0的通过训练数据对初始的基于attention-lstm-mtl神经网络的多任务学习模型进行训练,得到预训练的地压灾害预测模型,包括:

49、s01: 搜集训练数据,所述训练数据包括从微震时序数据中提取的四个任务的样本特征和样本标签;

50、s02: 构建包含四个任务的用于预测地压灾害的初始的基于attention-lstm-mtl神经网络的多任务学习模型,所述初始的基于attention-lstm-mtl神经网络的多任务学习模型包括:输入层、共享层、线性层和输出层,所述输入层包含四个输入向量,所述四个任务为事件数预测、累计能量预测、累计视体积预测及能量指数预测;

51、s03: 对用于预测地压灾害的初始的基于attention-lstm-mtl神经网络的多任务学习模型进行初始化,设置超参数,并随机初始化各层权重;

52、s04: 将训练集样本特征及对应的四个任务的样本标签,并输入初始的基于attention-lstm-mtl神经网络的多任务学习模型,并通过动态权重对模型进行训练;

53、s05: 在训练过程中,采用mse损失函数分别计算各任务的损失值,基于公式(10),(11)将四个损失函数值进行加权求和,得到总损失值:

54、(10)

55、(11)

56、式中,表示第i个任务的损失值,表示总损失值,表示第i个任务在第j时刻的实际值,表示第i个任务在第j时刻的预测值,n为样本数量,表示第i个任务的权重;

57、s06: 基于公式(12),利用总损失值,采用动态权重的方式对各任务损失值进行加权,并根据任务的训练进展进行动态调整,得到预测值:

58、(12)

59、式中,表示将要投入下个m轮次训练的第i个任务的权重值,为本轮次计算得到的各任务损失值,为本轮次计算得到的总损失值;

60、s07: 将预测值反归一化后,通过评价指标判断模型的性能,若模型的性能满足预设的预测精度要求,将模型参数保存并输出模型,得到预训练的地压灾害预测模型。

61、第二方面,本技术实施例提供了一种基于多任务学习的地压灾害预测装置,包括以下步骤:

62、数据单元: 用于从微震震源的参数数据,提取微震时序数据;

63、预处理单元: 用于对微震时序数据进行预处理,得到输入向量,所述预处理包括数据重采样、缺失数据处理和数据归一化;

64、预测单元: 用于将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数、累计能量、累计视体积及能量指数,所述地压灾害预测模型是基于attention-lstm-mtl神经网络的多任务学习模型,所述多任务学习模型包含两层堆叠式lstm网络、attention模块和四个全连接层,所述两层堆叠式lstm网络包含遗忘门、输入门和输出门。

65、第三方面,本技术实施例提供了一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行如上所述的方法。

66、第四方面,本技术实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的方法。

67、本发明实施例提供的技术方案带来的有益效果至少包括:上述方案,采用单个模型进行多个微震时序数据联合预测,提高地压灾害预测模型的计算效率,降低计算成本和内存占用。将波动较小的微震时序数据集和其他数据集一起学习,通过共享信息相互补充和约束,缓解模型的过拟合,提高模型泛化能力。采用多任务学习的方法进行多个微震时序数据预测,有效发掘多个微震时序数据之间的耦合信息,每个任务都能从其他任务中获得有用的信息和反馈,进而提升各个微震时序数据预测任务的预测精度。同时由于不同任务噪声趋向于不同的方向,多任务学习一定程度上抵消了部分噪声,起到隐式数据增强的作用,提升模型预测效果和鲁棒性。通过动态权重对多任务学习过程进行训练,使得模型训练过程更加灵活,避免出现“部分任务已经过拟合,而部分任务仍然欠拟合”的问题,使得各任务均能达到较好的预测效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1