样本集构建、基于泛化神经网络的地震监测方法及系统

文档序号:37020994发布日期:2024-02-09 13:14阅读:34来源:国知局
样本集构建、基于泛化神经网络的地震监测方法及系统

本发明属于地震监测以及预警,具体涉及一种样本集构建、基于泛化神经网络的地震监测方法及系统。


背景技术:

1、地震监测是地震学的主要任务,实时报告地震参数一直是地震预警(eew)的重要工作(hsiao等,2009;nakamura等,2009;allen和melgar,2019;allen和stogaitis,2022)。监测系统的效果不仅取决于其响应时间,还取决于其在地震初始阶段有限的波形数据中推断地震参数的能力(horiuchi等,2005;satriano等,2008;kuyuk和allen,2013)。当前的eew系统通常包括多个模块,包括数据处理、估计震源参数和警报过滤等(serdar kuyuk等,2013)。每个步骤都需要在地震学领域投入大量研究工作,以提高地震检测、震相拾取、相位关联、地震定位和震级评估的效率和准确性(li等,2018;ross等,2018;grigoli等,2018;satriano等,2011;zhang等,2019;mousavi和beroza,2020;mousavi和beroza,2020;lomax等,2012;baillard等,2013;zhu和beroza,2019;ross等,2019;liu等,2020;mousavi等,2020;zhang等,2022;zhu等,2022)。如果满足特定条件,例如区分远震事件、触发一定数量的台站、达到一定震级,并满足触发台站的百分比阈值(例如40%)等,就会触发警报(serdar kuyuk等,2013)。在每个处理步骤中涉及到复杂的经验阈值设置,这使得在eew系统中定义最佳警报标准成为一项挑战。实施过于严格的标准,例如要求触发太多或太大数量的台站,可能会对eew系统的实时效率产生负面影响,而宽松的标准可能导致虚报(chung等,2019)。因此,一个高效的实时监测算法不仅应该在不需要大量经验配置的情况下以简洁的方式进行计算,还应该能够在地震早期有限的数据条件下求解地震参数。

2、另一项无需人工干预的地震监测工作是涉及使用深度学习技术直接从波形中进行数据挖掘,以检测和定位地震(perol等,2018;kriegerowski等,2018;mousavi和beroza,2020a;mousavi和beroza,2020b;shen和shen,2021;van den ende等,2020;vinard等,2021;zhang等,2020;zhang等,2021;münchmeyer等,2021)。在这些方法中,通过直接从地震波形中提取特征来解决地震参数,绕过了许多需要复杂经验设置的中间步骤,例如各种阈值和警报标准。然而,由于台站的多样性分布和地质结构的多样性,监测神经网络的泛化问题仍然是一个挑战,目前还没有能够应用于全球不同地区并且能够应用多个台站进行实时监测预警的泛化神经网络模型。这些方法通常在应用于新区域时需要进行迁移学习。

3、此外,为了进行地震早期预警,神经网络需要从地震事件开始就处理已触发和尚未触发的台站(horiuchi等,2005;satriano等,2008),这增加了神经网络学习的复杂性,目前只有zhang等(2021)的方法能够实现从较少台站触发开始,实时监测地震的震级和位置,然而该方法只能针对意大利中部一个100km*50km的范围应用,一个特定地区的台站分布一般是固定的,训练和测试集所用的台站均是一样的,而应用到其他区域,面对新的台站分布,无法直接应用,需要重新训练。针对固定台站的问题,van den ende等(2020)开发了利用图神经网络实现从全波形数据中挖掘特征,估计震源位置和震级的方法,该方法中每个台站先独自提取特征,然后利用一些网络层综合每个台站的特征,最后得到地震位置和震级;该方法虽然避免了固体台站问题,但是无法实现从极少台站开始实时监测地震,并且认为台站输入顺序对结果没有影响,而且模型不能应用到训练数据以外的新区域。

4、由此可见,不同地区以及不同的台站分布约束了数据兼容性、更是给泛化神经网络的设计造成了技术障碍。


技术实现思路

1、本发明为了解决上述现有技术提及不同地区以及不同的台站分布造成的数据难以共享、目前还没有能够应用于全球不同地区并且能够应用多个台站进行实时监测预警的泛化神经网络模型的技术问题,本发明提供样本集构建、基于泛化神经网络的地震监测方法及系统。其中,本发明充分利用在全球各个区域内,相同震中距和深度的地震波形具有相同的p或s波等震相的走时,其波形在震相走时上都非常相似的关键性特征,提供一种样本集构建方法,其本质上为一种数据重组手段,利用其他地区的地震波数据,可以模拟出不同位置以及不同监测台站分布情形下的地震,这些地震具有泛化性,也就是面对任何地区任何监测方案情况下,实际产生的地震数据和这些泛化地震具有相似性,从而解决了不同地区、不同台站分布带来的兼容性障碍;利用泛化地震构建的训练样本集也具备泛化性,从而搭建了基于泛化神经网络的泛化神经网络监测模型,适应于不同地区、不同台站分布的工况,不用像传统方法那样,部署到新的地区,需要重新训练。

2、为此,本发明提供如下技术方案:

3、一方面,本发明提供的一种样本集构建方法,应用于地震监测,包括以下步骤:

4、收集各个地区的地震波数据,并按照震中距和深度进行分组得到基础数据库,其中,相同震中距、深度的地震波数据划分为同一组;

5、获取目标监测范围内台站分布,并随机生成合成地震位置,计算合成地震到各个台站的震中距;

6、依据台站的震中距以及合成地震的深度,从所述基础数据库中为各个台站选择相同震中距、深度的地震波数据,再依据方位角旋转公式进行旋转以及规整震级;

7、利用旋转和规整后各个台站的地震波数据得到所述目标监测范围内模拟合成的地震波数据,作为样本,扩展所述目标监测范围的地震波样本集。

8、进一步可选地,所述方位角旋转公式如下:

9、

10、

11、式中,d′x和d′y为旋转后地震波数据中x和y分量波形,dx和dy为原始地震波数据中x和y分量波形,为方位角差,满足为所述合成地震相应第i个台站的方位角,为从基础数据库中查找到的地震波数据的原始实际地震相应台站的方位角,acos为反余弦函数;

12、其中,针对目标监测范围内的所述合成地震位置表示为(sx,sy,sz),第i个台站坐标表示为sx,sy为所述合成地震的x、y坐标,sz为所述合成地震的深度,为第i个台站的x、y坐标,从所述基础数据库中查找的地震波数据的三分量波形表示为(dx,dy,dz),旋转方位角后第i个台站的地震波数据的三分量波形表示为(d′x,d′y,dz)。

13、其中,规整震级是指得到旋转后的波形,还需要根据震级公式调整每个台站的幅值,使所有台站的波形都规整到给定的震级m。也就是说,由于这些台站的波形都是来自于不同震级的实际地震,需要把这些波形都变成一个特定震级m的合成地震的波形,再进行合成。

14、二方面,本发明提供的一种基于泛化神经网络的地震监测方法,包括:

15、步骤1:收集各个地区的地震波数据,并按照震中距和深度进行分组得到基础数据库,其中,相同震中距、深度的地震波数据划分为同一组;

16、步骤2:随机生成目标监测范围内台站分布,并随机生成合成地震位置,计算合成地震到各个台站的震中距;

17、步骤3:采用台站地震图的重组方法生成所述目标监测范围的训练样本集;

18、其中,依据台站的震中距以及合成地震的深度,从所述基础数据库中为各个台站选择相同震中距、深度的地震波数据,再依据方位角旋转公式进行旋转以及规整震级;利用旋转和规整后各个台站的地震波数据得到所述目标监测范围内模拟合成的地震波数据,作为训练样本;

19、步骤4:搭建用于地震监测的神经网络架构,利用所述训练样本集训练神经网络得到泛化神经网络监测模型,基于所述泛化神经网络监测模型实现任意地区中与所述目标监测范围相同范围的地震监测。

20、本发明技术方案为了获得能够实时进行地震监测,构建泛化神经网络监测模型,不用像传统方法那样,部署到新的地区,需要重新训练,提出了一套数据重组的方法,产生能够模拟不同位置以及不同监测台站分布情形下的地震,这些地震具有泛化性,也就是面对任何地区任何监测方案情况下,实际产生的地震数据和这些泛化地震具有相似性,例如不同震中距(台站到地震直接的距离),不同深度的地震震相到时都几乎一样,而这些就是定位地震的关键特征。现有方法无法训练出泛化性能高的模型的关键点,就在于,无法模拟出和实际地震相似的任意监测台站分布情形下的样本,也没法收集到如此多的实际地震数据。因此,本发明技术方案针对设定的目标监测范围,随机布设台站以及随机生成合成地震位置,使得模拟合成的地震波数据具备泛化性,按照该原理,可以生成该目标监测范围内多种台站布设、多个合成地震位置下的训练样本,一方面保证了训练样本的泛化性,二方面,也丰富了训练样本集,即除了真实地震波数据,还包含了模拟合成地震波,使得泛化神经网络监测模型的准确性、可靠性均得到有效提升,后续直接应用于相同范围的任意区域的地震监测,真正意义实现了模型的泛化性应用。

21、本发明技术方案提供的上述技术思路并不局限了地震检测为唯一应用,即步骤4中泛化神经网络监测模型还可以适用于地震位置估计、地震震级估计等,能够直接应用于地震监测预警系统。

22、进一步可选地,搭建的神经网络至少包含实现地震检测的神经网络,所述泛化神经网络监测模型至少包括地震检测模型;

23、其中,地震检测的神经网络的输入为所述训练样本集中各个台站的地震波数据的三分量波形,输入大小表示为:n1*t1*3,n1为目标监测范围设定的台站数最大值,当训练样本集中台站数量不足时采用零填充;t1为时间样本的最大长度;3表示3通道,即对应三分量波形;

24、地震检测的神经网络的输出用高斯分布标记,输出的峰值对应第一个触发的p相到达时间,若所述地震检测的神经网络的输入仅包含噪声,输出用零标记。

25、进一步可选地,搭建的神经网络至少包含实现地震定位的神经网络,所述泛化神经网络监测模型至少包括地震定位模型;

26、其中,地震定位的神经网络的输入为台站的xy坐标和台站的三分量波形,各个台站以预设排序规则依次排序输入,输入大小表示为:n1*t1*q,n1为目标监测范围设定的台站数最大值,当训练样本集中台站数量不足时采用零填充;t1为时间样本的最大长度;q表示q个通道;如10个通道中5个通道包含三分量波形以及按照台站x坐标排序的台站x、y坐标,另5个通道包含三分量波形以及按照台站y坐标排序的台站x、y坐标;

27、地震定位的神经网络的输出用3d高斯分布标记,输出的峰值表示预测的位置。

28、在训练过程中,本发明技术方案把台站的顺序按照台站x或者y坐标或者按照其他固定规则排序,传统方法认为台站顺序可以任意是他们的优势,而本发明在神经网络的输入中按照固定规则排序每个台站可以降低模型的训练难度,如果台站顺序可以任意,那么意味着一个地震的多个台站的数据,根据不同的台站顺序,神经网络的输入会有很多种,而神经网络的输出(地震位置或震级)只有一种,因此增加了训练过程中的模型空间,使得训练难度加大。

29、应当理解,上述以台站x或者y坐标排列为例,其他可行的实施例中,若以其他固定规则排序,则对应调整输入通道。

30、进一步可选地,搭建的神经网络至少包含实现地震震级估算的神经网络,所述泛化神经网络监测模型至少包括地震震级估算模型;

31、地震震级估算的神经网络的输入包括台站的三分量波形以及震中距,输入大小表示为t1*4,t1为时间样本的最大长度;4表示4通道,即对应三分量波形和震中距;

32、地震震级估算的神经网络的输出为用1d高斯分布标记,输出的峰值表示台站的标准化震级mr,所述标准化震级mr满足:mr=m-log(a),m为真实震级,a为台站波形的幅值大小;

33、其中,根据各个台站的震级确定地震的震级。

34、本发明技术方案能够从连续地震数据中实时挖掘数据特征,持续性监测地震的能力,当只有一部分台站触发时,神经网络就能启动监测,从当前少量的波形信息中,即可检测地震,估计地震位置和震级(如图1和2所示)。

35、其中,本发明提出对震级的估算应用单台数据训练,并定义标准化的震级mr,mr为去掉了输入时窗最大幅值影响后的震级,对于一个地震的n个台站,可以输出n个震级,最后取平均或者中位数得到该地震的震级。标准化震级虽然在zhang等(2021)的论文中有提到,但是他们的方法是利用多个台站的数据作为输入,最大幅值是指多个台站的波形的最大幅值,而输出为一个地震的震级;该方法的缺点是,假如某个台站存在异常大的幅值噪音,那么震级mr就会完全错误,即使其他台站数据正常也无法起作用,估算误差会非常大,另一方面和zhang等(2021)不同的是,震级估算中本发明考虑震中距信息,而他们的方法中输入直接为多个台站的波形,没有台站信息;而震级和震中距具有直接的关系,震中距大的时候振幅弱,震中距小的时候振幅强,因此震级是跟振幅和震中距均相关的量,本发明技术方案考虑了震中距作为神经网络的输入的一个通道,能大大提高预测精度。

36、再者,本发明技术方案提出利用多台地震数据输入并利用一维高斯分布标记多个台站的最快p波到时。传统地震检测神经网络主要利用单台地震数据作为输入,而利用多台输入的方法,输出标记为0和1的二分类方案,0和1分别表征输入时窗是否包含地震事件。本发明采用高斯分布表征最快p波到时,其优势是检测地震的同时可以输出时窗中最快p波的时间信息。该方案对于解决从少量触发台站开始持续性监测地震非常重要,因为在少量台站触发时刻,当前时窗可能大部分都是噪音,传统方法可能认为时窗内就是噪音,而本发明的监测方案要求,识别该时窗为地震信号,并输出最快p波到时,利用最快p波到时和定位神经网络的位置结果,即可计算到台站的走时,利用最快p波到时减去走时即可估算出震源的发震时刻,实现从极少台站触发开始监测地震。

37、进一步可选地,所述规整震级为:利用旋转后各个台站的地震波数据得到所述目标监测范围内模拟合成的地震波数据之前,还需要将来自不同震源的地震波的幅值调整为同一个震级。

38、由于不同台站a,b,c,d的地震波形分别来自不同的震源,所以还需要把这些波形的幅值调整到一个给定的震级m,调整方法为:首先将旋转后的波形(d′x,d′y,d′z),同时除以他们的最大值进行归一化,归一化后利用下式得到震级为m的地震波形:

39、

40、δ=m-1.110log(r/100)-0.00189(r-100)-3

41、其中,δ为ml震级公式,当然也可以为其他震级公式。即为震级为m的合成波形,r的定义为震中距。

42、三方面,本发明还提供一种基于上述地震监测方法的系统包括:

43、基础数据库构建模块,用于收集各个地区的地震波数据,并按照震中距和深度进行分组构建基础数据库,其中,相同震中距、深度的地震波数据划分为同一组;

44、预处理模块,用于随机生成目标监测范围内台站分布,并随机生成合成地震位置,计算合成地震到各个台站的震中距;

45、样本集构建模块,用于采用台站地震图的重组方法生成所述目标监测范围的训练样本集;

46、其中,依据台站的震中距以及合成地震的深度,从所述基础数据库中为各个台站选择相同震中距、深度的地震波数据,再依据旋转公式旋转到方位角以及规整震级;利用旋转和规整后各个台站的地震波数据得到所述目标监测范围内模拟合成的地震波数据,作为训练样本;

47、监测模型构建模块,用于搭建用于地震监测的神经网络架构,利用所述训练样本集训练神经网络得到泛化神经网络监测模型,基于所述泛化神经网络监测模型实现任意地区中与所述目标监测范围相同范围的地震监测。

48、四方面,本发明还提供一种电子终端,至少包含:

49、一个或多个处理器;

50、以及存储了一个或多个计算机程序的存储器;

51、其中,所述处理器调用所述计算机程序以执行:

52、所述样本集构建方法的步骤或者所述基于泛化神经网络的地震监测方法的步骤。

53、五方面,本发明还提供一种计算机可读存储介质,其特征在于:存储了计算机程序,所述计算机程序被处理器调用以执行:所述样本集构建方法的步骤或者所述基于泛化神经网络的地震监测方法的步骤。

54、有益效果

55、与现有方法相比,本发明技术方案提供的一种样本集构建方法,为台站地震图的重新组合方法,生成了大量在监测区域内的任何位置可能发生的模拟地震事件,其具有任意的台站分布,因此,利用该原理构建样本集时,可以充分利用不同地区以及不同的台站分布下的地震波数据,一方面实现了数据兼容,保证了样本泛化性,尤其是为构建泛化神经网络监测模型提供了可行的技术支持,二方面扩充了样本集,为提升模型精度作出贡献。

56、基于提供的台站地震图的重组方法,本发明技术方案提供的一种基于泛化神经网络的地震监测方法,构建出泛化神经网络监测模型,后续直接应用于相同范围的任意区域的地震监测,不用像传统方法那样,部署到新的地区,需要重新训练。其中,本发明在设定的目标监测范围,随机布设台站以及随机生成合成地震位置,使得模拟合成的地震波数据具备泛化性;按照本发明技术思路构建的泛化神经网络监测模型能够实现地震检测、地震位置估计、地震震级估计等多重应用,更具通用性。

57、本发明技术方案进一步优化方案,提出的震级估算是应用单台数据训练,即每个台站得到对应的震级,对于一个地震的n个台站,可以输出n个震级,最后取平均或者中位数得到该地震的震级,相较于现有技术,本发明确定的震级的精度、可靠性更高;此外,本发明将震中距融入震级估算模型中,作为输入量之一,充分考虑到震级和震中距具有直接的关系,震中距大的时候振幅弱,震中距小的时候振幅强,因此震级是跟振幅和震中距均相关的量,本发明技术方案考虑了震中距作为神经网络的输入的一个通道,能大大提高预测精度。

58、本发明技术方案进一步优化方案,设定泛化神经网络监测模型的输出,采用高斯分布标记,尤其是针对地震检测模型,利用一维高斯分布标记多个台站的最快p波到时,检测地震的同时可以输出时窗中最快p波的时间信息,为实现从极少台站触发开始监测地震奠定了基础,即结合地震检测模型以及地震定位模型,利用最快p波到时和定位神经网络的位置结果,即可计算到台站的走时,利用最快p波到时减去走时即可估算出震源的发震时刻,实现在少数台站触发的时候,检测地震信号,并实时和持续性地输出地震位置,震级,发震时间。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1