一种基于可解释注意力神经网络的地震震相序列检测方法与流程

文档序号:36503212发布日期:2023-12-28 07:27阅读:27来源:国知局
一种基于可解释注意力神经网络的地震震相序列检测方法与流程

本发明属于地震波形数据处理分析领域,具体涉及一种基于可解释注意力神经网络的地震震相序列检测方法。


背景技术:

1、随着全球地震监测台网及基础设施的不断建立和完善,越来越多低成本高效益的传感器技术得到发展,海量数据不断涌现,地震学领域正面临着大数据时代所带来的“3v’s”挑战:体量(volume)、种类(variety)和速度(velocity)。

2、在这种时代背景下,人工智能(artificial intelligence,ai)技术逐渐被应用于地震学领域中,国内外相关学者进行了十余年的探索,几乎把以机器学习和深度学习为代表的ai技术带进了地震学的每一个子领域,尤其在地震事件检测、震相拾取、地震事件识别等诸多地震学任务中,ai技术都表现出了优于经典方法的能力。其中,震相拾取是地震数据自动处理的重要一步,准确检测震相并判断到时对于地震事件检测至关重要,也是目前ai技术在地震波形数据处理中的一个热门应用领域。当前绝大部分基于ai开展的震相识别工作,均主要针对p和s两种震相独立拾取,存在拾取震相单一且误检率、漏检率高等问题。

3、此外,由于ai模型结构非常复杂,本质上缺乏透明度,无法向人类解释和证明其决策依据。因此人们只能将其当作一个“黑盒”来处理,很难证明其在重要决策上的合理性,而如果没有适当的解释,识别和防止模型错误行为的发生就变得不可能。2022年,国家自然科学基金委员会发布了“可解释、可通用的下一代人工智能方法”重大研究计划项目指南,面向以深度学习为代表的人工智能方法模型可解释性差、对抗样本鲁棒性差、数据与算力需求大、理论基础薄弱等科学问题,通过规则与学习相结合的方式,建立高精度、可解释、可通用且不依赖大量标注数据的人工智能新方法,开发下一代人工智能方法需要的数据库和模型训练平台,完善下一代人工智能方法驱动的基础设施。


技术实现思路

1、(一)要解决的技术问题

2、本发明要解决的技术问题是如何提供一种基于可解释注意力神经网络的地震震相序列检测方法,以解决基于ai开展的震相识别工作时,ai模型结构非常复杂,本质上缺乏透明度,无法向人类解释和证明其决策依据的问题。

3、(二)技术方案

4、为了解决上述技术问题,本发明提出一种基于可解释注意力神经网络的地震震相序列检测方法,该方法包括如下步骤:

5、步骤一、通过设定时间窗口和步长,将采集的地震波形原始数据滑动截取为若干个待检测窗口,并对所截取数据进行预处理;

6、步骤二、将预处理后的地震波形数据输入到模型的编码器encoder中,依次进行空间几何、时间序列以及全局和局部注意力信息的特征序列提取;

7、步骤三、将步骤二中提取的特征序列输入到模型的解码器decoder中,对其进行上采样,并最终通过模型预测层输出震相序列的检测识别和到时估算结果;

8、步骤四、对模型解码器中的关键卷积层添加梯度类激活映射图并进行可视化,为模型输出震相序列识别和到时估算结果的决策行为提供可解释性。

9、(三)有益效果

10、本发明提出一种基于可解释注意力神经网络的地震震相序列检测方法,本发明充分利用了人工智能技术在海量地震波形数据涌现时代背景下,可基于数据驱动训练出表现性能较佳的深度神经网络模型,进而高效且准确地检测震相并判断到时的优势,同时考虑到深度神经网络模型与生俱来的黑盒本质,在不影响模型原有网络结构和预测精度的情况下开展可解释优化。

11、本发明的有益效果包括:

12、(1)在模型的编码器部分,特征提取的过程中同时考虑到空间几何特征、时间序列特征、全局注意力特征和局部注意力特征,针对地震波形类型的一维时间序列数据具有较强的特征发现能力;

13、(2)在模型的解码器部分,采用了与编码器层数相同的一维反卷积神经网络,能够将编码器部分所提取的特征序列通过上采样还原到与输入原始波形数据一致的维度,从而实现震相到时的拾取;

14、(3)在模型的预测层部分,采用了全连接层和softmax函数激活的组合形式,使得模型能够同时对多种震相类别进行区分,从而实现对多种震相的识别;

15、(4)综合(1)至(3),相比较目前ai震相拾取方法只能拾取p和s两种独立震相,本发明能够实现对地震波形数据中由多种震相构成的震相序列进行整体检测和到时拾取;

16、(5)在不影响模型原有网络结构和预测精度的情况下,设计了一种用于地震波形数据震相序列检测的可解释注意力神经网络,通过类激活映射图的方式可视化展示模型中关键卷积层在对预测结果做出贡献时所重点关注的波形数据区域,从而既保证了模型的表现性能又提升了模型的内部透明度,为模型决策行为提供了可解释性。



技术特征:

1.一种基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,该方法包括如下步骤:

2.如权利要求1所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤一中所述设定的时间窗口为8.192秒,所述设定的步长为0.1秒,所述预处理包括对滑动截取后的地震波形数据进行去线性、滤波和归一化操作。

3.如权利要求2所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤二中所述的模型编码器由多层卷积神经网络、循环神经网络和注意力神经网络组成,通过编码器对地震波形数据依次进行空间几何、时间序列以及全局和局部注意力信息的特征序列提取。

4.如权利要求3所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤二具体包括如下步骤:

5.如权利要求1所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤三中所述的模型解码器由7层conv1d一维反卷积神经网络构成,所述模型预测层由1层全连接层和softmax激活函数层组成。

6.如权利要求1-5任一项所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤四中所述的对模型解码器中的关键卷积层添加梯度类激活映射图并进行可视化,在不改变网络原有结构和模型参数的情况下,取出关键卷积层的反向传播梯度计算特征图权重,通过加权计算得到梯度类激活映射图并对其进行可视化,为模型输出震相序列识别和到时估算结果的决策行为提供可解释性。

7.如权利要求6所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤四具体包括:

8.如权利要求1-5任一项所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤三具体包括:

9.如权利要求8所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述s32中,震相类别包括:pn、pg、sn、sg四类震相,s33中,输出地震波形原始数据的pn、pg、sn、sg四类震相检测识别和到时估算结果。

10.如权利要求9所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤四具体包括如下步骤:


技术总结
本发明涉及一种基于可解释注意力神经网络的地震震相序列检测方法,属于地震波形数据处理分析领域。本发明通过设定时间窗口和步长,将采集的地震波形原始数据滑动截取为若干个待检测窗口;将地震波形数据输入到模型的编码器Encoder中,依次进行空间几何、时间序列以及全局和局部注意力信息的特征序列提取;将提取的特征序列输入到模型的解码器Decoder中,对其进行上采样,并最终通过模型预测层输出震相序列的检测识别和到时估算结果;对模型解码器中的关键卷积层添加梯度类激活映射图的可视化技术,为模型输出震相序列识别和到时估算结果的决策行为提供可解释性。本发明既保证了模型的表现性能又提升了模型的内部透明度,为模型决策行为提供了可解释性。

技术研发人员:黄立洪,李健,刘哲函,王晓明,刘泽玉,李铭
受保护的技术使用者:禁核试北京国家数据中心
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1