一种基于时空注意力机制的地震震相到时拾取方法

文档序号:28211587发布日期:2021-12-28 20:56阅读:149来源:国知局
一种基于时空注意力机制的地震震相到时拾取方法

1.本发明一种基于时空注意力机制的地震震相到时拾取方法,属于地震信号处理和人工智能技术领域。


背景技术:

2.地震诱发机制是地震学研究的关键内容,其可为地震灾害预警研究建立理论基础。大地震之后往往伴随着频度较高的余震,这些余震震级大多较为微弱,容易漏检,如果能够准确地识别这些微弱的地震信号,自动的拾取其震相信息,将对完善地震目录、地震预警、全面分析地震活动性以及监测地震破裂区域的震后形变等具有重要意义,但微震震相特征微弱,混合于环境噪声中极难分辨,对其震相的拾取一直是地震灾害预警研究的热点与难点问题。
3.国内外对于地震震相的识别发展了如sta/lta方法、aic方法、模板匹配法等多种传统算法,这些方法对地震震相拾取技术的研究及其重要,但由于地震信号数据信噪比低、特征弱且标注数据少,随着研究的不断深入,传统算法计算量过大、需人工设定阈值、依赖信噪比及检测区间等缺陷逐渐显现,无法满足实际需求。
4.随着地震仪在全球范围的大规模部署,人类已经进入地震大数据时代。如何处理地震网络每天收集的海量数据,特别是从质量参差不齐的连续波形记录中识别地震信号是非常棘手的问题。人工智能领域的研究工作近年来取得飞速的发展,深度学习作为人工智能技术的重要分支,具有拟合效果更好、可表征参数特征更多及无需人工选取特征参数等优点,在众多领域逐渐超越传统方法,得到极为广泛的研究和应用。深度学习在地震信号拾取领域也得到了一定的应用,这些地震事件检测算法在强震检测上都具有良好的性能,但其对微震震相的拾取效果不够理想。
5.鉴于深度卷积神经网络在语义分割、边缘检测和目标识别方面取得了突破性成果,因此,本发明提出采用深度学习方法,结合注意力理念,构建震相智能拾取模型,实现地震p波到时的快速识别,同时获得更高的识别率。这对于地震事件识别、地震震源快速定位、地震预警研究以及地壳活动研究具有重要现实意义。


技术实现要素:

6.本发明为了克服现有技术中存在的不足,所要解决的技术问题为:提供一种基于时空注意力机制的地震震相到时拾取方法结构的改进。
7.为了解决上述技术问题,本发明采用的技术方案为:一种基于时空注意力机制的地震震相到时拾取方法,包括如下步骤:
8.步骤s1:构建数据集:对地震信号连续波形数据的p波和s波到时进行标注,得到地震信号数据集;
9.步骤s2:对地震信号的到时标注数据进行预处理,所述预处理包括数据分割、数据滤波与数据增强处理;
10.步骤s3:按照预设比例将地震信号数据集分为训练集、验证集与测试集;
11.步骤s4:构建u

net神经网络,代入训练集与验证集进行模型训练与验证,得到训练好的较优模型;
12.步骤s5:将时空注意力机制引入较优模型的特征提取过程中,完成注意力机制的融合;
13.步骤s6:使用深层编码特征融合机制,对编解码特征进行融合,完成融合u

net神经网络模型的构建;
14.步骤s7:利用测试集对融合模型进行评估,结合评估指标对模型结构及参数进行调整,得到通过测试的微震震相拾取模型;
15.步骤s8:将待识别地震信号数据输入步骤s7的微震震相拾取模型,得到地震震相到时拾取标注结果。
16.所述步骤s2中的数据预处理的数据分割具体步骤为:将地震三分量连续原始波形分割为时间窗口长度设定的片段;
17.所述步骤s2中的数据预处理的数据滤波具体步骤为:对波形数据进行带通滤波处理;
18.所述步骤s2中的数据预处理的数据增强具体步骤为:对波形数据进行平移与加噪声。
19.所述步骤s6中的融合u

net神经网络模型包括编码器和解码器,所述编码器包括初始卷积模块、多模态特征提取模块、多尺度残差模块与多尺度特征提取模块;
20.所述解码器包括3个上采样模块、1个注意力模块和1个时间步全连接模块,按照其在网络中的分布顺序分别为:上采样a模块、时空注意力模块、上采样b模块、上采样c模块、时间步全连接模块。
21.所述初始卷积模块包含3层卷积,卷积层的卷积核大小均为3,其中首次卷积步长为2,之后两次卷积步长为1,该模块用于对输入数据进行初步特征提取;
22.所述多模态特征提取模块对输入特征分别进行池化与卷积处理,对输入的特征分别进行运算尺度为3、步长为2的最大池化与卷积,而后将池化与卷积得到的特征以concate方式进行结合输出;
23.所述多尺度残差模块使用融合inception结构的残差网络对特征进行进一步的多尺度提取;
24.所述多尺度特征提取模并行使用了3种特征提取方式,分别为尺度为3的最大池化、尺度为3的卷积、尺度为3的串行卷积,该模块最后对三种方式提取到的所有特征进行融合输出。
25.所述上采样模块包含卷积层与反卷积层,三个上采样模块卷积层输出的通道数分别为300、200、128,卷积核大小与卷积步长均为1,卷积完成之后进行批量归一化,使用relu函数进行激活,最后对所得特征序列进行尺度为2的反卷积,将每个时间步映射为2个时间步,该模块可降低特征序列通道数,并将特征序列逐步还原与输入数据一致的长度。
26.所述时空注意力模块的通道注意力权重的计算分为激活、挤压与还原三步,定义输入数据的维度为t*d,其中t为特征序列长度,d为特征序列通道数,具体计算步骤如下;
27.激活:激活表示以通道为单位,对其所有时间步使用softmax函数进行激活,得到
维度为t*d的特征序列;
28.挤压:数据激活完成后,对每一通道的所有时间步以全局平均池化的方式进行挤压,得到维度为d*1的通道统计特征;
29.还原:将通道统计特征还原为与输入数据维度一致的通道注意力权重矩阵,其大小为t*d。
30.所述时间步全连接模块的时间步注意力权重在计算前后需进行通道维度转置,将特征序列转置为d*t的形式,在计算过程中,以时间步为单位,对其所有通道的特征进行激活、挤压与还原,最后将所得时间步统计特征其转置为t*d的形式,其中对特征进行激活、挤压与还原的步骤与时空注意力模块的通道注意力权重的计算步骤激活、挤压与还原相同。
31.所述步骤s6中的深层编码特征融合机制以多尺度残差模块与上采样a模块输出的特征序列作为输入,首先对多尺度残差模块输出的特征序列利用尺度为1的卷积层进行特征降维,并进一步提取特征信息,降低计算机资源消耗,而后将所得的特征序列与上采样a模块输出的特征序列以concat方式进行特征融合。
32.所述步骤s7中对识别效果进行评价的指标为平均绝对误差mae、均方误差mse与正确率h,计算公式如下:
[0033][0034][0035][0036][0037]
上式中:表示算法识别的p波到时、s波到时,li表示人工标注的p波到时、s波到时,n为测试数据总量,β表示误差阈值,α表示绝对误差小于阈值的数量。
[0038]
本发明相对于现有技术具备的有益效果为:与传统地震震相拾取方式相比,本发明基于时空注意力机制的地震震相到时拾取技术,具有较强的创新性,在微震信号处理方面开创了新的研究思路;本发明结合地震信号抵达时数据会产生突变的特性,将时空注意力机制融入地震到时拾取中,敏锐的对信号变化进行感知,提升了微震震相拾取的准确度与召回率;传统方式大多需人工设定阈值,阈值的选取带有很大的不确定性,这种不确定性无法具体地量化形成通用的规则,本发明整个计算过程并无人工干预与设定阈值。
附图说明
[0039]
下面结合附图对本发明做进一步说明:
[0040]
图1为本发明基于时空注意力机制的地震波到时拾取模型结构图;
[0041]
图2为本发明基于时空注意力机制的地震波到时拾取模型编码器参数结构;
[0042]
图3为本发明基于时空注意力机制的地震波到时拾取模型解码器参数结构。
具体实施方式
[0043]
如图1至图3所示,针对现有技术的缺陷,本发明的目的在于提供基于时空注意力机制的地震震相到时拾取技术,旨在解决现有地震震相拾取技术在震相到时拾取方面准确率与召回率过低的问题。
[0044]
为了达到上述发明目的,本发明采用如图1所示的地震波到时拾取模型,包括以下步骤:
[0045]
步骤s1:对地震信号连续波形数据的p波与s波到时进行标注,完成数据集构建;
[0046]
步骤s2:对地震信号标注数据进行预处理,包括数据分割、数据滤波与数据增强处理;
[0047]
步骤s3:按照预设比例将地震信号数据集分为训练集、验证集与测试集;
[0048]
步骤s4:构建u

net神经网络,代入所述训练集与验证集进行模型训练与验证,得到训练好的较优模型;
[0049]
步骤s5:将时空注意力机制引入较优模型的特征提取过程中,完成注意力机制的融合;
[0050]
步骤s6:使用深层编码特征融合机制,对编解码特征进行融合,完成融合u

net神经网络模型的构建;
[0051]
步骤s7:利用测试集对所述融合模型进行评估,结合评估指标对模型结构及参数进行调整,得到通过测试的微震震相拾取模型。
[0052]
将待识别地震信号数据输入微震震相拾取模型,得到地震震相到时拾取标注结果。
[0053]
进一步的,步骤s1中对地震信号数据进行标注,数据由相关机构的多名专业人员进行标注,完成标注后再进行交叉验证,保证数据标签的准确性。
[0054]
进一步的,步骤s2中对地震信号数据进行预处理,所述数据分割,将连续波形数据分割为时间窗口长度为10s的片段,长度不足的以0值填充;所述数据滤波,对波形数据使用[0,20hz]的带通滤波,过滤对波形拾取无意义的过高频率信号;所述数据增强,以地震p波、s波到时为中心,在[

2s,+2s]时间窗内沿时间轴滑窗,对震相位置进行微调处理,加噪是对波形的每个采样点进行随机扰动,本发明采用高斯噪声扰动。
[0055]
进一步的,步骤s3中分割数据集,训练集用于训练模型参数,验证集用于判断训练停止时刻,测试集用于验证模型样本外的泛化能力并对模型性能进行评估;所述预设比例为测试集与训练集和验证集之和的比例以及验证集与训练集的比例均为1:4。
[0056]
进一步的,步骤s6中,所述融合u

net神经网络模型由编码器与解码器构成;
[0057]
进一步的,步骤s7中,对识别效果进行评价,评价指标为平均绝对误差(mae)、均方误差(mse)与正确率(h),用公式表示为:
[0058]
[0059][0060][0061][0062]
其中表示算法识别的p波、s波到时,li表示人工标注的p波、s波到时,n为测试数据总量,β表示误差阈值,本发明取0.1s、0.2s与0.3s三个误差阈值对识别结果进行衡量,α表示绝对误差小于阈值的数量。
[0063]
如图2所示,编码器网络由4个模块构成,分别为:初始卷积模块、多模态特征提取模块、多尺度残差模块与多尺度特征提取模块。
[0064]
初始卷积模块如图2

a所示,该模块包含3层卷积,卷积层的卷积核大小均为3,其中首次卷积步长为2,之后两次卷积步长为1,该模块用于对输入数据进行初步特征提取。多模态特征提取模块如图2

b所示,该模块对输入特征分别进行池化与卷积处理,对输入的特征分别进行运算尺度为3,步长为2的最大池化与卷积,而后将池化与卷积得到的特征以concate方式进行结合输出。多尺度残差模块如图2

c所示,该模块使用融合inception结构的残差网络对特征进行进一步的多尺度提取,该模块可防止网络层数较多时出现网络退化现象,并最大限度的挖掘数据有效特征,加速网络收敛。
[0065]
多尺度特征提取模块如图2

d所示,该模块并行使用了3种特征提取方式,分别为尺度为3最大池化、尺度为3的卷积、尺度为3串行卷积。前两种方式步长均为2,第三种方式首先使用尺度为1的卷积改变通道数以减少计算量,之后使用两次尺度为3的卷积,第一次卷积步长为1,第二次卷积步长为2,不同于二维卷积,在一维条件下将卷积核分解,会在增加一定的参数量,比如在此处,两个卷积核为3的1为卷积,其感受野相当于一个卷积核大小为5的,参数量有一定的增加,但由于加深了网络深度,其效果优于单层卷积,而其中所增加的参数量所带来的计算成本几乎可忽略不计。此模块最后对三种方式提取到的所有特征进行融合输出。
[0066]
如图3所示,解码器网络由5个模块构成,包括3个上采样模块,1个注意力模块和1个时间步全连接模块,按照其在网络中的分布顺序分别为:上采样a模块、时空注意力模块、上采样b模块、上采样c模块、时间步全连接模块。
[0067]
上采样模块如图所示3

a,模块包含卷积层与反卷积层,本发明三个上采样模块(上采样a/b/c)卷积层输出的通道数分别为300、200、128,卷积核大小与卷积步长均为1,卷积完成之后进行批量归一化,使用relu函数进行激活,最后对所得特征序列进行尺度为2的反卷积,将每个时间步映射为2个时间步。该模块可降低特征序列通道数,并将特征序列逐步还原与输入数据一致的长度。
[0068]
时空注意力模块先分别计算数据通道注意力权重与时间步注意力权重,之后对二者进行融合,最后使用融合权重对输入特征进行权重分类,具体计算方式如下。
[0069]
通道注意力权重的计算分为激活、挤压与还原三步,定义输入数据的维度为t*d,其中t为特征序列长度,d为特征序列通道数:
[0070]
(1)激活表示以通道为单位,对其所有时间步使用softmax函数进行激活,得到维度为t*d的特征序列;
[0071]
(2)数据激活完成后,对每一通道的所有时间步以全局平均池化的方式进行挤压,得到维度为d*1的通道统计特征;
[0072]
(3)将通道统计特征还原为与输入数据维度一致的通道注意力权重矩阵,其大小为t*d。
[0073]
时间步注意力权重的计算原理与通道注意力权重的计算原理一致,二者的计算差异在于时间步注意力权重在计算前后,需进行通道维度转置,将特征序列转置为d*t的形式,在计算过程中,以时间步为单位,对其所有通道的特征进行激活、挤压与还原,最后将所得时间步统计特征其转置为t*d的形式。
[0074]
本发明使用深层编码特征融合机制,补充缺失特征信息,并避免特征序列污染;深层编码特征融合机制以多尺度残差模块与上采样a模块输出的特征序列作为输入,首先对多尺度残差模块输出的特征序列利用尺度为1的卷积层进行特征降维,并进一步提取特征信息,降低计算机资源消耗,而后将所得的特征序列与上采样a模块输出的特征序列以concat方式进行特征融合。
[0075]
在实际应用中,本实施例中所涉及的各个功能模块及单元,均可以由运行在计算机硬件上的计算机程序实现,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程,所述计算机程序由不限于python、java、c++等计算机语言实现。
[0076]
在本发明所提供的转置,仅仅是示意性的,所述的模块划分,仅作为一种逻辑功能的划分,实际实现时可能存在其他的划分方式,如:多个单元或组件可以结合或者可以集成到另一个系统,或一些模块可以忽略,甚至不执行。
[0077]
本发明还提出一种基于时空注意力机制的地震震相到时拾取系统,系统包括数据预处理模块、模型构建模块与模型优化模块,模型优化模块包括优化后的融合u

net神经网络,将采集的地震波信号数据经过数据预处理后输入训练好的融合u

net神经网络,可以精确地得到地震信号的到时信息,震相拾取过程完全不需要人为参与。
[0078]
关于本发明具体结构需要说明的是,本发明采用的各部件模块相互之间的连接关系是确定的、可实现的,除实施例中特殊说明的以外,其特定的连接关系可以带来相应的技术效果,并基于不依赖相应软件程序执行的前提下,解决本发明提出的技术问题,本发明中出现的部件、模块、具体元器件的型号、连接方式除具体说明的以外,均属于本领域技术人员在申请日前可以获取到的已公开专利、已公开的期刊论文、或公知常识等现有技术,无需赘述,使得本案提供的技术方案是清楚、完整、可实现的,并能根据该技术手段重现或获得相应的实体产品。
[0079]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1