一种基于lstm网络的航空瞬变电磁数据反演方法
技术领域
1.本发明提供一种地球电磁数据的快速反演方法,具体涉及一种基于lstm网络的航空瞬变电磁数据反演方法。
背景技术:2.航空瞬变电磁法是一种重要的浅地表勘探方法,其能够适应复杂地形,采集速度快,探测覆盖区域广,且对低阻异常体敏感度高,在矿产勘查、地下水监测以及油藏成像中得到了广泛应用。
3.航空瞬变电磁法采样效率高,观测数据量大,且其在飞行中不断发射电流激发二次场,具有多源性,在数据反演时需要针对每一个发射源进行响应拟合,为数据解释工作带来巨大的计算挑战。目前常用的航空瞬变电磁数据解释方法主要分为确定型反演和统计型反演。确定型反演假设存在全局最优解,通过设定目标函数,选取初始模型,迭代调整模型参数使得目标函数收敛至预先设定的范围,进而得到反演结果。目标函数中通常包括观测数据拟合误差和正则化项,其中,正则化项引入了参考模型和介质光滑度等先验信息。然而,由于反演问题固有的多解性,反演依赖初始模型,易陷入局部极小,且初始模型和正则化项的选取易受主观因素影响。此外,航空电磁观测系统信噪比较低,噪声种类复杂,会加剧解的非唯一性,使得反演难以收敛至真实电阻率模型。统计型反演属于全局优化算法,通过在模型空间中进行采样,记录满足收敛条件的模型样本,进而提供模型参数的统计分布特征。然而,由于模型空间大,采集数据量多,需要进行大量正演模拟,对计算资源需求很高,计算成本随着模型参数个数增加指数上升。因此,采用传统反演方法进行航空瞬变电磁数据解释仍受到多解性和计算成本的局限。
4.作为一种全局优化算法,深度学习方法能够挖掘数据之间的映射关系。bai等(2020,(quasi
‑
)real
‑
time inversion of airborne time
‑
domain electromagnetic data via artificial neural network.remote sensing.12(20),3440)和feng等(2020,resistivity
‑
depth imaging with the airborne transient electromagnetic method based on an artificial neural network.journal of environmental and engineering geophysics,25(3),355
‑
368)利用人工神经网络(artificial neural network,ann)进行航空瞬变电磁数据反演。li等(2020,fast imaging of time
‑
domain airborne em data using deep learning technology.geophysics,85(5),e163
‑
e170)将卷积神经网络(convolutional neural networks,cnn)与长短时记忆模块(long short
‑
term memory,lstm)相连接,结合飞行高度,实现了航空瞬变电磁快速数据成像。航空瞬变电磁响应数据随时间呈指数衰减,属于典型的时间序列,上述神经网络结构难以充分提取时间序列特征;且其考虑的阶梯状电阻率模型对实际介质环境适用性较弱,难以灵活拟合电阻率异常体的边界。
5.综上所述,现有的航空瞬变电磁响应数据解释方法仍存在局限性,需要研究一种高效、准确的数据解释方法。
技术实现要素:6.为克服现有技术的不足,本发明提供了一种基于lstm网络的航空瞬变电磁数据反演方法,其针对航空瞬变电磁响应数据建立适当的lstm网络结构,结合飞行高度,解决大规模航空瞬变电磁响应数据反演问题。该反演方法稳定性好、计算效率高、结果准确,能够为航空瞬变电磁实时数据解释提供技术支撑。
7.本发明采用的技术方案是:
8.一种基于lstm网络的航空瞬变电磁数据反演方法,其针对航空瞬变电磁响应数据建立恰当的lstm模型;将飞行高度拼接至网络特征层中参与反演运算;采用合成数据训练网络,并选取适当的训练周期和样本规模;将新采集的航空瞬变电磁响应数据集输入至完成训练的lstm网络中,实现快速反演;具体包括以下步骤:
9.a.生成合成数据集,包括:
10.a1.根据自然界电阻率范围和反演采用的深度网格生成层状电阻率模型;
11.a2.根据观测环境随机生成收发装置高度;
12.a3.按照航空瞬变电磁观测系统参数和采样模式进行层状电阻率模型的正演模拟,得到航空瞬变电磁响应数据;
13.合成数据集样本包含:含n
t
个采样点时刻的航空瞬变电磁响应数据d
l
,收发装置高度h和层状电阻率模型n
ρ
层介质对应的电阻率值m
l
;所生成的合成数据集可以分为训练集与测试集。
14.b.建立lstm网络;
15.lstm网络由解码器和编码器构成,层与层之间采用lstm模块进行连接(信息传递)。输入数据为航空瞬变电磁响应数据,输出数据为网络的反演结果(电阻率值的对数值),输入层和输出层的维度分别根据时间采样点个数(n
t
)和模型参数个数(电阻率模型的介质层数n
ρ
)确定。将编码器编码得到的特征向量与收发装置高度进行拼接,输入至解码器中进行解码,最终输出预测的电阻率模型参数。
16.c.选取适当的训练集规模和训练周期,完成网络训练;
17.采用不同规模训练集进行网络训练:基于步骤a生成的不同规模的训练数据集,根据网络预测模型与真实电阻率模型之间的误差迭代调整lstm网络中的参数,直至网络训练收敛,具体是:
18.将含n
t
个时间采样点的航空瞬变电磁响应数据输入至步骤b中建立的lstm网络中,经输出层输出n
ρ
个向量v
o
,v
o
与层状电阻率模型的n
ρ
层电阻率值反演结果m
o
的关系为:v
o
=lg(m
o
)。迭代调整网络参数降低目标函数,使得v
o
接近lg(m
l
),进而完成训练。
19.根据不同规模训练集的反演误差随训练周期增长的下降趋势,选取训练集规模和训练周期,得到完成训练的lstm网络,确保网络收敛效果和训练效率。
20.d.网络反演效果检验;
21.根据网络对测试集的反演结果与真实电阻率模型之间的误差以及其对应的航空瞬变电磁响应数据拟合误差,定量评估网络的反演效果,判断网络的泛化能力。
22.e.电阻率模型反演;
23.利用步骤c中完成训练的lstm网络,完成新采集的航空瞬变电磁响应数据的快速反演。即将新采集的航空瞬变电磁响应数据输入至步骤c中完成训练的lstm网络,网络输出
即为网络反演的电阻率结果。
24.通过上述步骤,实现基于lstm网络的航空瞬变电磁响应快速数据解释,得到地下介质的电阻率分布情况。
25.作为一种优选方案,所述步骤a中,电阻率值分布在1
‑
10000ω
·
m之间;采用均匀的纵向网格对层状电阻率模型进行剖分;令电阻率随深度连续变化,取其对数值作为网络输出的目标值;收发装置高度在25
‑
100m之间随机选取。具体的,采用小间距均匀网格对深度进行细密剖分,提升纵向分辨率;并通过插值,使得电阻率模型的电阻率随深度连续变化。
26.作为一种优选方案,所述步骤b中,lstm网络由一个编码器和一个解码器构成,层与层之间采用lstm模块进行信息传递。编码器包含4个lstm层,且第一层采用双向lstm层充分提取时间序列特征。解码器包含4个lstm层和1个全连接层。
27.作为一种优选方案,所述步骤b中,利用注意力机制连接编码器与解码器,使得网络对有效信息投入更多注意力资源,抑制无关信息的传递,提高数据传递的效率与准确性。注意力机制通过求取后一隐藏层每一时刻的隐藏状态与前一隐藏层每一时刻的隐藏状态之间的相关性,将其归一化作为权重,对前一隐藏层隐藏状态进行加权求和输入至后一隐藏层不同时刻的lstm模块中。权重a
p
(q)计算公式为:
[0028][0029]
其中,代表编码器中最后一个隐藏层第q时刻lstm模块状态,表示解码器中第一个隐藏层p时刻lstm模块状态。q表示编码器最后一个隐藏层中总时刻数。score(
·
)表示计算相关性的函数。经过注意力机制运算后的特征向量v
d
为:
[0030][0031]
网络利用注意力机制,根据编码器和解码器相邻隐藏层的状态,分配不同的传递权重,实现高效信息传递。将收发装置高度h与特征向量v
d
进行拼接,输入至解码器中。
[0032]
作为一种优选方案,所述步骤b中,在层与层之间引入残差连接,促进梯度的反向传播,避免网络退化。
[0033]
作为一种优选方案,所述步骤c中,lstm网络训练所采用的目标函数为:
[0034][0035]
其中,n
s
为训练集样本数,n
ρ
为电阻率模型的层数,v
o
为网络输出向量,m
l
为真实电阻率值,λ
w
为正则化参数,取值范围为0.001
‑
1,w和b分别代表网络中的传递矩阵和偏置向量,||
·
||2表示euclidian距离。
[0036]
作为一种优选方案,所述步骤c中,采用adam算法迭代调整网络参数w和b,完成网络训练,学习率取值范围为0.001
‑
0.1。
[0037]
作为一种优选方案,所述步骤c中,采用均方根误差(rmse)判断网络反演效果随训练周期的变化趋势,rmse定义如下:
[0038][0039]
采用不同规模训练集参与网络训练,根据训练过程中rmse的下降趋势,选择恰当的训练集规模和训练周期,获得最终的lstm网络,保证训练速度和反演准确度。
[0040]
作为一种优选方案,所述步骤d中,由于模型参数与航空瞬变电磁响应数据均存在较大的数量级跨度,为均衡考虑数据在各个数量级中的误差,采用相对均方根误差(rmspe)评估网络反演结果准确度和响应数据拟合程度。rmspe定义如下:
[0041][0042][0043]
其中,rmspe
model
为电阻率模型相对均方根误差,rmspe
signal
为航空瞬变电磁响应数据相对均方根误差;n
ρ
为电阻率模型的层数,n
t
为时间采样点个数,v
o
为网络输出向量,m
l
为真实电阻率值;d
o
和d
l
分别为反演结果和真实电阻率模型对应的航空瞬变电磁响应数据。
[0044]
本发明的有益效果是:针对航空瞬变电磁响应数据建立优化的lstm网络,利用lstm模块充分提取时间序列特征,利用双向lstm层、注意力机制和残差连接提升网络性能,考虑收发装置高度以及阻值随深度连续变化的电阻率模型,显著提升了航空瞬变电磁响应数据反演的效率和效果,克服了传统反演方法中对初始模型的依赖,降低主观因素影响,避免了jacobian和hessian矩阵的计算以及对模型空间的搜索,加快反演速度。数值模拟结果表明该反演方法结果准确,能够提高航空瞬变电磁响应数据的解释效率,进而为航空瞬变电磁实时电阻率成像提供数据支撑。
附图说明
[0045]
图1是本发明方法的lstm网络结构示意图。
[0046]
图2是本发明实施例中训练集样本规模分别为8000、40000、80000、120000和160000时,训练集与测试集的rmse随训练周期的变化情况。
[0047]
图3是本发明实施例中lstm网络和高斯牛顿法对测试集样本的反演结果及相应正演响应的rmspe联合分布图。
[0048]
图4是本发明实施例中lstm网络和高斯牛顿法对测试集中随机挑选的一个样本的反演结果(左图)及其对应的航空瞬变电磁响应(右图)。
具体实施方式
[0049]
下面将结合附图,对本发明提出的一种基于lstm网络的航空瞬变电磁响应数据反演方法作进一步说明。本发明的思想描述如下:根据自然界中电阻率规律和航空瞬变电磁观测系统参数生成样本数据集;根据合成数据集维度构建适当的lstm网络,选取恰当的训练周期和训练集规模,完成网络训练;将完成训练的lstm网络应用至新采集的数据集中,目
标在于实现准确、快速的航空瞬变电磁数据解释。此方法具有效率高,准确性好的优点。
[0050]
a.生成合成数据集;
[0051]
a1.根据自然界电阻率范围和反演采用的深度网格生成层状电阻率模型;
[0052]
采用一维层状电阻率模型;电阻率取值范围设为1
‑
10000ω
·
m;模型深度为600m,每2m为一层,一共300层;根据上述条件生成阻值随深度连续变化的电阻率模型;600m以下视为均匀半空间,阻值与相邻上层(598
‑
600m)保持一致;舍弃阻值超出预设范围的电阻率模型;取电阻率的对数值作为目标输出;
[0053]
a2.在25
‑
100m之间随机选取收发装置高度;
[0054]
a3.按照航空瞬变电磁观测系统参数和采样模式正演模拟航空瞬变电磁响应db
z
/dt分量;
[0055]
基于步骤a1中的层状电阻率模型和a2中的收发装置高度,根据常规航空瞬变电磁观测模式,取半径为6m的发射线圈,接收传感器与发射线圈中心距离设为4m,模拟发射电流关断后的航空瞬变电磁响应db
z
/dt分量;接收时段为10
‑5‑
10
‑1s,共100个时间采样点等对数间隔分布。
[0056]
b.建立lstm网络;
[0057]
lstm网络由解码器和编码器构成,层与层之间采用lstm模块进行信息传递,并引入残差连接,结构如图1所示。网络输入为100个时间采样点的航空瞬变电磁响应数据,传入至编码器中;编码器由4个lstm层构成,第一层采用双向lstm连接;采用注意力机制连接编码器与解码器;将收发装置高度与注意力机制输出的特征向量进行拼接,输入至解码器中;解码器由4个lstm层和1个全连接层构成,最终输出反演电阻率模型参数。
[0058]
c.选取适当的训练集样本规模和训练周期,完成网络训练;
[0059]
采用样本数目分别为8000、40000、80000、120000和160000的训练集训练网络;网络训练所采用的目标函数如下:
[0060][0061]
其中,n
s
为训练样本个数,n
ρ
=300为电阻率模型层数,v
o
为网络输出,m
l
为真实模型电阻率值;λ
w
取0.001;采用adam算法迭代调整网络中的参数w和b,学习率设为0.001。
[0062]
采用同一个含4000组样本的测试集对网络训练收敛情况进行评价;记录训练集和测试集的rmse随训练周期的变化情况,如图2所示。最终选用训练样本规模为80000,训练周期为600次的训练结果作为lstm反演网络,保证训练速度和收敛效果。
[0063]
d.测试网络反演效果
[0064]
与经典的反演算法——高斯牛顿法进行对比,验证网络的反演准确度。利用步骤c中完成训练的lstm网络和高斯牛顿法对测试集中的4000个样本进行反演,计算其反演结果对应的rmspe
model
和rmspe
signal
,如图3所示。高斯牛顿法采用阻值为100ω
·
m的均匀半空间介质作为初始模型,反演参数为300层电阻率对数值。与高斯牛顿法的rmspe分布相比,lstm网络的反演结果误差分布更集中,极端误差值较少,说明其对测试集反演效果稳定,结果准确。从测试集中随机选取一组反演结果,如图4所示。高斯牛顿法受到多解性影响,其对应的正演响应与真实响应十分接近,目标函数收敛,无法进一步逼近真实模型。lstm的反演结果及正演响应与真实值吻合。此外,lstm训练完成后,经过一次正向传播即可得到测试集4000
组样本的全部反演结果,耗时低于1s。
[0065]
以上所述仅为本发明的实施例而已,并不用以限制本发明,凡在本发明精神和原则之内,所作任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。