一种基于生成对抗网络的地震数据重建方法与流程

文档序号:18950355发布日期:2019-10-23 02:07阅读:550来源:国知局
一种基于生成对抗网络的地震数据重建方法与流程

本发明属于油田地震大数据重建技术领域,尤其涉及一种基于生成对抗网络的地震数据重建方法。



背景技术:

数据重建是数据处理的重要部分。在信号领域,由于环境、设备以及人为等因素采集到的信号数据并不一定是完整的。如果使用不完整的数据进行数据解释和分析的话,则分析结果会存在较大的偏差,所以在数据解释分析之前需要对数据进行重建。另外对于地震勘探这种数据量较大的采集工作中,大量的数据会在采集、存储和运输等各个环节产生巨大的成本。因此一方面希望尽可能减少采集到的数据,另一方面希望重建出来的数据尽可能地精确。

常规的地震数据采样方法是基于nyquist采样定理,对地震信号的采样间距具有一定的要求,如果采样频率过低则会出现假频现象,影响数据的重建。而压缩感知理论表明:基于信号的稀疏性,在低于nyquist欠采样的情况下,对少数的采样点通过合适的重建方法仍能准确地重构信号。通常地震信号在某个变换域内是稀疏的,为利用压缩感知理论重建地震数据提供了可能。

传统的地震数据重建方法分三类:第一类方法是基于预测滤波的方法,即采用分频预测思路,由低频信息预测高频信息。这类方法通常将非规则采样数据当作规则数据处理,并通过高斯窗进行插值,较易引入误差。第二类方法是基于波动方程的方法,即通过dmo或amo正、反演算子迭代求解一个反问题,这类方法利用波传播的物理性质重建地震波场,但需要地下结构的先验信息,且计算量很大。第三类为基于某种变换的方法,即先对地震数据进行某种变换,然后在变换域重建。这类方法由于原理直观、计算结果稳健而得到广泛应用。

传统的方法面对低采样率和不均匀采样数据重建都是比较棘手的问题。而传统的规则均匀采样受到nyquist采样定理的限制。而新发展起来的压缩感知理论认为即使采样频率低于nyquist极限,也有可能恢复出满足一定精度要求的完整数据。压缩感知技术首先要求信号是稀疏的或者可压缩的,但大部分信号本身并不稀疏。不过,如果其在某个变换域内满足此条件,同样适用于压缩感知理论。自从该理论框架被提出以来,常用的变换方法主要有离散余弦变换、傅里叶变换、小波变换和曲波变换,以及逐渐采用的学习型超完备冗余字典等。

离散余弦变换(dct)是信号处理领域最常用的变换之一,但是dct变换是一种全局变换,并不能对图像的局部特征进行有效的识别。大部分压缩感知的应用领域都选用傅里叶变换作为稀疏变换基,但是傅里叶变换是在整个时间域内的积分,是一种全局的变换,不能很好地刻画某个局部时间的频谱特征,所以,在处理地震数据这种有明显突变现象的特征时,傅里叶变换并不是最理想的选择。gabor提出的短时傅里叶变换,可以更好地刻画信号的局部特征,提取信号在局部时间间隔内的频谱信息。它的基本思想是通过加窗的方式将信号划分成许多小的时间间隔,然后在每一个时间窗内做傅里叶分析,以达到识别该时间间隔内局部频率的目的。

这种方法虽然在一定程度上实现了局部化,但本质上是具有单一分辨率的分析方法。但对于像地震数据这样的复杂信号,在不同时刻的波形变化较大,短时傅里叶变换的时频局部化能力还是有限的。小波分析则继承和发展了短时傅里叶变换的局部化思想,其窗口大小固定,但形状可以随着频率的变化而变换,根据频率的不同来调整时间分辨率,弥补了短时傅里叶变换的窗口大小和形状不能随频率变化的缺点。不过,小波变换不具备方向识别能力,只能捕捉点奇异特性。后来,一种被称作curvelet(曲波)的变换被发展起来,其变换基由不同尺寸和方向的曲线状元素组成,具有多尺度和多方向识别能力,被认为是地震数据稀疏表达的最优方法之一。近期发展的shearlet变换具有更敏感的方向性,相比curvelet变换,能对地震信号进行更稀疏的表示,使基于压缩感知的地震数据重建效果更好,但仍然存在不能根据待处理数据自适应选择的问题。



技术实现要素:

针对上述问题,本发明提出了及一种基于生成对抗网络的地震数据重建方法,包括:

步骤1:使用被裁减成统一大小的地震切片数据作为训练集;

步骤2:采用深度卷积生成对抗网络对训练集进行训练,并采用wasserstein距离来作为地震数据生成模型的训练评判指标;

步骤3:采用地震数据生成模型对地震数据进行重建,采用反向传播算法和基于标准梯度的优化算法来优化目标函数的梯度,使得重建数据与缺失数据的差值最小化。

所述深度卷积生成对抗网络使用卷积层替代原生成对抗网络中的全连接层。

所述深度卷积生成对抗网络具体包括:

在判别器模型中使用带步长的卷积层代替池化层,生成器中使用反卷积层进行上采样;除了生成器的输出层和判别器的输入层,其他网络层都采用批量标准化层;除了全连接层,直接使用卷积层连接生成器的输入层和鉴别器的输出层;在生成器中,除了输出层使用tanh激活函数,其他层都使用relu激活函数;在判别器中全部使用leakyrelu激活函数。

所述目标函数的定义为:

其中,loss(z)为目标函数,g(z)为深度卷积生成对抗网络函数,z为g(z)的输入噪声,a为测量矩阵,y为检测到的缺失数据,为正则项,λ为正则项的系数。

本发明的有益效果:

1、解决了传统地震数据重建算法需要满足nyquist采样定理限制的问题;

2、解决了使用压缩感知算法重建地震数据稀疏基难以选择的问题;

3、解决了压缩感知算法以及传统重建算法在极低采样率情况下重建效果不好的问题。

附图说明

图1为原始的gan框架图。

图2为dcgan生成器模型结构图。

图3为实施例训练后的生成结果图。

图4为实施例的地震切片数据图。

图5为使用sp算法为迭代算法的传统压缩感知方法对数据重建结果图。

图6为使用本发明的算法对数据重建结果图。

图7为使用本发明的算法对数据重建后的snr示意图。

图8为使用本发明的算法对数据重建后的psnr示意图。

具体实施方式

本发明提出了及一种基于生成对抗网络的地震数据重建方法,包括:使用被裁减成统一大小的地震切片数据作为训练集;采用深度卷积生成对抗网络对训练集进行训练,并采用wasserstein距离来作为地震数据生成模型的训练评判指标;采用地震数据生成模型对地震数据进行重建,采用反向传播算法和基于标准梯度的优化算法来优化目标函数的梯度,使得重建数据与缺失数据的差值最小化。

原始的gan(生成对抗网络)框架如附图1所示。原始gan的判别网络d可以看成是将输入样本映射到判别概率的函数d:d(x)→(0,1)。对于一个固定的生成器g,可以训练判别器d用于分辨输入样本是来自训练数据(真,概率接近1)还是来自生成器g(假,概率接近0)。若判别器d已经训练到当前最佳的状态,则它将无法被欺骗,而这时生成器g需要继续训练以降低判别器d的准确率。如果生成器g分布足以完美匹配真实数据分布,那么判别器将无法分辨出输入样本的真假而对所有输入给出0.5的概率值。

原始gan的训练的代价可以用一个价值函数v(g,d)来评估,其中包含了生成器和鉴别器的参数。其用公式表示如下:

其中x为输入的样本数据,pdata(x)为x来自真实数据分布的概率,pg(x)为x来自生成器输出样本的概率。

卷积神经网络更适用于图片数据。dcgan(深度卷积生成对抗网络)使用卷积层替代了原始gan中的全连接层,具体包括:

1.在判别器模型中使用带步长的卷积层代替池化pooling层,生成器中使用反卷积层进行上采样。

2.除了生成器的输出层和判别器的输入层,其他网络层都是用了批量标准化batchnormalization。使用bn层有助于加快收敛,稳定学习,防止过拟合。

3.去除了全连接层,直接使用卷积层连接生成器的输入层和鉴别器的输出层。

4.在生成器中,除了输出层使用tanh激活函数,其他层都使用relu激活函数;在判别器中全部使用leakyrelu激活函数。

本发明设计的dcgan生成器模型结构如附图2所示。

此外本发明还对模型的目标函数做了修改,使用wassersteindistance,wassersteindistance的数学表达式为:

其中pdata和pg分别为训练样本和生成样本的分布。d(x)表示鉴别器对鉴别器的输入样本的x输出。ppenalty代表输入x的分布。将pdata和pg数据中采样得到的点进行连接,再将线上随机采样得到的点作为ppenalty的点。这样,pg会被拉向pdata,增加的惩罚项可以保证d是平缓变化的。理想的d在pdata附近应该尽可能的大,在pg附近要尽可能的小。越趋近于1越好。与原始gan中的jsdivergence相比,wassersteindistance是一个更好的距离度量,它最终可以转化为优化问题。

生成对抗网络可以从低维表示空间z∈rk映射到高维样本空间g(z)∈rn。在训练过程中可以激励这种映射产生类似于训练数据的输出样本。因此,预先训练的生成器学习到的是真实数据的分布,生成器的输入是这种输出样本的低维映射。

设x*∈rn是希望重构出来的向量。令a∈rm×n为测量矩阵,η∈rm为噪声向量。观测到的向量y=ax*+η。给定y和a,我们的任务是找出接近于x*的重构向量x。

对抗生成网络模型由确定的函数g表示。该方法是在生成空间中找到一个向量,使其与观察到的测量值相匹配。目标函数可以定义为:

通过使用一系列优化算法,可以使z的损失loss(z)最小化。由于生成对抗网络模型g是可微的,因此可以使用反向传播算法和基于标准梯度的优化算法来计算关于loss(z)的梯度,并得到一个最优化的对x*的重构结果是可以定义测量误差为重建误差为

在实验过程中,发现将一个正则化项l(z)添加到目标函数中会使重建结果更好。因此最小化目标函数是:

其中实验中都取λ=0.1。

使用的训练集为被裁剪为512*512大小的地震切片数据,每个图片提供512*512=262144个输入维度。对每个像素值进行缩放,以使所有值都在[-1:1]区间之内。我们使用这个训练集训练了一个dcgan框架,并使用wassersteindistance做为判别器的loss。设置生成器的输入为维度k=100的符合标准正态输入的向量,生成的结果也是一个大小为512*512的地震切片数据。该模型每个更新周期对鉴别器进行一次更新,对生成器进行两次更新。每个更行都使用adam优化器,其中训练的batch参数设定为16,学习率设置为0.0002。训练后的生成结果如附图3所示。

本实验将如附图4所示的地震切片数据作为原始数据,在其基础上进行采样,并使用不同的重建算法进行重建。

对地震切片数据进行5%采样,使用sp算法为迭代算法的传统压缩感知方法对数据重建,如附图5所示,再使用本发明设计的算法进行重建,如附图6所示。

为了验证本发明设计的重建算法的可行性以及有效性,对真实的地震数据进行数值实验。衡量数据重建效果的指标分别为信噪比(snr)和峰值信噪比(psnr),即:

式中:y为原始数据;为重建后的数据;mse为原始数据与重建数据的均方误差。由公式(1,2)可知,snr和psnr越大代表误差越小,重建的效果越好。

为了研究本发明算法随采样率变化的整体趋势,对原始数据进行10%-80%的随机采样,分别使用sp、samp算法和基于dcgan的压缩感知算法进行重建。基于dcgan的压缩感知算法分别使用添加正则项和不添加正则项两种方法对数据进行重建。进行十次重建后计算平均snr和psnr并分别作图,结果如附图7和附图8所示。

从实验结果可得,在低采样率的情况下(采样率低于30%)基于dcgan的压缩感知算法效果明显好于其他算法,并且采样率越低基于dcgan的压缩感知算法优越性越明显。当采样率高于40%时基于dcgan的压缩感知算法效果达到了一定的瓶颈,不会随采样率的提升而有明显的提升。

此实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1