基于RBM地震叠前信号聚类方法与流程

文档序号:13685083阅读:611来源:国知局
基于RBM地震叠前信号聚类方法与流程

本发明属于地震技术领域,涉及地震信号分类技术,具体涉及一种地震叠前信号聚类方法。



背景技术:

通过地震信号分类技术生成地震相图来确定地下储层对指导石油勘探有着重要作用,现有地震信号分类技术主要针对叠后信号,叠后信号是叠前信号的横向求和,导致很多地震信息丢失。地震叠前信号相对于叠后信号显著特点就是维度变高,直接使用现有方法会带来维度灾难,分类算法不适应等问题。同时数据量变大,不能使用计算复杂度较高的算法。在获得测井信息后,测井可以作为有标签数据帮助后续测井的选择。现有方法通常将此作为有监督学习进行处理,但由于测井信息即有标签数据较少,有监督分类结果可能不合实际。

自组织神经网络(self-organizingmap,som)聚类是一种非监督的地震相分析技术,能够自动确定地震相的数量。som主要针对地震信号波形形状,也可以选取其他处理过的数据作为聚类对象从而关注某种地质结构,在文献“steeghsp,drijkoningeng.seismicsequenceanalysisandattributeextractionusingquadratictime-frequencyrepresentations.geophysics,2001,66(6):1947-1959”提出使用联合时频分析来表征储层,因为频率特征对反射信息的细微变化敏感。在文献“dematosmc,osoriopl,johannpr.unsupervisedseismicfaciesanalysisusingwavelettransformandself-organizingmaps.geophysics,2006,72(1):p9-p21”提出连续小波变换(continuouswavelettransform,cwt)和离散小波变换(discretewavelettransform,dwt)无时间抽取可以应用于检测奇异性。som相对于k均值的主要优点是数据空间中变形的簇可以直接映射到规则网格化的潜在空间。当然som算法也存在缺陷,首先,每次迭代的邻域函数的理论基础不足,只能依靠经验选择,选择不同可能最终的聚类结果相差很大;第二,缺少定量误差测量方法,难以判断收敛是否达到最优;第三,算法发现最可能的聚类结果,但没有对相关分类置信度的定量标度,不能说明向量可以被所在簇代表。

高斯混合模型(gaussianmixturemodel,gmm)是概率分布的参数模型,其可以比传统的无监督聚类算法在建模中提供更大的灵活性和精度。这些gmm岩性用于校准三维地震叠加反演结果,以产生三维岩石性质模型。

在聚类算法中往往需要结合特征降维算法,因为高维的数据会使聚类算法不适应和难以解释。这里简单介绍地质领域的常用降维算法如下:

生成拓扑映射(generativetopographicmapping,gtm)是一种基于概率的非线性降维技术,位于较低维度上的每个节点对数据提供一些数学支持并且被认为在某种程度上“负责”数据向量。gtm理论基于概率统计学,可以通过投影多属性数据的特定窗口的平均后验概率,例如测井信息来扩展在地震勘探中的应用。

独立分量分析(independentcomponentanalysis,ica)与基于高斯统计的主成分分析不同,ica试图将数据投影到子空间上,从而产生非高斯分布,然后更易于分离和可视化。ica通常用于减少冗余属性集以形成较小的独立元属性集。

不管使用何种地震相分析方法,都需要对储层区域的时间和空间仔细划分。地震相分析对地震波采集误差敏感特别是在储层区域,对结果解释的置信程度取决于地质系统的复杂性、地震数据质量和解释者的经验,进而造成与实际情况产生误差。



技术实现要素:

为解决现有技术存在的上述问题,本发明提出了一种基于rbm地震叠前信号聚类方法。

本发明的具体技术方案为:一种基于rbm地震叠前信号聚类方法,具体包括如下步骤:

步骤s1.去除地震叠前数据的噪声,保留结构特征,并将目标层位段数据组织成xi=[x1;x2;...;xs],其中,x为单个方位角数据,维度为d,s为地震数据的方位角个数;

步骤s2.对n个位置点的数据u=[x1,x2,...,xn]加入不同的噪声生成m份数据集u1,u2,...,um;

步骤s3.按深度受限玻尔兹曼机网络对数据提取特征和维度规约;

步骤s4.将降维后的数据作为模糊自组织神经网络的输入,进行无监督训练,得到最终分类结果。

本发明的有益效果:本发明的地震叠前信号聚类方法针对地震叠前信号维度高的特点,引入基于深度受限玻尔兹曼机网络的降维方法,深度受限玻尔兹曼机具有较好的抽象特征提取能力,降维后的输出能够好的表达原始信号;针对地震信号往往噪声多且难以较好去除的特点,引入模糊自组织神经网络聚类算法,使得地震相分类由隶属度表达,模糊分类结果提供的信息更加丰富合理,使得聚类结果更稳定,而且还能对分类结果进一步探索。本发明的方法有着较低的计算复杂度,能够在大规模地震叠前数据推广。

附图说明

图1为本发明实施例的地震叠前信号聚类方法流程示意图。

图2为本发明实施例的深度rbm结构示意图。

图3为现有的方法生成的结果图。

图4为本发明实施例的方法生成的结果图。

图5为本发明实施例的方法生成的隶属度梯度示意图。

具体实施方式

下面结合附图对本发明的实施例做进一步的说明。

本发明实施例的地震叠前信号聚类方法流程如图1所示,具体包括如下步骤:

步骤s1.结构导向滤波算法去除噪声,保留结构特征,并将目标层位段数据组织成后续算法需要的格式。这里通常采用结构导向滤波算法去除噪声,这样能尽量减少噪声对后续处理的影响;

叠前信号每一个位置有多个方位角,即如果单个方位角数据维度d,对于共有s个方位角的地震数据而言,每个位置的特征数据维度为s·d。进行聚类算法之前,需要对地震叠前信号用结构导向滤波算法去除噪声,保留结构特征,并将目标层位段数据组织成后续算法需要的格式xi=[x1;x2;...;xs],其中,x为单个方位角数据,维度为d。

步骤s2.在叠前数据预处理完成后,对n个位置点的数据u=[x1,x2,...,xn]加入不同的噪声生成m份数据集u1,u2,...,um,以便聚类算法更加关注数据的主要特征。

步骤s3.按深度受限玻尔兹曼机网络(restrictedboltzmannmachines,rbm)对数据提取特征和维度规约,后续聚类算法对于抽象特征分类效果更好。

如图2所示,每层高斯rbm都单独训练,但是上一层的隐藏层直接作为下一层的可视层,逐层贪婪训练,这样就得到深度rbm网络。将神经元数逐层减少,最顶层的隐藏层即为降维后的数据编码,其输入为地震叠前数据训练样本,输出为训练完毕的深度rbm网络,降维后的地震叠前数据,深度rbm网络训练的具体流程如下:

s31:选取加入了噪声的数据集,将每个点的叠前数据xi由矩阵转换成向量输入rbm网络,新的样本数据代表这个点处的所有信息,也是后续降维、分类的训练样本数据;

s32:将所有训练样本均值归一化到[0,1]范围内,这里数据预处理完成,保存为样本数据;

s33:因为临近位置样本总是相近的,直接输入易使rbm陷入局部最小或欠拟合,所以需要将所有训练样本随机排列。然后将数据分成多批,一方面使用批梯度上升可以降低算法复杂度,另一方面可以满足程序并发处理需求;

s34:开始训练第一层rbm,预处理过的训练数据作为可视层输入,训练完毕后得到rbm的各项参数与隐藏层输出,保存各项参数;

s35:开始训练第二层rbm,将上一层隐藏层的激活概率作为本层rbm可视层输入,训练完毕后得到rbm的各项参数与隐藏层输出,保存各项参数;

s36:按照步骤s35逐层训练rbm,直至算法训练完毕后,得到适应本训练样本的深度rbm网络;

s37:取s32中保存的样本数据作为输入,计算隐藏层的激活概率:这里计算激活概率可以采用现有技术,不再详细展开说明。

s38:传递上一层的隐藏层的激活概率,继续计算,直至计算到顶层节点激活概率,输出顶层隐藏层激活概率即为训练样本降维结果。

步骤s4.将降维后的数据作为模糊自组织神经网络的输入,进行无监督训练,得到最终分类结果。

对于模糊自组织神经网络的输出,每个样本对所有簇都有一个隶属度值,既可以选取最大隶属度值的簇作为归属类别,也可以对每个隶属度值做进一步探索。

由于实际地质结构往往很复杂,难以用一个精确的分类结果描述,或者说精确的描述本身就是不合理的。为了平滑不同簇之间的界限,本发明引入模糊理论将其与som结合,即模糊自组织神经网络(fsom),这样能够对更好地解释地震相,更丰富的展示地震相信息。

对比标准自组织神经网络,模糊自组织神经网络只是将归属于某个神经元的簇改为对每个神经元的隶属度。所以算法的性能并不会降低,算法复杂度也没有改变。模糊自组织神经网络算法流程如下:

输入:数据集d=[z1,z2,...,zn],其中,zi是原始地震叠前数据xi经过rbm降维后的向量;簇的数目k。

输出:输入层与输出层节点之间的权值向量wj(t),j=1,2,...,p,其中,t是迭代次数,p是输出层节点个数;第i个样本对第j个簇的隶属度uij。

s41:初始化两层神经元之间的权值向量,随机选择输入数据的特征向量进行初始化;

s42:对任意样本初始化uij=1/k,表示初始每个样本对所有模糊簇的隶属度是相同的;

s43:依次将输入数据zi输入网络,计算dij=||zi-wj||,表示zi到wj的距离;

s44:求最大相似度对应的节点,即dij最小的节点,记为获胜神经元wc(t);

s45:利用侧向反馈规则,对获胜神经元以及其周围的神经元wj进行更新,具体的更新规则如下:

wj(t+1)=wj(t)+σ(t)hcj(t)[zi-wc(t)](2)

其中,σ(t)代表学习率,是一个调节参数用来保证神经网络最终的收敛,一般随着学习迭代次数的增多而下降,0<σ(t)<1,hcj(t)是侧向反馈距离,是获胜神经元与其他未获胜神经元之间的距离,这使得每一次迭代中,大部分神经元都能获得调整;

s46:更新所有样本对每个模糊簇的隶属度uij;

s47:i=i+1,继续输入数据,直到每个数据依次输入完毕,或者满足其他截止条件,例如当数据较少时,一般会考虑重复输入整个数据集合,直到达到一定的迭代次数。

fsom使得每个样本不再固定被分为同类或不同类,给后续的地震相成图提供了更丰富的信息。

实验工区选取某实际地震工区部分工区,工区大小为600×700,6个方位角数据,选取目标段数据100个采样点。即样本数据量为420000,样本数据维度600。作为对比首先使用pca将数据降维,然后som聚类成16类得到如图3所示的结果图;使用本发明的方法处理本工区,分成16类,结果图如图4所示。

可以明显看出,现有的方法生成的地震相图已可以大致反映出地下地质结构的分布,但精细度不够,没有清晰地描述复杂小裂缝,难以满足更高的勘探需求,不利于实际应用。

由于模糊聚类算法使得每个样本对每个簇都有一个隶属度值,对此提出一种的展示地震相图的方法。在每个类别上计算二维梯度,对于地震相图每个点赋予坐标(i,j),计算此位置对每个簇的隶属度记为uk(i,j),假设分为n类则k={1,2,...,n}。对于每个点计算其二维梯度如(3)式。

如图5所示,相对于普通地震相图隶属度梯度能够更好地展示地震相变化的边缘地带,对于大尺度裂缝的展示更加清晰。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1