一种基于元迁移学习的小样本储层分类方法

文档序号:34235804发布日期:2023-05-24 20:17阅读:58来源:国知局
一种基于元迁移学习的小样本储层分类方法

本发明涉及数据挖掘、深度学习、石油勘探领域,具体涉及到一种基于元迁移学习的小样本储层分类方法。


背景技术:

1、储层分类主要目的为判别地层流体性质,对改善储集层评价及优化生产策略具有重要意义。传统方法通过拟合孔隙度、渗透率等测井数据来建立经验公式进行储层分类,主要包括数据反演与数值模拟方法。然而,这些方法在储层分类过程中往往对数学参数进行假设,极大简化了地层的真实情况,同时,传统方法通常需要较大的人力、时间成本,且识别效果往往受人为经验的限制。因此,基于数据驱动的储层智能识别方法备受关注。

2、油井的广泛部署产生了大量的地球观测数据,这为进一步了解地质构造提供了可能。传统的机器学习方法已经在石油领域得到了广泛的应用。测井数据由于其连续性和高分辨率,能够有效地反映地下地质信息,一些研究人员使用基于数据驱动的方法进行储层及岩性识如随机森林算法、xgboost算法、朴素贝叶斯方法等等。然而,这些传统的机器学习方法难以表征地质特征的复杂非线性关系。

3、由于深度学习方法可以有效提取样本地质特征,其已经广泛地用于储层分类等相关研究。相关研究人员结合多层感知机和超量采样来改善岩性及流体识别。然而,该方法往往会陷入局部最小值,同时其泛化能力很弱。也有学者提出了一个加模糊过程神经网络模型来对测井数据进行分类以识别水淹层。基于递归神经网络的方法由于能够捕捉测井数据的纵深时序特征而广泛用于测井曲线分类。有人提出使用双向长短期记忆网络来学习测井序列信息以进行储层分类,然而,上述机器学习方法均使用专家标注的数据进行模型监督学习,这仍然会导致误差积累,目标区块中经过油田实际开发验证的井较少,即有真实标签的井有限,这是石油人工智能中一个典型的小样本问题。

4、部分研究人员提出迁移学习来解决石油研究中样本不足的问题,将一个具有足够样本来支持模型训练的域定义为源域用于预训练模型,然后使用目标域数据对该预训练模型微调实现知识迁移。然而,断层将油田分为多个区块,区块之间存在显著的地质差异,把在源区块学到的所有知识迁移到目标区块并不总是有效的,其中与目标域不同的知识不可避免地会导致负向迁移。因此,急需设计出一种有效的方法来克服储层分类中的小样本问题。


技术实现思路

1、为解决现有技术中的缺点和不足,本发明目的为提出了一种基于元迁移学习的小样本储层分类方法;

2、本发明为实现上述的技术目的,采用如下的技术方案:

3、s1、根据油田实际情况,设计两种案例,分别借助邻近区块和较远区块样本来解决目标区块样本不足的问题;

4、s2、设计掩码注意力机制,以避免非储层的干扰,同时学习储层与非储层的关系,提高模型的特征提取能力;

5、s3、设计元迁移学习策略,在迁移学习中借助元学习实现参数快速寻优,提高模型的收敛速度;

6、s4、在元迁移学习中设计价值感知模块,使模型关注困难任务,以学习有价值的迁移知识,避免因区块间地质差异造成的负向迁移。

7、上述步骤s1中,根据油田实际情况,设计两种案例,分别借助邻近区块和较远区块样本来解决目标区块样本不足的问题,具体包括:

8、s11、由于目标区块储层样本不足,因此考虑通过学习其它某一区块中的分类知识进行迁移学习。邻近区块的地质特征差异较小,因此选择邻近区块样本进行模型预训练,然后迁移至目标区块,此为案例1;

9、s12、当邻近区块也没有足够的样本来训练模型时,需要选择离目标区块稍远的一个区块作为源区块,进行知识迁移,此为案例2。

10、上述步骤s2中,设计掩码注意力机制,以避免非储层的干扰,同时学习储层与非储层的关系,提高模型的特征提取能力,具体包括:

11、s21、进行特征映射,具体如下:

12、一个储层样本中存在n条测井曲线,即n个测井特征用于模型训练。一个储层样本x包含多个深度点,对应于一个储层类别y,如油层、水层等等。储层样本的长度设置为l,将储层样本x输入至模型中进行特征映射,可以表示为:

13、

14、其中为储层样本的维度,→表示特征映射,在每一轮模型训练有多个储层样本送入模型;

15、s22、避免非储层的干扰,具体如下:

16、与传统自注意力类似,掩码注意力为每个深度点构建查询q、键k、值v三个向量,x1的q向量是查询x1与其它深度点的关系。假设x1为非储层的深度点,将x1的q向量设置为零,从而以这种方式自动屏蔽非储层特征;

17、s23、学习储层与非储层之间的关系,具体如下:

18、接下来为深度点x2创建q、k、v三个向量,x2为储层深度点。x2的q向量需要查询其他深度点的k向量,当查询深度点x1时,x1向量的k设置为极小值,从而考虑到非储层深度点特征x1和储层深度点x2之间的关系;

19、s24、计算掩码注意力分数表征深度点之间关系,实现分类,具体如下:

20、通过计算掩码注意力分数后,将特征进行残差连接和层归一化,然后送入前馈模块。其中最后一层前馈网络将隐层特征进行映射,神经元个数即为储层类别个数,通过输出储层类别的预测概率p(x)实现储层分类。

21、上述步骤s3中,设计元迁移学习策略,在迁移学习中借助元学习实现参数快速寻优,提高模型的收敛速度,具体包括:

22、s31、预训练阶段;

23、在预训练阶段,使用源区块中的储层样本来训练模型。最后一个线性层为分类器,其余部分为特征提取器。将训练好的特征提取器用于价值感知元迁移训练,以提高储层分类方法的鲁棒性和收敛速度;

24、s32、元训练阶段;

25、在元训练中,模型从源区块储层中随机选取样本,形成分布为p(t)的元任务。一个元任务由支持集和查询集两部分组成,其中支持集用于更新基学习器,查询集用于更新元学习器。更新后的元学习器,则为一个训练好的储层分类模型。

26、s32、元测试阶段;

27、在元测试中,从目标区块储层样本采样的任务,同样被分为支持集和查询集。将元训练中的优化参数加载到元测试中进行初始化,使用支持集对基学习器进行微调。然后使用查询集对元学习器进行测试,并借助准确率和f1分数来评估测试结果,以实现储层分类。

28、上述步骤s4中,在元迁移学习中设计价值感知模块,使模型关注困难任务,以学习有价值的迁移知识,避免因区块间地质差异造成的负向迁移,具体包括:

29、元学习在训练中平等对待每个元任务,然而,在实际的储层分类中,学习元任务的难度是不同的。其中准确率或f1分数较低的元任务被定义为困难任务,他们应该收到模型更多地关注。由于准确率和f1分数的值介于0和1之间,因此使用log函数对损失函数进行缩放。

30、以准确率为例,-log(accuracy)在准确率高的时候是一个很小的值,这将降低相应任务的损失值。相反,-log(accuracy)在准确率较低时会放大损失。因此,将当前任务的准确率acci和f1分数f1i引入传统的交叉熵损失在价值感知模块中动态调整每个基学习器的损失。通过为困难任务分配更大的梯度信息使模型差异化地关注不同任务,以学习有价值的迁移知识并加速模型收敛,从而提高储层分类效果。价值感知损失vl表示为:

31、

32、其中μ、v为权重参数,λ为缩放因子,用于调节模型对困难任务的关注程度。

33、本发明的有益效果在于:一种基于元迁移学习的小样本储层分类方法,考虑目标区块储层数据不足,无法支持模型训练实现储层分类,因此借助元迁移学习方法,通过掩码注意力机制、价值感知模块实现基于价值感知的储层分类,在储集层评估方面有重大的应用价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1